【原】一文读懂中医AI（精校重发）

医馆视界360 2023-05-12 发布于江西

展开全文

2022年底，openAI发布基于新一代大语言模型的通用人工智能对话系统ChatGPT，瞬时引爆全球AI新浪潮，发布几个月来，热度持续升温，不断火出圈，似乎无处不在，无所不能。使用过的用户无不感叹它的 ”全知全能“：“只有你想不到，没有 ChatGPT 办不到！”，它可以在美国大学入学“SAT”考试中拿到1410分高分，超过绝大多数人类，冲刺哈佛不是梦；它可以通过谷歌 Level 3 的工程师面试拿到18 万美元年薪;它甚至可以变身苏格拉底，在你提问时不直接告诉你答案，而是一步步引导你自己得到答案。ChatGPT所代表的新一代生成式人工智能技术也被称为继蒸汽机、电气革命、信息革命之后的第四次工业革命标志性技术，代表着人类科技文明又进入了一个全新时代。

短短几个月，ChatGPT已经改变了很多人的生活，它可以写作，绘画，作曲，推理，编程，算数无所不能，学生用它做作业，老师用它批改作业；程序员用它写程序，一个人顶一个团队；文员用它生成文案，几秒钟可以干完过去几小时甚或几天的活；有人用他写的论文顺利博士毕业；有人用它一个月写了20部小说全部发表；一些游戏公司开始用它绘图并裁员60%以上美工...而这一切突如其来的变化，让人们在惊喜之余又有些不知所措。政府、科学家和精英们在思考继续发展人工智能是否导致人类对文明失去控制；大企业们会担心在变革中被淘汰而争相上车研发自己的大模型；普通人在担忧自己的工作会不会被AI取代而失业。还有因此衍生一系列的伦理问题，法律道德问题等等，都让人们对这个新事物是又爱又怕。

纵观人类史上几次类似的重大的生产力革命，科技会超越和取代一部分人类的能力，确实会导致一部分人引以为傲生存技能突然没了用武之地，但是同样为人类文明打开新的篇章，从而养活更多的人类，创造更多的职业，让人类生活的更加精彩。唯一不同的是，过往的科技革命都是替代的人类的体力或者机械的重复脑力劳动和记忆力等，而本次的升级则开始触及人类深层次的思维和智力，冲击必然会有的，造成一部分的人失业也是必然会发生的。但是潘多拉的盒子已经打开，担心已然是多余的，我们更多要思考的是如何去拥抱新事物，如何去投身这场变革。

人工智能有可能取代中医师吗？

首先取代肯定是不可能的，因为中医不仅仅是门医学,更是一种文化,一种基于宇宙和人体整体观念的生命智慧哲学。如果有一天人工智能已经达到可以全面取代中医师的程度，那么只有一种可能，那就是人类已经被人工智能取代了，中医也就没意义了。从这个角度而言，中医的根本是以人为本的，绝不是一个冰凉机器能取代的。不过从另一个角度看，一个人工智能通过学习中医知识能不能成为一个优秀的中医师呢？也就是成为一个黄帝内经描述的“问而知之谓之工”，抛开由医入道成神成圣的范畴，专心做一个不知疲倦疗效稳定的医工呢？这种可能是存在的，但是目前还有三个难题:

1）中医流派众多，法无定法

相对来说，人工智能成为一个优秀的西医师比成为一个中医师要容易的多，因为西医是完全标准化的，所有规则都是固定的。就算是上一代人工智能技术，都可以很好的驾驭西医的知识和规则，比如十几年前的IBM医疗AI沃森就已经超过大多数医生的诊断能力。但是对于中医而言，传承几千年下来，有真传的，假传的，失传的；也有守旧的，创新的，编造的。纵然有如四大经典这样的指路明灯，但是也不妨碍历代医家从各个角度的个人解读与发挥，数万本中医古籍，足以迷乱后人，逐渐形成各种风格各种流派的，有殊途同归，也有渐行渐远，甚至于针锋相对，格格不入。但是却有一个共同点，能流传下来的，一定是有疗效能治病的。是的，同一个人同一个病，可以有很多种种方案，还能都有效，而且每个医师都认为自己方案才是最正确，别人的都是歧途，这就是中医的现状。每一次中医治病就是患者个体和医师个体两个量场之间的一次独一无二的交互，对于以人为本的中医来说，貌似本就该如此。但是对于机器学习，那就是一路坑，你让AI单学一个伤寒杂病论，会是个不错的医工；但是如果让AI机械学习古今数十万医书后，你觉得它还能会看病吗？

2）AI具有很大的不确定性

现阶段的AI，包括最先进的GPT-4，回答问题都具有很大的不确定性。这种不确定性来自多个方面，一是来自训练的海量数据中的错误数据，AI自身是很难甄别的；二是AIGC的模式下，可能同一个问题，AI每次的回答都会有所不同，输出很不稳定。技术强如谷歌，年初在其大模型聊天机器人首秀也翻车，回答错误问题导致当天市值蒸发7172亿。而其后各大厂商发布各自大模型，不约而同的都是放录像，而不敢现场演示，被网友戏称发布了个ChatPPT。

不过ChatGPT更智能一些，似乎觉得这个答案不太合理，于是发挥了其一本正经的胡说八道的特长，硬是生编了一套符合逻辑的虚假信息来圆。这也是生成类AI的另一个不靠谱之处，遇到不太确定的问题，它也会言之灼灼的胡编乱造信息给你，当你发出质疑后，它会迅速认错然后另编一个，让你哭笑不得。所以这样的这样的AI医生来开药给你，你敢吃吗？

3）诊断数据采集难以标准化

中医诊断要求是望闻问切四诊合参，对于AI而言就是现在流行的多模态。但是这个信息采集是无标准的，目前最普遍的做法就是问诊信息，也就是通过症状匹配治疗方案，因为症状是可以做到相对标准。如果加入医师的舌诊和脉诊输入，那就千差万别了，对医师要求也很高。输入千差万别，指望AI能稳定输出，那就是天方夜谭了。所以即便有些AI接收舌像和脉象，也只能做辅助参考，不敢用于决定性诊断。当然也有一些自动分析舌照，或是自动采集脉象的，这个数据就能标准很多，虽然同样受光线，角度，以及设备敏感度制约，但是比靠医师输入来采集信息，还是要靠谱的多。所以这个难题，说难也不难，技术上其实很容易实现。但是让中医师接受标准化诊断数据，代替自身的四诊合参，这个不是一般的难，甚至是无解的难。

三大难题如何解决？

接下来我们聊聊，这三大难题有没有可能被突破？要搞清这个，我们就需要深入了解下AI的技术原理，如果你从网上搜ChatGPT的实现原理，能找到的大概都是一堆数学公式。但是我们是搞中医，不是搞算法的。所以这里我尽量抛开数学，尝试在逻辑和哲学层面与大家探讨一下AI的发展和原理。

人类对于人工智能的向往源远流长，无论是西周的偃师造人还是古希腊神话的黄金机器人，都是基于人类模拟自身的朴素梦想。而早在计算机诞生之前，阿西莫夫就提出了机器人三定律，把神话变成了科幻。1946年第一台计算机诞生后，人工智能终于有了实质性的研究和实践。从十九世纪五十年代起，掀起了第一波人工智能热潮，奠定了人工智能的研究路线和算法。70多年过去了，不但路线没有偏离，算法其实进步也不大，唯一突飞猛进的大概就是算力了。

当时的研究路线有三派：逻辑学派（符号主义），仿生学派（连接主义）和进化学派（行为主义）。这三个方向其实也代表着人类认识世界的三种思想。

1、符号主义

逻辑学派基本代表了现在科学的普遍世界观，这个世界是规则是世界，主宰世界运行的是一系列的真理和定律，一切行为现象背后都有其规律可循，把人类认知和思维的基本单元称为符号，认知过程就是在符号表示上的一种运算，所以叫符号主义。符号主义人工智能正是秉承这一世界观，为人工智能设计一条条基础逻辑和规则，让人工智能在其框架内运行。因为符合科学界的主流世界观，且有清晰的逻辑规则及可控性，可解释性，从人工智能诞生以来，符号主义就一直是绝对的正统学派，长期在人工智能研究中处于主导地位。目前市面上的商业人工智能系统，绝大多数的是这一类。

2、连接主义

仿生学派则认为无论世间多么复杂的的事物，都是由最简单的单元相互连接和传递的结果，世界是如此，人脑也是如此，所以叫连接主义。连接主义立足于人脑仿生学研究，创立了神经元及神经网络的数学模型，以此模拟人脑的学习和思维过程，开辟了人工智能的另一条道路。但是受限于算力，连接主义长期停留在理论阶段，少有实质性突破，但是算法和模型也在不断进步中，随着算力的提升，连接主义的人工智能2010年开始逐渐从各方面碾压上符号主义的人工智能，并在2016年AlphaGo（阿法狗）对决围棋世界冠军李世石一战成名天下知，取代符号主义，奠定其当下人工智能研究的主流地位。如今的ChatGPT的成功则是证明了这条路已经走通，因此也聚焦了全世界的目光和资源。

3、行为主义

进化学派认为世界源于感知，而智能源于感知的信息反馈，简单来说就是世界之所以表现这样，是基于人类的眼耳鼻舌身的感知，而人类的智慧来源，就是对这些感知信息的提取，处理，存储。所以行为主义基于控制论，通过研究生物进化机制，模拟人在控制过程中的智能行为和作用，形成了“感知—行动”的智能模拟控制系统。行为主义的研究和发展远不如符号主义和连接主义广泛和深入，目前主要应用在机器人领域，不是我们今天探讨的关键。

中医AI

接下来我们从中医AI的角度来深入探讨一下，现在我们知道早期都是符号主义人工智能，靠的是工程师固化知识点、规则和逻辑，人工智能按部就班执行，是否智能取决于设计者预判了多少场景固化了多少逻辑，优点是逻辑清晰，输出可控，可解释，可信度高;缺点是现实世界知识无限，场景无限，不可能完全固化，也不能自我学习，导致长期以来人工智能都被成为人工智障。当然后期也发展出了随机森林，知识图谱等技术，让人工智能不再那么死板，不再完全依赖于工程师的逻辑固化，具备了一定的学习和推理能力。

目前市面上的中医AI大都是以知识库与决策树为基础的早期智能。因为符号主义的智能是没有理解能力的，医书肯定是看不懂的，所以推理逻辑来源只能来自两个方面，一、医师经验总结的格式化逻辑；二、海量病历的机器学习。前者的问题在于没有人可以把自己的经验做无损的完全格式化总结；后者的问题在于病历收集难度以及可信度，尤其是可信度，正是我们上面提到的第一个难题，来自不同医师，不同流派的，记录不规范并且疗效不明的海量病历，恐怕只能让机器越学越糊涂。在此两者之外还有一个患者基本信息采集难以规范标准化的大问题，就算人工智能的推理能力足够好了，使用者输入的信息不标准不能如实反映患者真实情况，结果也会是一塌糊涂。所以经常有朋友问我现在有没有靠谱的中医AI？我也只能呵呵了。几千年来，能把自身经验最少损失，最大化疗效的格式化逻辑总结，唯仲景一人。所以，就目前而言，一个以伤寒论为准则，以最简单方证对应为逻辑，只开经方的最简陋中医AI，反倒可能是疗效最好的。当然问题也是很多，比如上一波席卷全国的新冠，典型的发热，恶寒，身痛症状，在经方有多少种可能？不说AI，全国经方医家也给出各不相同的答案，有推荐麻黄类的葛根汤，麻黄加术汤，麻杏甘石，大小青龙等，也有柴胡桂枝汤，桂枝二越婢一汤，桂枝加附子汤等等，或是理中四逆辈，真武汤，白通汤等。如果采集信息不标准，输入症状不完全，AI恐怕也只能听天由命。还有一种就是精心调教的大师专家系统，假如你信服和学习某位大师，用基于该大师经验的专家系统辅助诊疗，还是帮助很大的。现阶段中医AI虽然面临问题很多，但是最大的优势是不存在我们上面提出的第二个难题，一经固化的逻辑，具备可以解释，可追溯能力，发现不可靠回答就可以及时改正，不存在随机性和不确定性。

如今的人工智能领域连接主义大行其道，风头无二，在超强算力和大模型（LLM）的加持下，已经初步具备了学习，思考，理解，创造和多模态（文字，图片，声音，视频等通通掌握）能力。如果让大模型来学习中医，能做到什么程度？这条路还没有人探索过（也许现在已经有人在做，但是我不了解，如果有朋友同道已经在做，希望可以联系我，我们多多学习交流，互通有无）。我们这里只能从原理上分析一下，那么这新一代人工智能是如何推理的呢？微软报告里是这样描述的“我们过去几年，人工智能研究中最显著的突破是大型语言模型（LLMs）在自然语言处理方面取得的进展。这些神经网络模型基于Transformer架构，并在大规模的网络文本数据体上进行训练，其核心是使用一个自我监督的目标来预测部分句子中的下一个单词。”这话有点难懂，我们这里也不是探讨算法和数学原理。简单而言，这个新一代智能还是秉承着连接主义的基础世界观，复杂事物都是由最简单的单元相互连接和传递的结果，它认识世界只有一个维度——概率。以文字处理为例，它通过海量的现实世界文字分析，得出在各种场景，各种语境下，每一个词可能出现的概率。在智能问答或者生成文案时，根据你的提问或者文案要求，然后根据每个词的概率组合成一句话或一篇文章。应用在中医领域，它可能是通过学习所有的中医知识，建立各种维度的概率，如方，药，穴位，疗法等等，在接受一个患者信息后，通过概率给出各种治疗方案。这个东西已经很难理解，而且也远不是我描述这么简单，大模型会在某个时刻突然变聪明，其变化如同神话里的注灵般,让傀儡瞬间具备灵性。就连其创作者也说“我们没有解决为什么以及如何实现如此卓越的智能的基本问题。它是如何推理、计划和创造的？”这就是大模型的不可解释性。这种通过海量训练后，突然暴增的智能性，行业里称为涌现（emergence ）。是否具备涌现能力，以及具备多少涌现能力，已经是人工智能的分水岭。同行的朋友见面第一句话，往往是“你的模型涌现了吗？“，但是目前还没有人知道人工智能的涌现是如何发生的，只知道在足够大的模型，足够多的数据训练下才有可能发生。既然无法从逻辑上理解，我们就尝试从哲学上理解一下。

人工智能的世界观

上面我们提到人工智能的三种路线代表了三种世界观，世界的本源是什么样子，这个问题本就无解，人类的目前的探索可能甚至未能揭开亿万分之一。在量子理论问世之前，科学界是决定论一统天下，牛顿用经典物理学塑造了决定论的巍峨宫殿，几乎无懈可击——“这个世界就是我们可以理解的样子，宇宙里没有任何巧合，一切都是严格遵循规则，而人类已经完全掌握了这些规则”。后来爱因斯坦举起相对论的锄头挖倒了这座宫殿，但是他仍然是决定论的拥趸，坚信“上帝从不掷骰子”。但是由于决定论的宫殿已经被他亲手挖倒，最终他还是在与玻尔等人论战30年后败下阵来。后世随着量子理论的完善以及量子纠缠的发现，现在的科学界已经普遍认同，这个世界就是一个充满了不确定性和随机的世界，无论你是否理解或承认。在最前沿猜想中，概率和关系就是整个世界的基石，宏观世界的物质存在，也不过的是微观世界概率与关系的表象，概率波+薛定谔方程，就是宇宙的最终表达。是的，物质不存在，空间不存在，一切像极了电脑虚拟世界中的一切事物，无论多么庞杂繁琐，最终都归结于数字0和1的表达。当然，这也只是科学猜想。说到这里，你是否发现了什么？大模型的训练过程，就是把一切数据，知识这些可表现形式拆解为概率和关系；而大模型的推理过程，就是用概率和关系生成文字，图片或其他可表现形式，像不像量子物理学的宏观与微观？从这个角度来看，大模型类的人工智能，似乎发现了人类尚未发现的领域，正在从另一个维度去认识和理解这个世界。概率作用在于大样本，知道有50%概率，对于扔一次硬币得到是头还是字毫无意义，但是你扔一万次甚至一亿次，这个概率就成了定律，结果就是可预测的。所以大模型的根基就是要大，只有足够多的数据，足够多的参数，训练出来的大模型才有可能把概率变成定律。才有可能解决我们上面的前两大难题，让人工智能在学习中可以自我甄别，在输出时可以稳定不翻车，通过海量医书的学习和实践中的反馈，从另一个维度理解中医，发现隐藏在概率中的一切理法方药，成为最强中医师，这种可能是存在的。不过这要依赖于将来的算力和算法的进一步升级。所以目前看来，人工智能不仅无法取代中医，就连做一个输出稳定疗效不错的医工也是很难的。

现阶段中医AI该怎么做？

说了半天，结论似乎是在目前的技术下，中医AI是无法解决上面三个难题的，搞中医AI是不是就没意义了？当然不是！上面提到的很多思想和算法是在计算机发明之前就已经被提出的，技术不成熟，不代表不能去探索。不迈出步子，永远也到不了终点。基于目前的技术条件，这个三个难题也是可以规避和解决的。

第一个问题其实很好解决，缩小范围，不做通用中医AI，做单一流派中医AI，在深度学习之前，人工筛选所有的知识，书本和医案，只选某一派甚至某一个人或者一批理念相近一脉相传的医师著作。比如我们可以找出历代所有经方医家的伤寒论著作和医案，再配合黄帝内经，辅行决等基础医理，让大模型去学习和总结。相信一定能训练出一个出色的经方医家，甚至它还能帮我们找出伤寒论所有的错简漏条。

第二个问题在模型和数据量不够大的现在，只能规避，也就是不使用AIGC技术来生成治疗方案，但是并不代表我们就回到上一代人工智能，只能在老路上奔波。我们完全可以用大模型来学习上一步筛选出来的知识和数据，用以生成完善的知识图谱。这种学习的效率和规模绝对是过去不可想象的。然后我们通过人工和实践中逐步微调这个知识图谱，让其准确性越来越高。

第三个问题其实不是技术问题，是个理念的问题。初期我们可以抛开，但是在实践中配备标准化的舌像采集和脉象采集或者经络采集设备，积累一定数量的病历数据后，再次用标准化数据重新训练模型，这样新的智能就不会受到信息采集者的主观干扰，实现稳定的输入输出。

另外，通用AI不容易实现，但是做专家专病的AI就相对容易的多。总之，随着ChatGPT的问世，一扇新的大门已经打开，新的生产力已经上线，对于各行各业而言，终究要投身其中拥抱变化，这是早晚的事情。中医诊疗AI不一定成熟，但是在客户服务，患者关怀，医患沟通这些方面，现有AI技术已经很成熟，大家还是要多多关注。