中医大模型来了！临床诊疗和养生调理一步到位，发布现场训练过程大公开，超1100万条知识图谱数据

2023-08-01 14:23:57

来源：量子位公众号

声明:本文来自于微信公众号量子位（ID:QbitAI），作者:白交，授权站长之家转载发布。

作为国内智慧中医的代表企业，以往它的个中进展或许并不被广泛熟知。

但它核心产品中医临床智能辅助诊疗系统，实现了从基层村级卫生室到三甲中医院的应用覆盖，积累了400多家等级医院、8000多家基层医疗机构的用户。

(资料图片)

这也就意味着，一旦大模型规模化落地，就可快速实现到基层的应用。

结果在发布会现场，它直接甩出三个子模型，还进行了现场演示。

基于已确诊疾病的临床诊疗大模型;

仅仅基于症状、体征的临床诊疗大模型;

中医养生调理大模型。

以中医养生调理大模型为例，只需输入症状、体征信息。比如输入怕冷及相关症状。

大模型就能输出一系列多维度的养生方案来。包括中药、经络穴位、食疗、茶饮等一步到位。

△输入怕冷及相关症状，给出系列养生方案

年轻人养生的第一个大模型，来了?!!

本以为这样就结束了，但没想到的是演示之后，大经中医竟然还直接公开了正在进行的训练过程?!

这个玩家究竟什么来头?中医GPT首秀实力究竟如何?

中医GPT实力如何?

那就来看看，这个岐黄问道·大模型的首秀能力如何?

主要分布两大场景:中医辅助诊疗、中医健康养生服务。

首先是知病场景——基于已确诊疾病的临床诊疗大模型的现场演示，即输入患者“疾病-症状-体征”信息，让大模型输出辨证结果、治则治法和中药方剂。

一上来，它就会自称「小经医生」，询问需要咨询的疾病。现场输入慢性胃炎后，它会进一步要求你提供相关的病情。

患者3年前出现胃痛，隐隐地痛，有时候会有胃热的感觉。前年9月份去当地人民医院做了胃镜检查，当时诊断为浅表性胃炎。患者平时吃的比较少，胃口一般，口干，大便干，睡眠一般，舌红，脉细数。

最终可以看到，它成功地推断出了证型「脾胃阴虚型」，并给出了治法、处方以及用药和用法。

目前该模型已经通过“大经数智中医”微信公众号，向医疗机构开放内测申请。

而即便是那种没有明确诊断的疾病，只输入症状和体征信息。大模型也能输出完整的结果来，即第二个子模型知症。比如输入“盗汗”以及相关病情。

而在健康养生场景下，只需输入最近困扰你的亚健康问题，就能快速获取一整套涵盖艾灸、按摩、膏方、茶饮、膳食、汤羹等内容的养生建议。

这样的能力，离不开行业数据的支撑和训练。据大经中医技术总监王祺表示，在大模型的训练中，主要用了这些数据集——

1100万条中医知识图谱数据;1500本中医古籍和文献数据;10万份真实中医专家医案数据;10万条脉象、舌象、经络、穴位数据;200万条真实的中医临床诊疗数据。

而为了这些高质量数据，大经中医过去投入了数千万研发费用。

具体训练方式也在这场发布会上，得到了公开呈现。

主要采用四层递进的训练方式:预训练→监督微调→奖励模型→强化学习。目前，前两个阶段已经完成，后两个阶段正在持续迭代中。

目前该训练系统正在由中医和AI两方面的专家协作完成。中医专家评估的ID，已经达到了1704605，足以见其数据规模。

敢一下子放出三个子模型，并在现场直接公开训练过程，大经中医底气从何而来?

岐黄问道大模型如何炼成?

大模型最直观的范式变革，就是新型人机交互关系的诞生。

不管是通用场景下的搜索引擎，还是垂直场景下的交互模式——

从UI、OS、EMR（电子病历）等转变为自然语言。已预见到的是，「流量入口」、「知识获取路径」等都在这场变革中得到重新定义。

既然落地价值显性，那具体到大模型在垂直场景应用，大经中医CEO李文友认为取决于这三个要素:

数据:高质量行业数据的获取;

专家:业内高水平专家对预训练模型的调整、反馈;

场景:具体场景的业务深耕，对具体场景的业务理解，以此实现大模型与行业的有效结合。

归结起来，就是行业Know-how，多年领域深耕积攒下来的行业壁垒。

△大经中医创始人、CEO 李文友

于大经中医而言，这种“壁垒”可以具体展现在三个方面:

数据。

相较于其他医疗分支，中医知识更为庞杂和个性化，而且历来有“道不传非人，法不传六耳”的传统，这就导致高质量数据非常私密，公开数据质量又比较低，因而更需要垂直领域深耕。

据介绍，基于大量真实名老中医的诊疗经验和中医文献中的诊疗知识，大经中医构建了中医诊疗知识图谱，涵盖内外妇儿等全学科、经方时方、孟河岭南等全流派。据称是目前业内最高质量的行业数据。

与此同时，还建立了包含25000+个词条的中医症状、体征术语规范化词典。据介绍，这也是行业中唯一大规模、覆盖全病种的术语规范化词典。这样一来，能够减少因为措辞差异导致答案不一致的影响。

目前，大经中医已经积累了400多家等级医院、8000多家基层医疗机构用户，形成了大量专业的中医诊疗数据。

人才。

据了解，大经中医拥有全行业规模最大的中医-AI跨界研发团队，也拥有行业最大的名老中医团队，他们通过协议方式合作展开中医AI研究，可在此次大模型研发中，协助开展RLHF工作提高性能。

此外，大经中医还与上海交大计算机科学与工程系等机构专家合作，集成多方技术优势，共同开展中医大模型的研究。

应用。

场景应用越丰富，客户数据越庞杂，越有助于训练出更理解行业场景和业务的垂直大模型，并且在后续迭代中也能快速形成飞轮效应，更新速度越来越快。

大经中医现有的AI应用场景实现了B端和C端的覆盖——

包括广东省中医院、上海中医药大学附属龙华医院在内的等级医疗机构;南京市江宁区、淄博市高青县等区域中医医联体，亦或是在上海长宁区“为老服务中心”这种大健康机构应用，以及下沉到山东、吉林等地村卫生室这种基层医疗机构的应用。

而在C端，则以学习强国里的中医智能健康助手为例，只需要选择一些不舒服的表现，就能推荐中医调理方案。目前用户已接近300万人。

基于这三点核心优势，“岐黄问道·大模型”的技术路径也就明晰起来。发布会现场，李文友透露大模型是这样炼成的。

首先，从名老中医临床诊疗数据+中医文献数据到中医诊疗知识图谱。

用知识图谱将这些数据结构化、规范化，从而表达和存储名老中医诊疗经验和文献诊疗知识。

随后，从中医诊疗知识图谱到中医领域预训练模型。

利用千万级的中医知识图谱数据和临床诊疗数据，微调通用预训练模型。

最后，从中医领域预训练模型到岐黄问道大模型。

由中医专家共同参与，利用奖励模型-强化学习机制，最终形成岐黄问道大模型。

为什么需要大模型?

大模型发展到现在，不管从个中进展还是业内聚焦探讨，已经从对技术本身的展望，逐渐具象到行业落地中去。

像华为盘古大模型在气象上的应用登上Nature顶刊，它可以在1.4秒就能完成24小时全球气象预报，比传统方法快1万倍。

在教育、游戏、广告营销以及矿山、药物研发等领域，大模型都有相应的落地应用。

这两天，北京交通大学还联合发布了国内自主研发首款综合交通大模型TransGPT・致远，并开源。

李文友认为，在垂直领域乃至具体场景的应用，正是大模型最大生命力所在。

关于「中医大语言模型」打造，大经中医也透露了这两个方面的原因。

从行业中看，中医大语言模型有助于中医药「数智化」发展。

首先，中医临床诊疗数据、中医文献数据大多都是文本数据的形式。擅长自然语言识别处理的大语言模型则有助于中医传承发展。

其次，中医临床诊疗既具有完善的理论体系，又具有较强的经验属性，因此学中医素来有“读经典、跟名师”之说。

这些经验深藏于中医文献、典籍中，以及大量历代医家的医案、医话、医论中，但理解、记忆、应用这些经验是一项艰难的任务，中医大语言模型的出现，将大大改变中医学习和人才培养的模式。

最后，从中医的终极思维出发，中医不仅仅是医学，也是中国人的生活方式，这也就决定中医不仅存在于医院，也存在于家庭，以及各种与健康有关的空间。

而在更广泛场景中，自然语言的交互方式更符合普通人的沟通习惯。这样来看，中医大语言模型，能更加推动中医AI更广泛落地。

而除了行业维度，对于大经中医本身而言，还有更深层次的价值。

早在7年前，大经中医就提出:数智化是中医药发展的必由之路，并以此为实践。

核心产品中医临床智能辅助诊疗系统（CDSS）建立起从三甲中医院到社区卫生服务中心和乡镇卫生院，再到诊所、门诊部、卫生室的各级医疗机构的应用生态。

今年开始，进一步集成了中医临床智能辅助诊疗系统（中医智脑）、中医智能脉诊仪(中医智指)、中医智能舌面诊仪(中医智目)的大经数智中医一体化诊疗系统已经逐步走进更多健康服务场景。

△融合了大经中医一系列软硬件产品的“数智中医一体化诊疗系统”

用他们的话来讲，大经数智中医一体化诊疗系统已经从“严肃医疗”的生态圈，扩展到“中医大健康”的生态圈。

而现在，随着岐黄中医GPT的发布，大经“中医大健康”的生态圈将进一步做大，加速更多健康场景的拓展。

发布会上，李文友演讲最后还呼吁更多生态伙伴加入。

大模型加速企业生态圈建设，也将进一步加速行业领域发展，朝着更广泛场景落地——

日常生活中，中医也将随处可见。

从企业出发，到行业，最后再普惠到每个人当中，这也是大模型落地更多细分领域的变革范式。

大模型还可以在哪些领域碰撞出火花?不妨在这里期待一下。

关键词：