白交 发自 凹非寺
【资料图】
量子位 | 公众号 QbitAI
国内医疗大模型,现在又迎来了位新玩家。
还是以中医为核心的大模型——
岐黄问道·大模型,大经中医出品。
作为国内智慧中医的代表企业,以往它的个中进展或许并不被广泛熟知。
但它核心产品中医临床智能辅助诊疗系统,实现了从基层村级卫生室到三甲中医院的应用覆盖,积累了400多家等级医院、8000多家基层医疗机构的用户。
这也就意味着,一旦大模型规模化落地,就可快速实现到基层的应用。
结果在发布会现场,它直接甩出三个子模型,还进行了现场演示。
基于已确诊疾病的临床诊疗大模型;
仅仅基于症状、体征的临床诊疗大模型;
中医养生调理大模型。
以中医养生调理大模型为例,只需输入症状、体征信息。比如输入怕冷及相关症状。
大模型就能输出一系列多维度的养生方案来。包括中药、经络穴位、食疗、茶饮等一步到位。
年轻人养生的第一个大模型,来了?!!
本以为这样就结束了,但没想到的是演示之后,大经中医竟然还直接公开了正在进行的训练过程?!
这个玩家究竟什么来头?中医GPT首秀实力究竟如何?
中医GPT实力如何?
那就来看看,这个岐黄问道·大模型的首秀能力如何?
主要分布两大场景:中医辅助诊疗、中医健康养生服务。
首先是知病场景——基于已确诊疾病的临床诊疗大模型的现场演示,即输入患者“疾病-症状-体征”信息,让大模型输出辨证结果、治则治法和中药方剂。
一上来,它就会自称「小经医生」,询问需要咨询的疾病。现场输入慢性胃炎后,它会进一步要求你提供相关的病情。
患者3年前出现胃痛,隐隐地痛,有时候会有胃热的感觉。前年9月份去当地人民医院做了胃镜检查,当时诊断为浅表性胃炎。患者平时吃的比较少,胃口一般,口干,大便干,睡眠一般,舌红,脉细数。
最终可以看到,它成功地推断出了证型「脾胃阴虚型」,并给出了治法、处方以及用药和用法。
目前该模型已经通过“大经数智中医”微信公众号,向医疗机构开放内测申请。
而即便是那种没有明确诊断的疾病,只输入症状和体征信息。大模型也能输出完整的结果来,即第二个子模型知症。比如输入“盗汗”以及相关病情。
而在健康养生场景下,只需输入最近困扰你的亚健康问题,就能快速获取一整套涵盖艾灸、按摩、膏方、茶饮、膳食、汤羹等内容的养生建议。
这样的能力,离不开行业数据的支撑和训练。据大经中医技术总监王祺表示,在大模型的训练中,主要用了这些数据集——
1100万条中医知识图谱数据;1500本中医古籍和文献数据;10万份真实中医专家医案数据;10万条脉象、舌象、经络、穴位数据;200万条真实的中医临床诊疗数据。
而为了这些高质量数据,大经中医过去投入了数千万研发费用。
具体训练方式也在这场发布会上,得到了公开呈现。
主要采用四层递进的训练方式:预训练→监督微调→奖励模型→强化学习。目前,前两个阶段已经完成,后两个阶段正在持续迭代中。
目前该训练系统正在由中医和AI两方面的专家协作完成。中医专家评估的ID,已经达到了1704605,足以见其数据规模。
敢一下子放出三个子模型,并在现场直接公开训练过程,大经中医底气从何而来?
岐黄问道大模型如何炼成?
大模型最直观的范式变革,就是新型人机交互关系的诞生。
不管是通用场景下的搜索引擎,还是垂直场景下的交互模式——
从UI、OS、EMR(电子病历)等转变为自然语言。已预见到的是,「流量入口」、「知识获取路径」等都在这场变革中得到重新定义。
既然落地价值显性,那具体到大模型在垂直场景应用,大经中医CEO李文友认为取决于这三个要素:
数据:高质量行业数据的获取;
专家:业内高水平专家对预训练模型的调整、反馈;
场景:具体场景的业务深耕,对具体场景的业务理解,以此实现大模型与行业的有效结合。
归结起来,就是行业Know-how,多年领域深耕积攒下来的行业壁垒。
于大经中医而言,这种“壁垒”可以具体展现在三个方面:
数据。
相较于其他医疗分支,中医知识更为庞杂和个性化,而且历来有“道不传非人,法不传六耳”的传统,这就导致高质量数据非常私密,公开数据质量又比较低,因而更需要垂直领域深耕。
据介绍,基于大量真实名老中医的诊疗经验和中医文献中的诊疗知识,大经中医构建了中医诊疗知识图谱 ,涵盖内外妇儿等全学科、经方时方、孟河岭南等全流派。据称是目前业内最高质量的行业数据。
与此同时,还建立了包含25000+个词条的中医症状、体征术语规范化词典。据介绍,这也是行业中唯一大规模、覆盖全病种的术语规范化词典。这样一来,能够减少因为措辞差异导致答案不一致的影响。
目前,大经中医已经积累了400多家等级医院、8000多家基层医疗机构用户,形成了大量专业的中医诊疗数据。
人才。
据了解,大经中医拥有全行业规模最大的中医-AI跨界研发团队,也拥有行业最大的名老中医团队,他们通过协议方式合作展开中医AI研究,可在此次大模型研发中,协助开展RLHF工作提高性能。
此外,大经中医还与上海交大计算机科学与工程系等机构专家合作,集成多方技术优势,共同开展中医大模型的研究。
应用。
场景应用越丰富,客户数据越庞杂,越有助于训练出更理解行业场景和业务的垂直大模型,并且在后续迭代中也能快速形成飞轮效应,更新速度越来越快。
大经中医现有的AI应用场景实现了B端和C端的覆盖——
包括广东省中医院、上海中医药大学附属龙华医院在内的等级医疗机构;南京市江宁区、淄博市高青县等区域中医医联体,亦或是在上海长宁区“为老服务中心”这种大健康机构应用,以及下沉到山东、吉林等地村卫生室这种基层医疗机构的应用。
而在C端,则以学习强国里的中医智能健康助手为例,只需要选择一些不舒服的表现,就能推荐中医调理方案。目前用户已接近300万人。
基于这三点核心优势,“岐黄问道·大模型”的技术路径也就明晰起来。发布会现场,李文友透露大模型是这样炼成的。
首先,从名老中医临床诊疗数据+中医文献数据到中医诊疗知识图谱。
用知识图谱将这些数据结构化、规范化,从而表达和存储名老中医诊疗经验和文献诊疗知识。
随后,从中医诊疗知识图谱到中医领域预训练模型。
利用千万级的中医知识图谱数据和临床诊疗数据,微调通用预训练模型。
最后,从中医领域预训练模型到岐黄问道大模型。
由中医专家共同参与,利用奖励模型-强化学习机制,最终形成岐黄问道大模型。
为什么需要大模型?
大模型发展到现在,不管从个中进展还是业内聚焦探讨,已经从对技术本身的展望,逐渐具象到行业落地中去。
像华为盘古大模型在气象上的应用登上Nature顶刊,它可以在1.4秒就能完成24小时全球气象预报,比传统方法快1万倍。
在教育、游戏、广告营销以及矿山、药物研发等领域,大模型都有相应的落地应用。
这两天,北京交通大学还联合发布了国内自主研发首款综合交通大模型TransGPT・致远,并开源。
李文友认为,在垂直领域乃至具体场景的应用,正是大模型最大生命力所在。
关于「中医大语言模型」打造,大经中医也透露了这两个方面的原因。
从行业中看,中医大语言模型有助于中医药「数智化」发展。
首先,中医临床诊疗数据、中医文献数据大多都是文本数据的形式。擅长自然语言识别处理的大语言模型则有助于中医传承发展。
其次,中医临床诊疗既具有完善的理论体系,又具有较强的经验属性,因此学中医素来有“读经典、跟名师”之说。
这些经验深藏于中医文献、典籍中,以及大量历代医家的医案、医话、医论中,但理解、记忆、应用这些经验是一项艰难的任务,中医大语言模型的出现,将大大改变中医学习和人才培养的模式。
最后,从中医的终极思维出发,中医不仅仅是医学,也是中国人的生活方式,这也就决定中医不仅存在于医院,也存在于家庭,以及各种与健康有关的空间。
而在更广泛场景中,自然语言的交互方式更符合普通人的沟通习惯。这样来看,中医大语言模型,能更加推动中医AI更广泛落地。
而除了行业维度,对于大经中医本身而言,还有更深层次的价值。
早在7年前,大经中医就提出:数智化是中医药发展的必由之路,并以此为实践。
核心产品中医临床智能辅助诊疗系统(CDSS)建立起从三甲中医院到社区卫生服务中心和乡镇卫生院,再到诊所、门诊部、卫生室的各级医疗机构的应用生态。
今年开始,进一步集成了中医临床智能辅助诊疗系统(中医智脑)、中医智能脉诊仪(中医智指)、中医智能舌面诊仪(中医智目)的大经数智中医一体化诊疗系统已经逐步走进更多健康服务场景。
用他们的话来讲,大经数智中医一体化诊疗系统已经从“严肃医疗”的生态圈,扩展到“中医大健康”的生态圈。
而现在,随着岐黄中医GPT的发布,大经“中医大健康”的生态圈将进一步做大,加速更多健康场景的拓展。
发布会上,李文友演讲最后还呼吁更多生态伙伴加入。
大模型加速企业生态圈建设,也将进一步加速行业领域发展,朝着更广泛场景落地——
日常生活中,中医也将随处可见。
从企业出发,到行业,最后再普惠到每个人当中,这也是大模型落地更多细分领域的变革范式。
大模型还可以在哪些领域碰撞出火花?不妨在这里期待一下。