9月21日,由中国公共关系协会文化大数据产业委员会(以下简称“专委会”)主办的文化大模型开发应用大会在南京举行。北京玖扬科技有限公司(以下简称“玖扬科技”)副总裁尹晖发表题为《博古通今,与华为联创文化大模型加持下的中医保健应用》的案例分享,以下是演讲全文。(根据讲话录音整理) 尊敬的各位领导、专家、嘉宾,大家下午好! 感谢大会主办方邀请我们参加本次文化大模型应用开发大会,我是来自玖扬科技的尹晖。今天向大家介绍的是我们利用专委会与华为联创的文化大模型所开发的中医模型和中医保健应用。 今年7月,华为云发布了千亿级参数的盘古3.0大模型。同月,在华为HDC大会上, 中国公共关系协会文化大数据产业委员会与华为云签署了文化大模型联创合作协议。协会在短短一个月内组织成员单位提供了相关训练数据集,并在9月初完成了文化大模型的初步训练,目前处于测试调优期。 玖扬科技作为一家十年如一日专注在文化数字化领域的专业服务机构同时也是专委会成员单位,在收到华为的相关技术文档后迅速组织公司内部技术力量攻坚克难, 在短短两周内开发出了MVP(最小可用产品)。不见得成熟, 但可以从一个侧面看到AI能力在文化领域的广阔应用前景。 01 什么是中医模型 首先让我们来看看什么是中医模型。中医模型是基于文化大模型的NLP自然语言处理能力以及专委会提供的训练集中中医相关书籍数据训练而成的面向中医领域应用场景的L2级模型。 它的起点是基于华为盘古大模型3.0千亿参数模型, 训练数据集由专委会相关成员单位提供的高质量数据集初步训练而成。其目的是响应国家对于中医文化传承的号召从而服务行业中各类机构对于中医保健咨询、养生保健、方剂查询等场景的需求, 最终为广大人民群众提供高质量的中医保健服务。 目前的数据集包括各大出版社出版的关于中医、藏医、蒙医、维医、朝医、彝医、壮医、苗医、傣医等多种医学书籍。 02 为什么要建设中医模型? 首先,中医文化是中华民族优秀传统文化的重要组成部分和文化瑰宝。 总书记在今年6月22日文化传承座谈会上指出: “中华优秀传统文化有很多重要元素,比如,天下为公、天下大同的社会理想,民为邦本、为政以德的治理思想,九州共贯、多元一体的大一统传统,修齐治平、兴亡有责的家国情怀,厚德载物、明德弘道的精神追求,富民厚生、义利兼顾的经济伦理,天人合一、万物并育的生态理念,实事求是、知行合一的哲学思想,执两用中、守中致和的思维方法,讲信修睦、亲仁善邻的交往之道等,共同塑造出中华文明的突出特性。” 中医文化恰恰反应了天人合一的系统化思维和知行合一的哲学思想。 以《黄帝内经》为例,它关注人与自然、人与人、人与社会、人与心灵的统一和谐。深受天人合一思想的影响。 李时珍走遍大半个中国, 3次登顶武当山采药470余种, 查阅800多本医著历经44年完成《本草纲目》的编纂。这都是知行合一最好注释。民间关于神农尝百草而造福百姓健康的故事也说明先贤对于实践的重视。其实各类中医著作无不是通过经年累月的经验积累,在前人的总结上再实践,去伪存真、知行合一的结果。 中医文化中的阴阳论、五行论、系统论、辩证论都源自中国传统哲学思想,二者浑然一体。 其次,中医文化历史悠久,自成完善的知识体系,既有理论支撑,又有实践总结,是真正的科学,值得我们中华儿女发扬光大。 我们看到中医学的四部经典著作《黄帝内经》《难经》《神农本草经》《伤寒论》既有综合性、体系化的中医论著,也有对于药理药性、诊断、治疗、方剂的专门论述,而它们仅仅是目前馆藏的9000多部中医古籍的顶尖之作。 我们更应看到中国历史上的名医大家如灿烂星河般照耀中华民族的辉煌历史,为人类留下太多的传奇故事和实践真知。 在技术飞速发展的今天,玖扬科技深感责任重大,更应该思考如何用文化和科技融合的指导思想,用AI和大数据技术更好的总结传承这些中华瑰宝,通过数字化的手段高效服务于广大人民群众。 03 中医保健系统演示 玖扬科技开发的中医保健系统是一款基于文化大模型NLP功能基础上开发的智能问答系统,其背后是基于保健服务场景的L2级中医模型。 应用侧目前分为web端和安卓app端。 它可以通过自然语言处理和机器学习等技术,辅助医生和患者分析病症并给出改善建议。我们只需要在对话框中用自然问句的形式输入问题,应用就可以精确的判断您想要的信息,并以自然语言的方式进行回答。 判断一个AI大模型的综合能力可以从回答问题的准确性、上下文的逻辑能力、判断能力、知识点的覆盖全面性、模型健壮性等方面来考察和测试。 我们先来看看大模型的对自然语言理解的准确性和逻辑关联性。我们在对话框中连续输入有逻辑关联的几个问题,应用背后的大模型可以自动进行逻辑关联,准确进行回复。比如我们输入:“请问什么季节过敏症状会多发?饮食上应注意什么?”其中第二个问题我们并没有明确说“过敏症饮食上应注意什么?”但是基于AI的中医模型可以自动判断两个问题的关联性,并给出准确的回答。 我们再试一次连续问题看他是否表现正常来验证模型的稳定性和健壮性:“儿童秋季久咳应如何调理?食疗如何安排?”可以看到模型能够很好地理解问题, 并根据其掌握的知识形成清晰的答案,完整并自动对前后两个问题进行了逻辑关联。 我们再来考考模型的判断力,我们再输入一个问题:“目黄、身黄、尿黄、面部晦暗、手掌鱼际部赤红、口中异味可能是什么病症?”,这个问题里面我们把几个症状并列在一起, 中医模型可以准确识别几个关键的症状,并整合起来给出可能的病症判断。 我们再问几个养生的问题,看看他在养生方面是否也有涉猎: 寒露过后如何防治“老寒腿”? “饮食自倍”“肠胃乃伤”的含义是什么? 高血压患者的饮食需要注意什么? 从模型的回答可以看到中医模型给出了比较正确的养生建议。中医模型已经有了一定的养生知识储备,也具备了一定的实用性。 04 未来优化安排 当然目前训练才刚刚开始,为了使模型更加聪明、智能, 更像一位老中医, 我们还有很多持续优化工作要做。 主要集中在以下三个方面: 1.是基于人工反馈的强化训练(RLHF); 2.是不断投喂更多高质量中医保健数据; 3.是进一步完善交互方式。 基于人工反馈的强化训练我们主要会做几件事: 其一,是邀请全科中医学者和专家参与训练,准备各类专业问题对中医模型进行测试和评估, 并通过量化测评反馈和答案修正,进一步优化现有模型基础。 其二,是邀请部分著名专科专家,吸收他们的知识体系对模型进行进一步提升,成为各科专家。 高质量数据投喂方面我们将进一步收集经典古籍的名家注释版本,完善现有模型。同时我们也会与各高校合作,收集各类中医教材,从体系化层面完善模型各专业领域知识。 第三,是收集各类经过专家确认的经方。 第四,是针灸推拿等传统中医治疗手法的收集。 第五,是各类方剂的收集。 大家可以看到目前我们和中医模型的交互还是比较传统的文字交互。目前只解决了中医望闻问切中部分“问”的场景。后续我们将进一步整合各类资源从几个方面进行优化。 “望”的方面 利用文化大模型的CV图像比对技术,通过远程图片比对来对患者的脸部、舌苔图像等进行分析; “闻”的方面 通过实时音频分析患者的喘息和情绪状态进行分析。另外通过语音识别技术和患者直接进行语音交互,将患者的声音信号进行识别比对;对患者表述的气味信息进行文字识别转换后作为模型可以理解的NLP语意,然后再进行综合判断等。 “问”的方面 我们将加入语音输入和语音交互方式, 这种交互方式更适合儿童和老人; “切”的方面 利用专业仪器实时记录脉象,并进行定量比对分析; 以上是玖扬科技目前利用文化大模型在中医保健领域做的一些初步工作以及未来的设想。虽然工作才刚刚开始,但畅想未来可能的场景,我们充满期待。 相信在专委会的组织指导下,在业界同仁的合作努力下,在华为的技术支持下,文化大模型的中医保健应用一定能为中医的传播和复兴做出更大贡献。服务于广大人民群众。 我的汇报就到这里, 欢迎大家共同合作, 谢谢大家! 来源:伏羲云 |
|