浪尖科技 AI/大模型 AI领域新论文:捕捉医生思路,用于大模型训练

AI领域新论文:捕捉医生思路,用于大模型训练

中国科技网 · 2025-03-03 15:22 · 1828 阅读

2月25日,arXiv预印本网站刊载了医疗大模型“京医千询”(Citrus)模拟医学专家认知的探索实践相关论文。论文显示,为了训练该模型,团队研发出一种新的方法,能够有效捕捉临床医生的决策路径,将其数据化,进而为“京医千询”的模型训练提供大量医学专家推理的模拟数据。

当前,大语言模型在诸多应用中展示出巨大潜力,但在医疗决策支持时面临的最主要障碍仍然是缺乏医学专家级别的认知。“病人不会按照教科书和指南得病。”京东健康探索研究院高级研究员刘慧解释,临床医学是基于循证知识和实践经验的综合科学,除了指南、教科书上的“显性”知识,医生还需要不断实践思考,做出个性化的诊疗决策,积累“隐性”经验和能力。

如何让人工智能习得更专业的医学思维方式?如何助力医疗AI在辅助诊疗上运用到医学的“人类经验”?上述论文给出探索性路径。

将医生的推理数据化

“AI的训练过程与人才培养的过程是相似的。”论文第一作者、京东健康探索研究院首席科学家王国鑫告诉科技日报记者,在临床实践中,医生由于接诊经验的不断累积,在思维方式上达到质变,“悟”出了自己的专家心得,其本质也是数据训练。因此,高水平的医疗数据是AI训练的基石。

面对不同的患者,专家如何想到对应的临床解决方案,恐怕连专家自己都说不清。因此,将经验数据化非常困难。一方面,医疗决策往往涉及模糊性、不完整数据和不确定性,模型有效反映专家判断方式的复杂性存在困难;另一方面,获取真实世界的专家级临床推理数据具有挑战性,因为它需要捕捉专家思维的细微差别,而这些细微差别往往难以量化。

为了解决上述困难,团队除了基于京东互联网的场景沉淀,还与线下医院合作,为用于训练的推理数据集形成汇集基础数据。

然而,临床数据难以复制临床实践的动态性和模糊性。临床数据记录了临床症状和解决方案,但中间的推理“路径”是空白的,需要“补充”。为此,团队创新了一种无需训练的方法模拟医学专业人员的认知推理过程。

论文显示,团队与人类医学专家合作,设计了一种方法来增强大型医学语言模型中的复杂推理能力,这种方法为多阶段的训练方法,结合了连续预训练、监督微调和强化学习等多个阶段,专门针对临床场景定制,显著改善了跨多个模型的复杂推理任务。

“新方法再现了临床决策的动态和迭代特性。”王国鑫介绍,在大量模拟医学推理数据集上训练“京医千询”,使得其推理能力更贴近于临床实践。可见,构建临床数据,是形成专家级别模型的重要技术落脚点。

开源推理过程,助力AI驱动医疗决策

“我们成功地将这种方法转化为一种可训练的方法,从而在各种医疗基准测试中显著提高了几个开源基础模型的性能。”王国鑫表示,医学推理和决策的支持使得大模型表现优于70B(700亿个)参数这一体量的模型。

业内认为,推理过程模拟是模拟人的逻辑思考能力,不仅可以应用于医疗领域,也可以用于文章创作、科学研究等领域。无需训练的模拟新方法,有望在创造性活动中提升人工智能的能力。

论文显示,团队将模型及其训练数据作为开源资源公开,进一步降低医疗AI应用的开发门槛,让更多医疗机构、开发者可以基于“京医千询”快速开发出适合自身需求的医疗AI应用。

同期开源的还包括一个基于真实世界数据的大规模、可更新的临床实践评估数据集。

“我们希望开源能够推动人工智能模型不断取得新突破。”王国鑫说,目前看来,AI模型的能力上限仍在不断提升,除了能够在“大数据”中抽提价值外,AI还需要习得“小数据”的学习能力。

业内也在不断发展此类的技术能力,例如通过思维链(COT)生成技术以增强医学模型的推理能力。

王国鑫表示,随着人工智能助手的普遍应用,AI医生能够与人类医生一起成长,积累更多的“悟”的经验,然后通过假设演绎法、模式识别法等人工智能技术不断实现,并将认知途径返回给人类专家验证,不断激活模型的推理潜力,以推进人工智能驱动的医疗决策研究。

(图片来自预印本网站)