夸克 AI 搜索的“大模型”:通过主任医师评测,健康搜索更专业
国内首个通过主任医师笔试评测的AI模型
7月23日,夸克健康大模型成功通过中国12门核心学科的主任医师笔试评测,成为国内首个完成该挑战的人工智能模型。目前,其"主任级AI医生"能力已全面融入夸克AI搜索功能中,用户在查询健康信息时,只需选择"深度搜索"即可调用。
继副主任医师考试通过后的又一次跃升
继今年5月顺利通过副主任医师职称考试后,夸克健康大模型再次实现能力跃升。对比通用模型与垂直领域模型的表现,夸克模型在任务难度越高时,其优势越为明显,充分展现出其在复杂医学推理任务中的突破性进展。
构建医学思维路径,突破传统AI局限
这一成果揭示了垂直领域模型在医学研究中的巨大潜力。夸克健康大模型依托通义千问构建,走出了一条面向垂直场景的深度工程化路线。"我们不是在训练AI回答医学问题,而是在训练它学会医学思维。"夸克健康算法负责人徐健强调。
慢思考能力:层层推理的关键突破
夸克健康大模型的核心创新之一,是成功构建了"慢思考能力"。该能力融合链式推理与多阶段临床演绎路径建模,使模型在面对复杂医疗问题时,能够分步骤、层层递进地进行分析,最终得出精准结论。
构建高质量训练体系:双数据产线与双奖励机制
实现"慢思考能力"的前提,是拥有高质量的推理训练数据。为此,夸克建立了"双数据产线 + 双奖励机制"的工程体系:
- 将医学数据划分为"可验证"与"不可验证"两类,分别适用于诊断任务与健康建议任务
- 引入"过程奖励模型"与"结果奖励模型",分别评估推理链的合理性与最终结论的准确性
这一机制显著提升了模型的临床可解释性与推理一致性。
多阶段强化学习流程设计
该体系还设计了多轮强化学习流程,包括:
- 冷启动数据的人工严格校验
- 样本多轮筛选与难度递进训练策略
- 防止"高分投机"的作弊识别机制
通过真实医生的标注数据与"问---思---答"整组数据驱动,夸克健康大模型不仅掌握了医学知识,更具备了医学思维的路径选择、证据整合与多解平衡能力。底层权威医学知识库保障了输出内容的专业性与时效性。
专家高度认可:专业度媲美资深医师
安贞医院心脏外科主任医师谢进生表示,夸克在某些问题上的回答专业度甚至超过部分专业医生。这一成果离不开专业医师团队的深入参与。
千人专家团队参与标注
目前,夸克健康大模型背后拥有千人规模的专业医师标注团队,其中超过400位为副主任医师及以上职称的资深医疗专家。
吸引医学生与医生群体的AI搜索平台
凭借在医学领域的专业表现,夸克AI搜索已成为医学生与医生的重要工具。夸克健康运营负责人赵存忠介绍,目前平台在全国医学生中的月活跃用户已突破200万,覆盖过半医学生群体,广泛应用于基础知识查询、考试备考及临床辅助诊疗。