
2025年6月14日,“保险与精算四十人论坛·青年论坛2025年年会”在南开大学八里台校区省身楼隆重举行。本次年会由南开大学主办,南开-泰康保险与精算研究院、蚂蚁逸康(广州)信息技术有限公司承办,主题为“数智赋能与保险新质生产力”,聚焦数字化时代保险行业的转型升级与高质量发展。论坛设置主论坛、三场分论坛及一场圆桌论坛。
蚂蚁集团数字医疗健康事业部CTO魏鹏先生在分论坛一“保险科技与新质生产力创新”上发表题为《蚂蚁医疗AI的应用实践和技术分享》的主旨演讲,围绕蚂蚁医疗AI大模型的研发及应用展开详细介绍,并对如何通过AI提升用户就医体验和医生工作效率进行了分享。本文根据演讲内容整理而成。

蚂蚁集团数字医疗健康事业部CTO
魏鹏先生

蚂蚁医疗AI的应用实践和技术分享
一、蚂蚁医疗 AI的应用布局与普惠愿景
魏鹏先生首先回顾了蚂蚁医疗十年来“让每个人看病更简单”的初心。自2014年上线第一笔线上挂号缴费以来,蚂蚁医疗已累计服务7亿用户。进入2020年,蚂蚁医疗构建起一个涵盖就医问诊、挂号、买药、医保、商保等一站式的医疗健康平台。在大模型时代背景下,蚂蚁医疗致力于通过AI技术实现医疗的普惠,以应对当前医疗供需不平衡、个体健康需求日益增长的挑战。
考虑到当前大模型的能力边界以及医疗伦理等因素,蚂蚁医疗将 AI助力医疗普惠的重心放在以下三个方面:一是用户端,通过AI与服务的结合,提升个人就医体验,实现就医流程的陪伴,并基于健康档案为用户提供“AI家庭医生顾问”的角色;二是医生端,借助医生智能体提高预问诊效率,并通过AI辅助诊疗和教学任务;三是机构侧,实现智能基层复诊和管理的提效。
蚂蚁医疗大模型整体布局旨在助力机构、医生、用户三端。通过医疗大模型的底层技术支持,在用户 AI服务、AI助理和医生AI助理三个方面推动智能化场景的开展。同时,蚂蚁医疗通过可信医疗云保护用户数据隐私,并借助可信医疗一体机实现私有化部署。
魏鹏先生特别提到了蚂蚁医疗与浙江卫健委共同探索的“安诊儿”模式,该模式旨在打造一个值得用户托付的AI健康管家,集陪诊师、咨询师和健康师于一体,并支持用户个性化健康档案,让AI健康管家更懂用户,提供有温度的AI大模型应用。目前,该服务已可在支付宝体验,并将很快上线独立的APP。
二、医疗 AI的技术挑战与数据体系建设
魏鹏先生深入分析了医疗 AI面临的技术挑战。他指出,医生的诊断不仅依赖客观知识,更包含大量源于临床经验的主观因素。这些临床经验涉及用户隐私,难以提取和标准化,数据治理也面临参数参差不齐的问题。
整个医疗的主观知识体系,包括病史、门诊病历以及医生的临床经验等,具有很强的人类医生逻辑。尽管大模型在语言理解和知识方面表现出色,但逻辑推理能力直到近期才逐步增强。因此,将大模型能力与医疗领域的应用相结合,仍然充满巨大挑战。他将大模型在医疗领域的核心挑战概括为:严肃性、专业性、复杂性和个性化。
为了构建高质量的医疗大模型,数据体系的建设至关重要。魏鹏先生强调,医疗大模型语料比传统技术大模型更注重专业性,因此获取高质量医疗语料是当前最大的挑战。他将医疗数据的获取难度分为三层:一是基础数据,大量的公开可获取数据,如 Public论文、公开医学指南、公开病例库。蚂蚁医疗凭借多年沉淀,拥有丰富的医疗健康知识和问诊数据;二是采购数据,与人民卫生出版社、中华医学会等权威机构合作获取专业词条;三是临床数据:最难获取的部分,通过与浙江互联互通数据、浙江人工智能基地数据合作,以及与专业医生协作获取。针对这些数据,蚂蚁医疗构建了由学生、专业医生到头部专家组成的三支医生团队,通过三层标注和改写的方式处理数据,确保数据质量。
魏鹏先生进一步阐述了数据处理的三个关键方向:一是筛,从海量数据中快速筛选出符合要求的数据,通过大模型和科学筛选模式进行批量达标;二是改,从网页或文章中提取关键信息和有价值的要点;三是合成,根据已有语料进行大量数据合成,以提升大模型的推理能力和泛化能力,弥补互联网自然生产数据无法满足大模型要求的不足。此外,蚂蚁医疗还构建了医生专用标注平台,通过数据驱动、人机协同的方式,提升标注效率、专业度和准确性,实现大模型能力在大部分情况下超越一般人的水平。
三、大模型训练与医生问诊逻辑学习
魏鹏先生介绍了大模型训练的多个阶段。首先是预训练阶段,构建大模型训练 Pipeline,包括知识注入。接着,针对特定任务进行指令微调和任务适配,其学习方式与人类类似,经历数据筛选、配比、退货等阶段,是多阶段渐进式采样和对齐优化。通过这一工作,蚂蚁医疗能够将医疗知识和专业任务适配于任何大模型,并已在多个医疗知识问答、语言生成、复杂推理榜单上取得第一。
在让大模型学习医生问诊方面,魏鹏先生指出多轮对话一直是大模型的巨大挑战。蚂蚁医疗通过学习医生多轮问诊的逻辑和推理能力,构建了完整的多轮诊断能力。他们利用自身沉淀的问诊数据作为启动,通过大模型角色扮演(一个大模型扮演医生,另一个扮演患者)进行对话筛选,并结合医生标注平台进行专业标注和改写,从而批量获取高质量问诊数据。
在算法创新方面,蚂蚁医疗借鉴了 DeepSeek在RE上的创新,发明了GRPO强化学习范式,并在此基础上进行了创新。他们结合了SFT(监督微调)和RL(强化学习)两种模式的优势。SFT能高效注入知识,快速形成回答范式,但可能偏向死记硬背;强化学习则能提升模型性能上限和泛化性,但对模型能力依赖性强。新方法结合两者优势,达到了比单一方法更好的效果。
四、多模态应用与智能医生体
魏鹏先生强调,多模态是医疗领域的核心场景,它能够让多模态模型像语言模型一样具备复杂问题的推理能力,联合推理图片、视频、声音等多种模态。他重点介绍了蚂蚁医疗在报告解读方面的工作。
报告解读是 AI在医疗中的关键应用,尤其在真实医生看诊中,通常需要多报告解读。传统方法将所有图片输入会增加模型推理成本并使模型丧失重点。蚂蚁医疗的方式是让模型自己感知多页报告中哪些是关键信息需要重点解读,哪些是信息介绍无需关键解读。核心在于基于Query动态调整输入报告的重要性,实现动态尺寸增强或丢弃。该方法已达到业界SOTA水平,并被2025年KDD收录。
对于医生的智能体,蚂蚁医疗通过智能体平台,能够快速根据医生提供的文献、病例、诊断记录等数据进行微调,构建出专科模型。同时,结合获取能力,根据用户提供的权威文献进行专业回答,并结合数字人复制技术,为用户带来真实专业的智能体体验。
五、医疗大模型评测体系与安全伦理
评测是大模型迭代的重要方向。魏鹏先生指出,如果评测方向偏离,大模型可能无法满足需求。因此,蚂蚁医疗在技术上重点做了三点:一是标注一致性,确保面对不断变化的标注团队时,权威答案、个人与历史标注、多人标注之间的一致性,保障人工评估结果的效果和稳定;二是统一认知,结合自动化和人工标注,建设统一的参考答案和标注信息来源,形成基于真实反馈的标注模式和评测循环;三是模型主导基准评测,借鉴 OpenAI发布的HealthBench,利用模型自身的能力来判断其他模型的能力,未来将逐步从人为主导的标注评测转向模型主导的评测,人类则聚焦于设定事实标准并建立可信的场景覆盖评测。
最后,魏鹏先生重点强调了医疗大模型的安全伦理问题,认为这是核心命题。蚂蚁医疗大模型从三个方面构建安全体系:一是医疗伦理评测标准,通过与专家合作、解读法律法规、感知社会舆情以及用户真实声音,结合医学安全合规伦理,定义了包含医疗安全、医疗合规、医疗伦理、医疗专业性、通用安全五大维度的 61项风险标准,并定期邀请专家团队评审,与同行业进行对比;二是内生安全,采用多技术人机对齐技术。通过构建可信信息检索生产生成技术,确保模型在回答时引用权威最新的指南和科研成果。对AI生成内容进行专家校验和安全审读,提升输出可靠性。在后训练过程中,经过多阶段清洗和质量把关,获得优质医疗SFT数据,对模型进行精细化调优;三是外部护栏,构建多层次风险拦截缓冲机制。
魏鹏先生指出蚂蚁医疗的目标是让大模型真正学会像医生一样诊断,通过端到端的方式,强化学习的方式,结合工具实现像人一样的诊断逻辑。通过全模态技术,观测语言无法观测到的信号,在提升体验的同时,进一步提高问诊效果。
魏鹏先生的分享全面展示了蚂蚁医疗在 AI领域的深厚积累与前瞻布局,不仅致力于提升用户就医体验和医生工作效率,更着力于构建严谨可靠的医疗AI体系,为整个医疗行业的智能化发展注入新动能。


微信扫一扫
关注该公众号
知道了
微信扫一扫
使用小程序
取消 允许
取消 允许
取消 允许
× 分析

微信扫一扫可打开此内容,
使用完整服务
: , , , , , , , , , , , , 。 视频 小程序 赞 ,轻点两下取消赞 在看 ,轻点两下取消在看 分享 留言 收藏 听过