医疗行业也在被数字化重塑,随着ai大模型不断深入行业、产业,“数智化”现代医疗的建设承载了许多期待。
只不过,在医疗这个非常严肃的场景中落地大模型,既要对抗大模型幻觉等可控性问题,还要让大模型符合医疗的逻辑。另外,ai距离社会化的“好用”也在历经磨合期,如何让ai“飞入寻常百姓家”,让更多患者切身享受到ai为医疗带来的便利?都是目前医疗行业信息工作者所关注的问题。
上海市第一人民医院,一家有着160年历史的老牌医院,如今作为ai医疗应用落地的排头兵,正努力尝试为医生、为患者、为医疗行业做些什么。
数字化的“未来医院”畅想
作为上海核心三甲医院,互联网、大数据、人工智能等先进信息技术很早就被上海市一医院注入动脉。
“十三五”期间,上海市一医院曾提出了“smart”智慧医院建设框架理论,即s:service,智慧医疗服务;m:management,智慧管理;a:architecture,智慧后勤;r:research,智慧科研;t:technology,新技术运用,形成了“五位一体”的智慧医院信息化框架。
这与麦肯锡对智慧医院五大要素的定义不谋而合:跨机构互联互通、自动化高效运营、全流程重塑体验、大数据驱动决策以及持续性创新机制,并且这五大要素也是构建未来医院的关键组成部分。
自2022年初,有关“未来医院”的相关试点工作已经在上海落地布局,彼时《上海市“便捷就医服务”数字化转型2.0工作方案》公布了三大“未来医院”试点医院,上海市一医院位列其中。
“上海发改委当时发文要求大家探索打造有别于传统智慧医院的未来医院,三家试点单位各有自己的主题,我们的主题跟其他两家还不太一样。”上海市第一人民医院信息科处长傅春瑜表示:“上海市一医院是从公立医院高质量发展、老百姓获得感、社会广泛认可度这几个角度出发。所以我们的slogan是‘做老百姓看得见摸得着的智慧医院’。”
医疗行业是尤其看重“以人为本”的行业,老百姓作为医院的服务对象,是未来医院构造全过程的中心点。医疗与人工智能大模型等新技术的碰撞,目的不是以先进技术为噱头去做一些很炫的应用,而是要思考,人工智能在医疗应用中能够改造哪些具体的功能?如何把产品整体做得更易用、更好用?
“让普通人真真实实感受到时代红利,改变患者原有的不正确的就医观念,这是我们想勾勒的未来医院的样子”傅春瑜说。
患者就医痛点:中老年群体线上便捷就医并不真便捷
不论先进技术在医疗行业如何飞驰,它无法飞离这个行业看病救人的本质,一切尝试的重点,是为患者服务。
据了解,上海从很久以前就在推行便捷就医,目前已经完成了便捷就医1.0-3.0的场景应用升级,许多患者服务已经落地实践。基于医院的数字化基础,诸如线上挂号、线上支付,分诊、查检验报告、导航、打印发票、复印病历等环节,都可以通过手机直接操作。但是,通过广泛调研,上海市一医院也证实了一点:“中老年群体线上便捷就医并不真的便捷”。
“大部分50岁以上的患者使用频率不高,他们对手机的掌握并不像我们年轻人那么好。况且我们又是一个老年友好医院。”上海市一医院信息科副处长范骏翔说到,“所以基于大模型我们有了想法,或许可以设计这样一个场景,以数字人为载体,以大语言模型作为人工智能大脑,通过语音交互的方式,为患者提供双向交互陪伴式就医服务。”
基于以上构思,上海市一医院结合了蚂蚁的数字人技术,附加医院私有化部署的大语言模型,打造了上海市首个基于大模型语音交互的“ai陪诊师”,并为它取名“公济小壹”。
钛媒体app了解到,总结下来,ai陪诊师解决了患者就医过程中的三个痛点问题。
第一,老年人与智能手机等工具的交互存在数字鸿沟。ai陪诊师利用多模态交互技术,老年患者通过文本或语音与ai陪诊师互动,就能获得清晰的语音版和文本版就医指导,缩短数字鸿沟。
第二,服务流程复杂,患者晕头转向。就医过程中,患者往往会被复杂的服务流程搞得焦头烂额,这个问题的本质在于医院场景医疗服务的碎片化,出现“人找服务找不到”的情况。大模型加持下的ai陪诊师实现了“服务找人”,将碎片化的智能预约、智能导诊、智能预问诊、智能院内导航、智能诊后管理等便捷就医服务联动起来。
第三,就医链路易中断。如何挂号、去哪儿就诊、什么时候抽血、什么时候拿检验结果……对于就医流程不熟悉的患者来说,能够条清屡晰地“该干什么干什么”确实有一定难度。ai陪诊师可以根据患者的就诊情况主动为患者提供下一步引导,覆盖诊前、诊中、诊后全流程。钛媒体app了解到,当前,上海市一医院联合蚂蚁做了九大类30 个细分意图,意图识别准确率在90%以上,上海市一医院称,接下来准确率有望提高到95%。
那么,ai陪诊师的实际应用究竟如何?钛媒体app也进行了现场体验:打开支付宝,平台若定位到上海市一医院,就会九游会官方网站登录首页直接显示“ai陪诊师”入口,找到“公济小壹”,可以语音或文字形式提出困惑,如“我的眼睛出现了一个黑点,这是怎么了?”“公济小壹”会回答当前可能的疾病征兆,提出科室挂号建议,同时附上相应挂号入口。
挂号后,手机摄像头就会自动开启,通过实景ar技术,我们只要举起手机,屏幕里引路的小熊猫就会在前方带路至诊室,主动播报前方还有多少人候诊。当医生开具检查项目后,又会引导患者应该完成检查、缴费和取药。不过,要让ai陪诊师针对患者问题给出更精准的科室推荐,蚂蚁和上海市一医院还在意图识别能力之外,为ai陪诊师添加了多轮导诊、知识库问答、院内流程串联的核心能力。
医生工作痛点:手术流程快,每日百台病历书写难
医疗是一个非常严肃的场景,想要在医疗行业调动整个大模型的可行性,还要从细分领域入手。上海市一医院又将服务对象定位在了医生群体,让大模型先替代劳动力附加值不高“病历书写”,帮助医生自生成电子病历。
范骏翔介绍:“当时探索的切入点其实很简单,我们第一人民医院的优势学科是眼科,眼科手术量最大的是白内障手术,70%以上的患者是日间病房出入院的。所谓日间病房就是患者在上午入院,最快他下午就可以出院,整个流程是非常快的。临床流程的加快,使得病历书写成为了瓶颈。大量的医生在下班后甚至要完成一天中近100台手术的病历文书。”
上海市一医院调研总结,医生书写一份病历的时间大概在5到10分钟。如果按照每天近100份病历的工作量,假设每份病历都以最快时效5分钟完成,医生一天至少要花费8个小时在病历书写上。
“机械化的工作耗费了年轻医生大量的时间和精力,有何举措能够将他们从重压之下解脱出来,是需要我们思考的问题。”上海市一副院长、眼科中心主任孙晓东表示。
基于这样的痛点场景,上海市一医院与蚂蚁探索出了基于大语言模型电子病历生成的模式,据了解,这也是全国首个“大模型生成式电子病历”。
为方便医生使用,“大模型生成式电子病历”提供了结构化输入方式和语音文本输入方式。输出内容方面,它能直接通过ai生成手术记录、出院小结和入院记录,然后为医生标注差异化,最终在医生确认后生成病历。
不过听起来简单,让大模型生成的病历真正“可用”,还要解决大模型的“幻觉”问题。蚂蚁集团大模型技术总监陶东杰告诉钛媒体app,电子病历生成的背后其实依赖于两部分:一部分是医院内部的数据,另一部分是模型的推理能力。在医疗这个不容出错的领域,不可避免地会涉及大模型可控性挑战。
如何让大模型生成的内容有据可依?陶东杰表示,蚂蚁用到了知识增强、推理增强、检索增强三个技术。以知识增强为例,大量的医生参与进行了梳理工作,形成了大量的医疗诊断知识逻辑。范骏翔称,上海市一医院对不同的病种进行了知识图谱的梳理,还按照病历元素、段落、模板进行了文书的场景化录入。
值得注意的是,结构化能力对于模型推理表现尤为重要。例如医生口述文本到最终生成病历的过程,需要把原始输入文本先结构化成正确简洁的信息,再生成结果。其中,诊断抽取、json结构化、完整性、综合性几个维度都是考量标准。
陶东杰称:“我们对比了被称为闭源天花板的gpt4和开源的chatglm2等开源模型,发现gpt4的诊断抽取会正确,但是比较啰嗦。而开源的模型其实表现都还是不太行的。”最终,蚂蚁的做法是和上海市一医院一起微调了数据模型,发现这样可以在几个维度上均衡表现不错,小样本测试显示,其准确率可以达到90%以上。在近日举办的2024世界人工智能大会上,支付宝多模态医疗大模型正式发布。据介绍,基于蚂蚁百灵大模型的多模态能力,该模型支持千亿级别参数医疗视觉识别。
最终效果上,通过大模型生成电子病历,上海市一医院能将原本5到10分钟的工作时长缩减到15至20秒。也就是说,原本一天8个小时的病历书写时间,现在可以浓缩至25分钟,效率增长了近20倍。
孙晓东表示:“让医生能从繁琐的文书工作中解脱出来,我们希望让他们有更多的时间回归临床本质。”接下来,上海市一医院还要开展电子病历质控的工作,意图将三甲医院高水平医生的经验积累下来,未来推广至基层医院等医疗资源欠发达的地方。
即使没有生成式ai在近一年多来的大热,ai 医疗也已在全流程发挥越来越大的作用,并持续稳定地吸引着资本市场的关注。
每至年中和岁末,行业内总会浮现出轻微的焦躁和期待,手机厂商们也不例外,总习惯弄出点动静,比如搞搞联名,或是包装包装线下旗舰店——上点价值,带点产品。
近期,济民医疗(603222.sh)先是四连板涨停,随后又连续下跌3日,其中包含2个跌停板,其股价的剧烈波动引起监管层和投资者的高度关注。
刚刚结束的清明假期,虽然只有短短三天,但医疗行业仍然“热闹”,先后共有4家医疗企业折戟ipo,领域涉及医美、肿瘤早筛、创新器械和ivd。
高傲的苹果,如今也不得不来蹭下ai的风口。今年一季度,苹果手机销量暴跌9.6%。压力下,pc业务成为苹果的救命稻草。而从国内的华为、联想,到海外的微软、英特尔、amd,谁都不能对ai pc市场打开的市场空间掉以轻心。
力大飞砖卷研发,到向下竞低卷价格,全球视野下的大模型与生成式ai已然走过创新扩散的兴趣阶段,行至社会评估其创新可行性的卡点。