生成式人工智能近年来受到广泛关注,作为人工智能的一个分支,其能够模拟人类思维创造出新的内容,而不仅仅是分析或处理现有数据。近日,商汤科技联合行业合作伙伴,结合生成式人工智能和医疗图像数据的多中心联邦学习发表的最新研究成果《通过分布式合成学习挖掘多中心异构医疗数据》(Mining Multi-Center Heterogeneous Medical Data with Distributed Synthetic Learning),登上国际顶级学术期刊《自然》(Nature)子刊《自然-通讯》(Nature Communications)。《自然-通讯》是一本完全开放获取的综合性期刊,发表自然科学各个领域的高质量研究成果,影响因子为16.6。
论文收录结果公布
论文提出一个基于分布式合成对抗网络的联邦学习框架DSL(Distributed Synthetic Learning),可利用多中心的多样性医疗图像数据来联合学习图像数据的生成。该分布式框架通过学习得到一个图像数据生成器,它可以更灵活地生成数据,这些生成数据可以替代多中心的真实数据,用于下游具体机器学习任务的训练,并具备较强的可扩展性。
伴随大模型的快速发展,Model as a Service(MaaS,模型即服务)概念也日渐兴起。MaaS的大模型需要从海量的、多类型的数据中学习通用特征和规则,从而具备较强的泛化能力。DSL框架能够在保护数据隐私的同时巧妙解决医疗大模型训练中常见的数据量不足的瓶颈,可有效赋能MaaS的大模型训练,为医疗大模型的开发迭代带来重大突破。在这一技术的支撑下,商汤的“医疗大模型工厂”能够帮助医疗机构更高效、高质量地训练针对不同临床问题的医疗大模型,使大模型在医疗领域的应用半径得到进一步延伸。
兼顾隐私保护和数据共享
创新联邦学习模式打造“数据生产工厂”
深度学习模型需要大量且多样性的数据“喂养”,但医疗领域对用户个人隐私保护有着极高的要求,这使得用于模型训练的医疗数据,在多样性和标注质量上都受到限制,也使多中心的医疗数据收集和医疗AI模型的开发迭代面临较大的挑战。
如何调和隐私保护和数据共享协作的矛盾?近几年兴起的“联邦学习”提供了全新的解题思路。联邦学习是一种分布式的机器学习方法,可以在不共享数据的情况下对多中心的数据进行联合建模,在保证数据安全的同时联合学习某一特定应用模型。
与主流的联邦学习模式不同的是,DSL框架的学习目标是数据生成器,而非具体应用的任务模型。该分布式架构由一个位于中央服务器的数据生成器和多个位于不同数据中心的数据鉴别器组成。在学习过程中,中央生成器负责生成“假”的图像数据,并发送给各个数据中心,各个数据中心用本地的真实数据和收到的“假”数据进行对比后将结果回传给中央服务器,并基于反馈结果训练中央生成器生成更仿真的图像数据。分布式的合成学习结束之后,中央生成器可以作为“数据生产工厂”,根据给定的约束条件(标注)生成高质量仿真图像数据,从而得到一个由生成数据组成的数据库。
该数据库可以替代真实数据,用于下游具体任务的学习,使下游模型的更新迭代不再受到真实数据可访问性的制约。同时,该方法通过分布式架构和联邦学习方式保证中央服务器无需接触数据中心的真实数据,也不需要同步各中心的鉴别器模型,有效保障了数据安全和隐私保护。
DSL框架包含一个中央生成器和多个分布式鉴别器,每个鉴别器位于一个医疗实体中
经过训练的生成器可以作为“数据生产工厂”,为下游具体任务的学习构建数据库
赋能MaaS新生态发展
为医疗大模型开发迭代按下加速键
DSL框架已通过多个具体应用的验证,包括大脑多序列MRI图像生成及下游的大脑肿瘤分割任务,心脏CTA图像生成及下游的全心脏结构分割任务,多种器官的病理图像生成及细胞核实例分割任务等。在可扩展性方面,该方法还可支持多模态数据中缺失模态数据的生成、持续学习等不同场景。
在瑞金医院的展区,SenseCare®肝脏手术智能规划系统凭借高效精准的病灶检出、三维重建、手术规划等功能,吸引不少观众驻足。从二维的肝脏CT影像,变为一目了然的三维立体模型,只需短短几分钟。轻轻拖动鼠标,就可在模型上自定义切面、角度、血管离断位置等,帮助医生几分钟内完成精准的肝脏手术规划。
不同应用中生成数据示例:(a)心脏CTA,(b)大脑多模态MRI,(c)病理图像
生成的数据构成大数据库可用于下游具体任务模型的学习,例如:(d)全心分割,(e)脑肿瘤分割,(f)细胞核分割
DSL框架的构建,也有利于推动MaaS服务模式的发展。MaaS的医疗大模型在数据学习过程中,同样会遇到医疗数据隐私安全保护的问题,而基于DSL框架,可以有效地从多中心多样性数据中建立数据集仓库,通过生成数据,在保障数据安全和隐私的同时为大模型的开发迭代提供创新思路。
细化到具体应用场景,DSL框架可助力医疗机构高效开展跨中心、跨地域模型训练工作。不同区域医疗机构在疾病数据多样性方面存在明显的地域性差异,过去受限于数据安全和隐私保护的要求,使用跨中心医疗数据联合训练医疗模型难度较大。而借助DSL框架,有望帮助医疗机构更加高效便捷地开展跨中心医疗模型训练。
在此前的世界人工智能大会(WAIC)上,商汤科技与行业伙伴合作,推出了医疗大语言模型、医疗影像大模型、生信大模型等多种垂类基础模型群,覆盖CT、MRI、超声、内镜、病理、医学文本、生信数据等不同医疗数据模态。并展示了融入医疗大模型的升级版“SenseCare®智慧医院”综合解决方案,以及多个医疗大模型落地案例。借助商汤大装置的超大算力和医疗基础模型群的坚实基础,商汤科技得以化身“医疗大模型工厂”,帮助医疗机构针对不同临床问题高效训练模型,甚至辅助机构实现模型自主训练。
WAIC期间商汤科技展示了大模型在医疗领域的多个落地应用案例
随着DSL框架的推出,医疗大模型的训练将有望突破“数据孤岛”的桎梏,一定程度上降低了医疗大模型的训练门槛,有助于加速模型开发迭代,使医疗大模型的应用范围得以进一步延伸,覆盖更多临床医疗问题。未来,商汤科技将持续聚焦医疗机构的多样化需求,推动医疗大模型在更多医疗场景的落地,更好地助力医院智慧化转型及高质量发展,助力普惠医疗的实现。
来源:医谷网
为你推荐
资讯 国家药监局进一步明确《Q12:药品生命周期管理的技术和监管考虑》国际人用药品注册技术协调会指导原则的适用问题
对于ICH Q12中提供的监管工具批准后药学变更管理方案(PACMP),国家药监局药品审评中心已发布《化学药品批准后药学变更管理方案技术指导原则(试行)》,并将根据国际上执行IC...
2025-12-20 10:46
资讯 特朗普宣布与安进、BMS等九家跨国药企达成协议,药价大幅降低
据当地时间周五美国白宫发布的消息,美国总统特朗普宣布与九家制药公司达成协议,这是一系列相关协议中的最新一批,这些协议旨在以降低部分美国人的药品价格来换取三年关税宽限期。
2025-12-20 10:29
资讯 备思复联合帕博利珠单抗显著改善肌层浸润性膀胱癌患者的生存期,无论患者能否耐受顺铂
思复联合帕博利珠单抗成为首个且目前唯一不含铂类化疗的治疗方案,在顺铂耐受肌层浸润性膀胱癌患者膀胱切除术前后使用中,可改善无事件生存期和总生存期
2025-12-19 15:37
资讯 我国60岁以上听损老人逾2000万
60岁及以上老年人群的听力损失患病率在各个年龄段当中居于首位,高达11 04%,据此推算,我国患听力损失的60岁以上老年人至少2000万人。约1 3的65岁以上老年人伴有听力残疾,约...
2025-12-18 21:44
资讯 中国低卫生资源地区宫颈癌综合防控项目在内蒙古敖汉旗落地,筑牢抵御宫颈癌的防线
由中国癌症基金会发起、默沙东(默沙东是美国新泽西州 肯尼沃斯市默克公司的公司商号)支持的中国低卫生资源地区宫颈癌综合防控项目于内蒙古自治区赤峰市敖汉旗正式落地
2025-12-18 16:23
资讯 安斯泰来将在2026年ASCO胃肠道癌症研讨会(ASCO GI)上公布其胃肠道肿瘤产品管线的最新临床数据
2期ILUSTRO研究评估佐妥昔单抗三药联合方案用于一线晚期胃癌和胃食管结合部(G GEJ)癌的队列结果入选最新突破性口头报告
2025-12-18 12:53
资讯 加强基层医疗卫生机构儿科、妇科、康复医学科、精神(心理)科、五官(口腔)科等特色科室建设
在加强基层医疗卫生机构全科医疗科、中医科、预防保健科等业务及医技科室建设的基础上,综合考虑辖区居民健康需求、人口老龄化、区域医疗卫生资源布局等因素,重点加强若干临床...
2025-12-17 20:03
资讯 复星医药14.12亿元收购绿谷医药,要再启“九期一”
12月15日,复星医药发布公告称,控股子公司复星医药产业拟出资共计14 12亿元控股投资绿谷医药。资金来源为拟以自筹资金支付本次收购的对价。
2025-12-16 22:40
资讯 安领科生物完成近 5000 万美元 A 轮追加融资,加速 ADC 全球临床与技术平台创新
本轮融资由老股东君联资本与新晋投资方美团龙珠联合领投,蓝驰创投、元生创投、五源资本等多家知名新老股东跟投
2025-12-16 11:28
资讯 华东医药“双喜临门”!GLP-1/GIP双靶点减重药II期数据亮眼,MUC17 ADC创新药获FDA孤儿药认定
创新多肽类人GLP-1(胰高血糖素样肽-1)受体和GIP受体(葡萄糖依赖性促胰岛素多肽)的双靶点长效激动剂HDM1005注射液在体重管理适应症中国II期临床试验中取得了积极结果
2025-12-15 17:13
资讯 自2028年起,每年3月底前完成上年度清算,国家医保局发布《医保基金清算提质增效三年行动计划》
自2028年起,实现每年3月底前完成上年度清算,清算资金占年度医保基金拨付的3%左右,推进季度清算等创新模式。
2025-12-15 10:29














