自从ChatGPT横空出世以来,大语言模型成为整个人工智能行业的高频词。从大语言模型的特征分析,其先进的算法、规模庞大的参数、精准强大的语言理解能力、生产能力和逻辑推理能力,已经有足够的潜力给医疗领域带去深远影响。无论是与自然语言相关的病历信息记录与检索系统,还是临床诊疗决策辅助支持,都将因大语言模型的产生为提高患者就医体验,提升医生诊断效率,提效临床数据治理提供全新的可能性。有数据显示,尽管不同背景创业者和投资人看到的医疗未来并不相同,但对大语言模型能够给医疗行业带来的变化,“颠覆性”、“赋能”、“变革”成为常见的关键词。
联仁健康医疗大数据科技股份有限公司(以下简称“联仁健康”)作为由国家卫健委统一部署的专业的健康医疗大数据企业,基于多年数据科技能力沉淀,进行深度的数据挖掘、清洗和分析,持续探索医疗大数据质量提升、医院数据资产化实践等领域,实现数据医学价值挖掘放大以及商业价值延伸。联仁健康创新数据治理模式,充分运用大数据、云计算、人工智能等先进技术,形成高度自动化数据处理能力,构建“仁云、仁数、仁医、仁芯、仁康”五大科技平台,从医疗数据专属云、大数据平台、医学知识体系、人工智能能力等多方面支撑医疗大数据的应用,实现技术与行业的深度融合。
医学临床数据治理,难在哪?
电子病历在现代医疗系统中扮演着至关重要的角色,为医疗机构提供了大量的患者信息和医疗记录。病历信息结构化处理是医院信息化和医疗智能化发展的重要环节,是使计算机能像医生一样进行诊断和判断的基础。然而,电子病历中对以自然语言文本描述的非结构化数据进行的关键信息提取并非易事,例如不同医院、科室甚至医生的记录风格和用词可能不同,文本信息之间可能存在复杂的关联性和依赖性,同一个描述可能在不同上下文中有不同的含义等等。随着医疗数据的快速积累和多样性,传统的数据治理方法面临着挑战。数据的复杂性和巨大量使得数据的结构化变得非常困难。
一方面,病历信息的语义环境复杂且结构细碎,呈现异构性和难互通特征,使得数据的完整性、一致性和准确性都难以保证;另一方面,由于标准化认知和遵循不足,医学术语标准化程度不高,导致大量信息资料无法检索,统计结果将缺乏普遍性和客观性。同时,数据质量管理体系建设较为滞后,缺乏专业化的数据治理组织机构以及明确的责任人体系,尚未形成良好的决策机制和管理机制,使得数据质量和共享水平亟待提升。可以说,电子病历数据的规模化、复杂性、多样性、动态性、非标化都是医学临床数据治理的绊脚石。总而言之,在医疗这一特殊领域,必须突破数据治理技术的“卡点”,才能充分发挥数据的价值,实现数据价值的最大化利用以及信息化技术和临床知识的有机融合。
联仁健康的临床数据治理技术,强在哪?
针对电子病历进行数据的治理,联仁健康引入大模型技术,从自然语言结构化,医学术语标准化,数据质量规范化三个方面,着力降低数据治理成本,落实数据治理规范,稳定数据治理质量。从而形成全新的数据后治理模式。
·大模型让电子病历文本结构化更高效
电子病历数据后治理的第一步便是对大段文本进行信息提取,包括从入院记录、出院小结、手术记录、病程记录等提取医生需要的临床指标数据。与直接提取词语的实体识别技术不同,医学文本结构化需要大模型理解这段文本,然后输出这段文本中的对应信息,进而将非结构化的输入最终转化为结构化输出。
大语言模型本质上是一种生成式模型,在生成文本时,即便是目前最优秀的GPT-4也会生成非预期的输出(幻觉现象),这为实际应用带来了潜在风险。为了缓解这个问题,联仁健康采用多种干预策略,除了在模型侧使用对齐调整策略,并使用多种提示词优化入参,同时还会基于业务逻辑对输出结果进行校验。联仁健康自研的这款文本结构化大模型,无需对数据指标进行预设或额外标注,即可低成本、智能化输出结构化信息简化传统数据治理流程。
·大模型让医学术语标准化更精准
其次,为了满足医学术语标准化,即使用医学词汇表和标准化组织的术语和定义,如医学主题词汇(MeSH)、国际疾病分类(ICD)、国家医保和国家药监发布的药品、诊疗项目、耗材目录等,更进一步保证医学数据可以更好地被用于统计分析。
大语言模型在计算资源有限的情况下并不适合直接用于术语标准化,但是利用大语言模型对文本信息的总结和摘取能力,可以让其在诊断相关的输出与医生的表达方式基本一致,再将其输出输入给联仁自研医学术语标准化算法,可以得到更精准的医学术语归一化结果。
通常,应对术语标准化所采取的技术方案框架是“多路召回+精排”。然而在实际业务落地场景中,不但存在“一对多”的情况,而且各院方在部署资源和反馈时效上也有限制要求。因此联仁健康将技术方案框架优化为“实体识别+向量编码+快速检索”。同时还要引入模型量化加速技术,以适配不同的业务场景需要。该方案可支持包括实时处理单条数据、实时处理小批量数据、离线批量处理数十亿级数据等常见场景,平均单条数据处理毫秒级响应,支撑院内应用的可及性。通过引入大模型,可以基于原始数据生成归一化数据,践行医学数据标准的落地,从而使数据治理输出的临床指标更规范。
大模型让数据质控更稳定
高质量的真实世界数据(RWD)有助于得到可靠、可信的分析结论。数据质量评估的目的是基于数据的不同临床应用任务需求,对数据收集过程中每个步骤可能产生的错误进行发现和溯源,其本质是对电子病历文本所包含医学知识的理解和评审。
联仁健康的规则引擎融合行业规范基础规则、专家学术经验规则和临床推理内涵规则三层标准,可对质控深度、规则广度、编码版本、扣分标准和数据读取方式等多维度进行有效配置。联仁健康利用大语言模型从两个方面提升数据质控质量。在构建质控规则引擎方面,利用大语言模型解析药品说明书、临床路径、政策规范等,快速构建先验专家质控知识库,同时在真实临床文本数据中挖掘诊断、手术、药品、耗材、治疗项目之间的关联度,构建后验真实世界质控规则。在质控应用方面,与数据归一化类似,借助大语言模型语言理解能力提取的关键审核信息可以直接与质控规则引擎对接,根据后台配置的分数规则给出量化评分,列出扣分原因,同时显示审核结果问题点和参考依据,进一步稳定数据治理的工程质量。
医学临床数据治理大语言模型,未来发展方向
联仁健康带来的全新数据治理模式通过对大语言模型的语言理解能力挖掘、个性化应用和技术加持,能够使其更好地适应医疗行业的特点,进而可以实现医疗各垂直领域的数据治理目标,不仅极大提高数据治理效率,还提升了治理过程的灵活性,让终端用户按需治理,高效开展数据搜索、数据分析和数据应用。毋庸置疑,大模型数据后治理模式有着实施部署更快,运营成本更低,技术升级更灵活的优势。
近年来,随着医疗数据集的快速扩张、硬件设备的迭代升级、算法模型的优化改进,AI在医疗场景中技术积累越发成熟,应用场景日益丰富。联仁健康基于深度学习算法和核心技术壁垒,同时结合由海量临床研究数据等积累的医学知识体系和科技工具进行定制开发,在电子病历结构化治理、临床决策支持等方面成功地实现了大语言模型在医疗业务场景新的技术落地和应用。
未来,随着大语言模型的不断发展,其能力将逐步覆盖联仁健康更多的产品和服务之中。联仁健康也将不断探索其在提升医疗服务水平和提升患者获益方面的潜力,助力健康中国建设。
来源:医谷网
为你推荐
资讯 国产口服小分子GLP-1减重适应症完成III临床试验,即将申报NDA
5月18日,成都闻泰医药科技股份有限公司宣布,公司自主研发的每日一次口服小分子GLP-1受体激动剂VCT220片,在中国超重或肥胖受试者中的关键Ⅲ期临床试验取得积极顶线结果,计划...
2026-05-19 18:07
资讯 辐联科技完成超 10 亿人民币融资,加速核药临床开发与全球同位素产能布局
本轮融资由全球医疗健康投资机构维梧资本领投,辐联科技战略合作伙伴 SK Biopharmaceuticals 以及成为资本、红杉中国、佳辰资本、楹联健康基金、Plaisance、Sky9、TSG 资本等多家优质机构跟投。
2026-05-19 18:02
资讯 重磅,哪些药械产品纳入白名单,各省要在2026年9月底前统一建立定点零售药店职工医保个人账户支付白名单制度
5月19日,国家医保局官网发布《国家医保局办公室 财政部办公厅关于进一步加强定点零售药店职工基本医疗保险个人账户使用监督管理的通知》,提出要建立定点零售药店职工医保个...
2026-05-19 10:52
资讯 3D打印、能量器械、影像引导、手术器械臂、远程医疗,全国首家!湖南省发布辅助操作类医疗服务价格
湖南省医疗保障局5月14日发布《关于规范整合手术和治疗辅助操作类医疗服务价格项目的通知》,打通了新技术、新设备进入临床应用的关键一公里。
2026-05-18 21:43
资讯 欧洲肥胖大会最新研究:口服减重药orforglipron为长期体重管理提供新思路
5月12至15日,欧洲肥胖大会举行。多国专家反复强调一个事实:肥胖不是简单的意志力问题,而是一种受遗传、代谢、激素、行为和环境等多重因素影响的慢性疾病。
2026-05-18 17:26
资讯 创新医疗器械鼻中隔可吸收钉固定器获批
近日,国家药品监督管理局批准了合肥启灏医疗科技有限公司“鼻中隔可吸收钉固定器”创新产品注册申请。该产品由固钉器和固定钉组成,适用于鼻中隔手术时对合软组织,并连接组织...
2026-05-18 15:55
资讯 达安基因成为广药集团体系成员,股价今日涨停
5月15日,达安基因发布公告披露了公司间接控股股东变更事项的最新进展。相关方已正式签署控股权收购协议,广药集团全资子公司广州广药资本有限公司将成为新的间接控股股东,本次...
2026-05-18 15:49
资讯 首部《IgA肾病临床实践60问》共识正式发布:填补我国IgA肾病实操指南空白
5月14日,在第六届全球华人肾脏病学术大会暨第十三届肾脏病学新进展西湖论坛上,首部《IgA肾病临床实践60问(2026版)》专家共识正式发布
2026-05-18 10:49
资讯 跨越“研发荒漠” 再造增长引擎:罗氏神经科学“金名片”亮相,百年积淀引领千亿蓝海
自1920年代罗氏研发出第一款安眠药爱露耐耳起,罗氏便在神经科学领域埋下了创新的火种。
2026-05-17 19:41
资讯 高原高血压纪录片《高山的回响》云端首映,多方携手共筑高血压防治创新体系
5月17日是世界高血压日,适逢高血压关爱月重要节点,在国家卫生健康委员会的战略指引下,由健康中国研究中心指导、央视网出品、美敦力公益支持的人文纪录片《高山的回响》正式云...
2026-05-17 19:34
资讯 性质严重,益丰大药房和老百姓大药房被国家医保局公开谴责
5月16日,国家医疗保障局发布公告,针对湖南怀化、邵阳、衡阳、株洲及河南郑州等地定点零售药店违规使用医保基金问题开展专项飞行检查,并正式约谈老百姓、养天和、益丰、河南张...
2026-05-17 17:24
资讯 第12批国家药品集采开始信息预填报,共涉及76个产品
5月15日,国家组织药品联合采购办公室发布《关于开展国家组织药品集中带量采购相关药品信息预填报工作的公告》,标志着第12批国家组织药品集中带量采购开始拉开帷幕。
2026-05-16 17:30
资讯 药品试验数据保护9问?为什么中药不适用于数据保护制度? 国家药监局发布 《药品试验数据保护实施办法》
数据保护是指,符合条件的化学药品和生物制品获批上市时,国家药监局对申请人提交的自行取得且未披露的试验数据和其他数据实施保护,给予最长不超过6年的数据保护期。数据保护期...
2026-05-15 18:16
资讯 博腾股份首个欧洲基地遭诺华单方面节约
5月13日,博腾股份(300363 SZ)发布《关于对外投资进展及重大风险提示的公告》,根据公告,其位于斯洛文尼亚的研发生产基地遭到诺华公司(Novartis)的单方面解约,诺华单方要...
2026-05-15 14:43
资讯 甘李药业先后两款胰岛素产品在欧盟获批
5月14日晚间,甘李药业发布公告称,甘李药业股份有限公司及其欧洲全资子公司甘李药业欧洲有限责任公司(Gan&LeePharmaceuticalsEurope GmbH)于近日收到欧盟委员会(EuropeanCo...
2026-05-15 12:00
资讯 2026年度国家医保基金飞行检查正式全面启动
5月14日,国家医保基金飞行检查湖南现场启动会暨警示教育会在长沙召开,这标志着2026年度国家医保基金飞行检查正式全面启动。国家医保局党组成员、副局长黄华波出席会议并讲话。
2026-05-15 08:29
资讯 泰格医药实控人被立案,还拖累了哪些上市公司
5月12日晚间,国内CRO龙头企业泰格医药(300347 SZ;3347 HK)发布公告称,公司实际控制人叶小平、曹晓春收到中国证监会《立案告知书》,二人因涉嫌持股变动相关信息披露违法...
2026-05-14 18:11








