基于电子病历的医疗大数据现状与未来

医疗健康 来源:中国数字医学 作者:徐华
2015
07/10
16:50
中国数字医学
作者:徐华
医疗健康

随着电子病历系统在医疗机构的迅速普及,大量医疗相关的重要信息以电子形式存储于医疗信息系统中。经过不断积累,各种形式的电子化医疗系统产生了体量庞大的医疗大数据。这些数据记录了临床医疗中的重要信息,例如,病人的主诉,检测结果,诊断信息,服用药物,以及不良反应等。医学信息学研究人员通过对海量医疗数据的分析可以发现与医疗质量,医疗安全以及药物效果相关的重要证据,从而提高公共医疗的质量和效率,加强医疗安全,并促进新治疗方法和药物的研发。根据麦肯锡发布的全球医疗机构分析报告,到2020年,医疗大数据分析市场将为全球节约1900亿美元。但是,使用临床数据进行科学研究需要解决一系列有关医疗信息采集,信息安全,数据整合以及分析方法等重要问题。本文从介绍美国医疗数据分析现状出发,对医疗大数据分析相关的关键技术和重要应用进行深入探讨。文章最后对医疗大数据分析的发展进行了总结和展望。

美国电子病历数据分析现状

临床电子病历数据(泛指医院所有医疗信息系统的总集,包括HIS, 医生报告, 医嘱,化验等系统)是医疗大数据的最重要的组成部分。 电子病历系统在美国普及较早,很多大型医疗机构积累了长达10年以上的电子病历信息。除了医院积累的电子病历信息,美国的医疗大数据还包括保险公司索赔记录,药房记录,政府医疗救助等多种来源的医疗信息。医院,保险公司,政府医疗救助部门以及大学的科研机构等,都有科研人员和团队进行医疗大数据分析。另外,各大制药厂也通过医疗大数据进行药物效果分析和药物重定向研究。

2011年,为了推动使用医疗信息技术来提高医疗质量和减少医疗成本,美国医疗保障和医疗救助中心(Centers for Medicare & Medicaid Services,CMS) 起草并实施了“电子病历应用激励计划”。CMS通过制定电子病历系统的功能规范,评估医疗机构是否达到有效使用的标准。达标的医疗机构可以从CMS获得电子病历应用专项推动资金。CMS寄希望于这项激励计划推动“有效使用 (meaningful use)”电子病历数据来提高医疗水平的效果。所谓“有效使用”是指通过使用电子病历数据来:1)提高医疗的质量,安全性和效率;2)使病人和病人家庭充分参与到医疗中;3)提高医疗机构的协作能力;4)提高公共医疗水平;5)维护病人医疗信息的隐私和安全。该计划通分三个阶段进行。第一个阶段(2011-2012)旨在“加强数据采集和共享”,第二阶段(2012-2014)目标是“优化临床服务流程”,第三阶段(2014-2016)的最终目标是“提高医疗服务质量”。美国国家卫生研究院(National Institute of Health)和其他政府机构也同时资助了一系列研究项目来推动使用电子病历进行临床医学的研究。例如,临床和转化医学项目(CTSA by NIH),电子病历基因组计划(eMERGE by NIH),战略性先进医疗信息研究计划(SHARP by ONC),以及临床医学数据研究网络(CDRN by PCORI)等。

以此为契机,生物医学信息学在美国得到了快速发展. 生物医学信息学是一门以提高人类健康为目的的新兴交叉学科,它学习和追求对生物医学数据,信息,和知识的有效使用来解决科学问题和提供决策支持,是医疗数据分析的原动力。 目前,提供医学信息学学位的学校和研究机构在全美迅速普及。在美国医学信息协会的主导下,生物医学信息学的研究逐渐成为当前的医学和计算机科学的研究热点。

医疗大数据分析技术

对采集到的海量医疗数据进行分析存在许多挑战。首先,医疗信息系统通常不是为了科研和数据分析设计的。从数据分析的角度看,医疗数据通常比较复杂,数据的异构度较大,存在很多缺失信息和不一致信息。其次,理解医疗数据通常需要不同领域的知识,包括医学,生物统计学,流行病学和信息学等。在某些涉及基因疗法的医学数据中,还需要有基因学背景的领域专家。对于海量医疗数据,分布式计算平台的支持也必不可少。因此,医疗大数据分析需要一系列技术和方法的支持。本小节就其中一些关键的技术进行简介。

医学术语和本体知识库

医学术语提供了标准化描述并减少歧义的医学术语,而医学本体知识库进一步提供了标准化且一致的医学本体词汇来描述医学概念和概念之间的关系。通过使用医学术语和本体知识库,复杂、异构的医疗数据之间可以相互交流, 使后续的科学分析得以进行。在美国,常用的医学术语和医学本体知识库包括“国际疾病分类(International Classification of Diseases)”,“CPT医疗服务(操作)编码系统(Current Procedural Terminology)”“医学系统命名法-临床术语(SNOMED CT)”以及“检测指标标识符逻辑命名与编码系统(LOINC)]”等。一体化医学语言系统(The Unified Medical Language System-UMLS)是美国国立卫生研究院经过20年的积累和开发完成的一个大型医学本体知识库。它集成了大部分常用的医学术语词典和本体库 (137个), 是医学信息学领域最广泛使用的医学本体知识库之一。

医学自然语言处理

由于大量详细的病人信息以文本形式存储,而文本描述的信息通常存在歧义和很多非标准化描述,如何把这些非结构化数据转化为统一的结构化数据是医学信息处理的重要步骤。自然语言处理是解决方案之一。 将非结构化医疗数据转化为结构化数据需要一系列医学自然语言处理技术,包括:“医学名实体识别”,“名实体自动编码”,“名实体修饰词识别”,“时间信息抽取”等。作为信息抽取的关键技术,医学信息抽取一直是医学自然语言处理 的研究热点。美国国立卫生研究院资助的i2b2中心曾经组织了多次国际范围内的医学信息抽取测评任务,推动了电子病历语料标注和医学自然语言处理的发展。

医疗数据模型和软件

为了有效提高后续数据的分析, 把临床医疗数据转化成研究用的数据模型是当前普遍的方法之一。目前,常用的医疗数据模型有: SHARPn项目开发的数据标准化流程(使用了 “临床元素模型(Clinical Element Model)”),PCORI 提出的“通用数据模型(PCORNET common data model)”,OMOP/OHDSI提出的“通用数据模型(OMOP common data model)” 等。除了数据模型, 美国科研人员还开发了不少支持临床数据管理和分析的软件。 其中以“I2B2”和“transSMART”最具代表。

医疗大数据分析应用

这里我们简单介绍一下和药物研究相关的几个临床数据分析应用:

药物警戒(Pharmacovigilance)

药物警戒是药物流行病学的一种,通过监测药物投放市场后的临床副作用,进行关联性研究。这就需要把病历数据中的药物治疗信息和不良药物反应提取出来, 进行关联形成分析。从而产生各种概率的分布,供药物安全性专家筛查和进一步分析提供线索。

疗效比较研究 (Comparative effectiveness research)

疗效比较研究的目的是为病人,医生,公共医疗政策制定者提供有效的信息来提高患者个人乃至整个公共医疗的质量。此类研究通常就几种可用治疗方案的优缺点进行对比,从医疗大数据中寻找相关证据。例如,通过对糖尿病病人的电子病历数据进行分析,比较发现不同糖尿病药物对不同年龄段的病人的治疗效果。从中医中药的角度看,大数据有助于慢性病人的管理,研究中药的适应症和禁忌症。

基于药物基因组学的精准医疗(Precision medicine)

药物基因组学是药理学的一个分支,研究基因变异如何影响个体对药物反应,包括疗效和不良反应。由于医疗技术发展的限制,传统医疗通常通过传统的病理特征对病人制定治疗方案,还未深入到个体基因表达差异。随着人类基因组学和药物基因组学的发展,医疗技术的进步使得针对个体基因表达差异来制定更精准的治疗方案成为可能, 这就是精准医疗的概念。例如,通过对电子病历数据进行分析,相关研究发现由于基因差异导致病人对“华法林(Warfarin)”摄入剂量的不同产生不同的反应。带有某些基因变异的病人甚至会出现出血,乃至死亡。精确医疗可以根据个体基因的差异以及病人其它的身体状况制定算法来预测单个病人的华法林剂量。

结论与展望

医院系统的电子化积累了海量的医疗数据, 是支持临床医学研究的宝贵资源。但是快速而有效的医疗大数据分析还存着很多挑战和困难。生物医学信息学是支持医疗大数据分析的原动力。我们希望看到更多中文的基础性的医学信息学研究,尤其在标准化层面(比如中国的UMLS),从而为中国医疗大数据研究和产业化奠定坚实基础。

来源:中国数字医学   作者:徐华

为你推荐

阿斯利康最新披露:在中国或面临800万美元新罚款资讯

阿斯利康最新披露:在中国或面临800万美元新罚款

据相关报道,英国当地时间4月29日,阿斯利康在最新季度的财报会议上透露,就在华涉嫌非法进口药品一事,公司可能可能会在中国面临一项新的罚款。

2025-04-30 15:53

君合盟生物重组A型肉毒毒素临床试验双线突破,覆盖严肃医疗与消费医疗两大领域资讯

君合盟生物重组A型肉毒毒素临床试验双线突破,覆盖严肃医疗与消费医疗两大领域

用于成人中、重度眉间纹适应症的III期临床试验在组长单位北京大学第一医院正式启动并完成首例入组。针对成人脑卒中后上肢痉挛治疗的II期临床试验由复旦大学附属华山医院牵头并顺...

2025-04-30 12:39

海关总署关于进口阿根廷牛黄的检疫和卫生要求资讯

海关总署关于进口阿根廷牛黄的检疫和卫生要求

本公告中的牛黄是指来自于阿根廷共和国国内养殖牛的胆囊或胆管的干燥胆结石。

2025-04-28 22:10

股价只剩2毛,这家上市15年的A股药企要退市了资讯

股价只剩2毛,这家上市15年的A股药企要退市了

上市15年后,吉药控股最终还是走向了退市的结局。

2025-04-28 17:50

科塞尔医疗完成近亿元B+轮融资,加速血管介入器械全领域平台化布局资讯

科塞尔医疗完成近亿元B+轮融资,加速血管介入器械全领域平台化布局

本轮融资由国内知名投资机构铁投巨石领投,苏高新金控持续追加投资,园雍投资跟投,资金将用于核心产品研发、全球市场推广及产能扩建。

2025-04-28 16:54

一款印度企业的原料药被暂停进口资讯

一款印度企业的原料药被暂停进口

昨日(4月27日),国家药监局发布公告称,暂停进口印度企业VITAL LABORATORIES PVT LTD 地高辛原料药。

2025-04-28 12:52

凯西集团2024财年实现双位数营收增长,不断投资研发,聚焦可持续发展资讯

凯西集团2024财年实现双位数营收增长,不断投资研发,聚焦可持续发展

凯西集团(Chiesi Group)是一家以研发为基石的意大利国际制药集团,总部位于意大利帕尔马,业务覆盖全球31个国家和地区。在2024财年,凯西集团圆满收官,取得了强劲的财务业绩...

2025-04-28 11:29

别让肺结节成心结,肺健康清“结”公益行动在人民日报社正式启动资讯

别让肺结节成心结,肺健康清“结”公益行动在人民日报社正式启动

2025年4月27日,《爱肺行动》之别让肺结节成心“结”——肺健康清“结”公益行动,在北京人民日报社正式启动,由广东省钟南山医学基金会、江苏养无极药业有限公司发起,联合京东健康...

2025-04-28 10:26

耀速科技获数千万元战略投资,以“AI+器官芯片”助力新药研发资讯

耀速科技获数千万元战略投资,以“AI+器官芯片”助力新药研发

本轮资金将用于加速公司“3D-Wet-AI”闭环技术体系的建设,并推动国际合作及多场景商业化落地。

2025-04-28 10:01

被忽视的“经期头痛”,专家提醒频繁发作需及时就医资讯

被忽视的“经期头痛”,专家提醒频繁发作需及时就医

偏头痛是一种常见的慢性神经血管性疾病,不仅有中到重度的头痛症状,还常伴随多种复杂症状比如恶心、呕吐、畏光、畏声等。女性偏头痛的发病率是男性的2~3倍,约20%~25%的女性偏...

2025-04-28 09:42

126个药品在辽宁省主动降价资讯

126个药品在辽宁省主动降价

辽宁全省所有医疗卫生机构将于04月30日起执行新的挂网采购价格。降价产品设置采购过渡期,时间为1周。

2025-04-27 18:35

A股上市公司未名医药的核心子公司,被停产资讯

A股上市公司未名医药的核心子公司,被停产

4月24日晚间,未名医药发布公告称,4月22日,天津市药监局发布公告,对公司控股子公司天津未名生物医药有限公司(以下简称“天津未名”)进行了药品GMP符合性检查。经综合评定、...

2025-04-27 11:34

瑞博生物港交所递表,小核酸药物龙头企业有望登陆资本市场资讯

瑞博生物港交所递表,小核酸药物龙头企业有望登陆资本市场

瑞博生物成立于2007年,专注于RNA干扰(RNAi)技术开发及小核酸药物产业化,是全球最早布局该领域的开拓者之一。

2025-04-27 10:36

Cytiva与中欧创新医药与健康研究中心签署全面合作协议资讯

Cytiva与中欧创新医药与健康研究中心签署全面合作协议

双方将携手在细胞治疗药物成果转化领域展开全面合作,推动大湾区生物医药产业的蓬勃发展,打造全球生物医药创新高地。

2025-04-25 19:49

精鼎医药任命 Charlotte Moser为公司首席医疗官,负责领导全球医学战略资讯

精鼎医药任命 Charlotte Moser为公司首席医疗官,负责领导全球医学战略

今日(4月25日),致力于为客户提供I至IV期全方位临床开发服务的跨国合同研究组织(CRO)精鼎医药宣布,公司已任命 Charlotte Moser博士出任首席医疗官。

2025-04-25 15:06

强生宣布锐珂(埃万妥单抗注射液)联合化疗方案在华获批,用于EGFR TKI经治后局部晚期或转移性非小细胞肺癌患者治疗 资讯

强生宣布锐珂(埃万妥单抗注射液)联合化疗方案在华获批,用于EGFR TKI经治后局部晚期或转移性非小细胞肺癌患者治疗

强生公司今日(4月25日)宣布,旗下创新治疗药物锐珂®(埃万妥单抗注射液)正式获得国家药品监督管理局批准,与卡铂和培美曲塞联合给药,适用于治疗携带表皮生长因子受体(EGFR...

2025-04-25 15:00

凶险的百日咳,发病率40年新高!专家:婴幼儿需“加速免疫”资讯

凶险的百日咳,发病率40年新高!专家:婴幼儿需“加速免疫”

2024年1至12月全国共报告百日咳近50万例,是2023年的12倍,跃升至近40年来的峰值。

2025-04-25 14:12

《新英格兰医学杂志》发布: 研究证实速福达可将流感病毒家庭传播概率降低32%资讯

《新英格兰医学杂志》发布: 研究证实速福达可将流感病毒家庭传播概率降低32%

罗氏全球今日(4月25日)宣布,速福达®(玛巴洛沙韦)III期临床试验CENTERSTONE研究详细结果在《新英格兰医学杂志》(NEJM)上发布。结果显示研究达到了主要终点:流感感染者单...

2025-04-25 13:34

阿斯利康携手本土创新力量,持续探索非小细胞肺癌联合治疗方案资讯

阿斯利康携手本土创新力量,持续探索非小细胞肺癌联合治疗方案

阿斯利康与石药集团、映恩生物和银珠医药三家本土生物医药公司正式签署临床研究合作协议

2025-04-25 10:58