医学影像大数据与人工智能的“前世今生”

医疗器械 来源:动脉网(微信号:vcbeat) 作者:郝雪阳
2016
09/21
09:57
动脉网(微信号:vcbeat)
作者:郝雪阳
医疗器械

从望闻问切到医学影像

正常情况下,人体内的器官和组织是无法用肉眼看见的。在古代,扁鹊、华佗等名医通过“望、闻、问、切”来诊断患者的内部病因,这是那个时代最“先进”的诊断方式。

公元1816年的某一天,法国医生雷奈克在街上散步,偶然看到几个小孩儿用一颗大钉敲击一根木料的一端,而其它的孩子则用耳朵贴在木料的另一端来听声音,这给了雷内克医生极大地启发。他回到家后,马上找人专门制作了一根空心木管,这便是人类历史上的第一个听诊器,后来,听诊器被广泛用到了心脏和妇产科领域。

到了近代,医生观察病人体内的状况,不再仅仅通过听诊器来解决。1971年,CT的问世标志着医疗影像学的正式建立,随着医学成像技术的进步,由放射科演变而来的医学影像科成为临床医学中发展最为迅速的学科,从传统的X光检查扩展到超声波、放射性核素显像、X-CT、MRI、数字化成像,以及当今最高端的PET-CT技术。医生借助这些新技术,来更加深入地“窥探”人体内部的病变情况。

影响数据的融合大师——PACS系统

医学影像设备的出现,让医疗机构的诊疗工作越来越多依赖医学影像的检查。传统的医学影像管理方法(胶片、图 片、资料)日积月累、年复一年存储保管,堆积如山,给查找和调阅带来了诸多困难,医院丢失影片和资料时有发生。传统的文件管理方式,已经无法适应现代医院中对如此大量和大范围医学影像的管理要求。

随着数据库技术和计算机通讯技术的发展,数字化影像传输和电子胶片应运而生。众多医院纷纷进行了医院信息化改革,随着影像设备逐渐更新为数字化和互联网的逐渐成熟,无胶片放射科和数字化医院成为了现实。关于电子胶片,我们将在下一篇文章里详细介绍,这里暂时先不细说。

为了对不同医学影像设备的信息化数据进行统一存储和管理,各平台数据的融合大师——PACS系统诞生了。

PACS系统英文翻译过来就是影像归档和通信系统的意思。它的主要任务是把日常产生的各种医学影像(包括核磁,CT,超声,各种X光机,各种红外仪、显微仪等设备产生的图像)通过各种接口(模拟,DICOM,网络)以数字化的方式海量保存起来,当医生需要它们的时候,便如同管家一般把数据快速调回使用,完美充当了各仪器之间的润滑剂的作用。

完整的PACS系统,主要功能由三个方面组成:一是图像的采集,二是数据的传输和存储,三是影像分析和处理。

影像的采集方式主要有三种:分别是纯数字采集、视频采集和胶片扫描。

而信息存储方面,PACS系统针对结构化数据和非结构化数据,采用了两种不同的方式来分别进行存储。使用数据库来管理病人信息等结构化数据,使用文件系统来管理图像资料等非结构化数据。就好比一个人带着行李去乘坐飞机,行李被托运进了行李舱,而人则坐在机舱内,两者各行其道、互不干扰。

此外,由于医学影像的数据文件往往较大,常规一次CT扫描为10MB量级,X光机的胸片可以到20MB,而心血管造影的图像可达80MB以上。传统的方式一般是利用服务器和光盘来进行存储,比较死板,难以进行功能扩展。而目前新兴的云计算云存储技术具有数据快速调用、网络共享与应用拓展等功能,与PACS系统相结合,将是未来影像存储的一大方向。

其原理也很简单:医院将PACS系统部署到第三方云平台,通过云平台的分布式、负载均衡的集群系统,实现全天候影像存储。云平台的建立,还可以实现跨平台、多终端、PC和移动设备的全面融合,进而彻底实现影像无纸化、无光盘化、无胶片化。

这种全新的模式,不仅提升了每一位医生的工作效率、工作质量,并且丰富了医生的协作工作场景。此外,医院也不用再去花重金购买服务器,从而减少繁琐的后期维护和扩容,以到达节省成本的目的。

OK!数据存储的问题解决了,但数据的标准化又成为了新的问题。虽然医院可以利用PACS系统来实现各类仪器之间的信息互通,但由于不同厂家的设备和不同PACS系统所使用的数据标准各不相同,让信息的采集和传递非常困难。就好比不同语言和国家的人遇到了一起,你讲你的ABC,我说我的吃了没。如何让这些不同国家、不同厂家的产品形成统一的标准,成为了最大的障碍。

这方面,美国人总是走在时代的前沿。1985年,美国放射学会ACR和美国国家电器制造商协会NEMA共同制定了一种规定数字医学影像和相关信息格式及信息交换方法的标准:医学数字成像和通信标准(digital imaging and communications in medicine),缩写为DICOM。DICOM的出现,重新定义了临床数据交换的医学图像格式。

在DICOM标准下,影像设备提供统一标准的影像数据给PACS系统。而对外通讯方面,PACS系统仍然使用DICOM,这样就形成了最大限度的统一。简单来说,就是让各家的仪器统一用一种接口,就好比我们将英语作为世界的通用语言。

1993年,DICOM顺利发展到了第三代,也就是DICOM 3.0标准。随着越来越多国家的医疗设备厂商宣布支持DICOM 3.0标准,DICOM 3.0逐渐成为了全世界医疗影像行业公认的标准。

PACS系统最初主要用于放射科,作为医院HIS系统的核心组成部分,在构建进入医院信息系统网络时普遍遵循HL7标准和IHE规范。随着HL7标准和IHE规范的不断完善,PACS已经从简单的几台放射影像设备之间的图像存储与通信,扩展至医院所有影像设备乃至不同医院影像之间的相互操作,因此出现诸多分类叫法,如Mini PACS(微型PACS)、科室级PACS、全院级PACS、区域PACS等。

Mini-PACS:是指只用在单一类型的影像设备,CT或者MRI等。

科室级PACS:放射科多台影像设备可实现影像、诊断报告共享。

全院级PACS :将全院各科室临床主治医师、放射科医师和专科医师以及各种影像、医嘱和诊断报告联成一网。

区域PACS:本地区、跨地区广域网的PACS网络。

科室级PACS系统示意图

总之,PACS系统的出现,既解决了图像的采集问题,又解决了数据的传输和存储问题,至于尚未提到的影像的分析和处理,我们在后面来详细说明,在此之前,先来了解下医学影像大数据。

我国医学影像大数据的形成原因

作为一个新名词,到底是先有医学影像大数据,还是先有医疗大数据,现在已经无从考证了。但要解释医学影像大数据,必然要搞清楚两点:一是医学影像大数据的定义,二是医学影像大数据的形成原因。

大数据的定义,是无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

IBM则总结了大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。

医学影像大数据,如果按照大数据的定义,是由DR、CT、MR等医学影像设备产生所产生并存储在PACS系统内的大规模、高增速、多结构、高价值和真实准确的影像数据集合。与医院信息系统(HIS)大数据、检验信息系统(LIS)大数据和电子病历(EMR)等同属于医疗大数据的范畴。

多结构和高价值这两点很好理解,是由日益增长的医疗影像设备种类所产生的具有医学分析和指导价值的结构化和非结构化数据。大规模和高增速,则需要从大环境来解释。

我国医学影像大数据的形成,主要有两方面的原因:一是市场,二是人口。

从市场规模来看,截止2015年6月,我国三甲医院数量为705家;CHIMA2014-2015年的数据显示,我国科室级PACS、多科室或院级PACE系统建设水平已经分别达到了60-70%和50-60%,基本覆盖国内一线城市的三甲医院。

从市场增速来看,我国PACS市场年均增速在25%以上。根据ACMR的调查数据,2012-2015年,中国PACS市场继续以20%以上的增速扩大。


而人口方面,影响医疗影像大数据的形成原因主要是人口基数和年龄的分布。据国家统计局第六次全国人口普查主要数据公报,全国总人口数约为13.7亿。从老年人口的增速和比例上看,截至2014年底,我国60岁以上老年人口已经达到2.12亿,占总人口的15.5%。据预测,到本世纪中叶,我国老年人口数量将达到峰值,超过4亿,届时每3个人中就会有一个老年人。

所以,目前PACS系统的普及率和人口数量的庞大,是我国医学影像大数据的大规模基础;而PACS系统和老龄人口的快速增长率是医学影像大数据的高增速的基础,这两者共同构成了我国医学影像大数据的形成原因。

作为大数据5V特征中的最后一环,医学影像大数据的真实性,应该通过何种方式去实现?这就要涉及到数据处理技术了。

数据处理和“鱼香肉丝”

简单来说,PACS系统从不同的影像设备收集到的数据在质量上往往参差不齐。而数据分析和输出结果的错误程度和可信度在很大程度上取决于收集到的数据质量的高低,所谓“垃圾进,垃圾出”,没有数据的准确性保证,大数据分析就变成了一纸空谈。

目前医学影像后处理方法主要包括两类,一类是直接处理技术口,对患者进行影像学检查后,直接采用软件技术对影像在影像设备上进行处理,例如在CT和MRI设备上进行血管成像等。这种方式的缺点比较明显,不能对影像进行改变,只能依靠医生依据自身的经验进行病理学处理,这就导致了数据结果的不准确性。

举个例子来说,当CT 图像遇到相互组织成像重叠时,普通的软件图像处理往往会将这些重叠的数据理解为噪声或者其它干扰信号,而医疗专家则需要保持图像上面边界或者目标轮廓的边界具有的几何保持纺射不变(简单来说就是保持图像的完整性),这就对医生的诊断带来了难以预料的困难。

除了影像设备软件处理外,还有一种方法,通过影像设备将影像数据传递给PACS系统,由PACS系统来对影像进行后处理。比如PACS系统通过多维影像融合(CT/MRI/PET-CT)技术,来对图像进行分割、配准和聚类,从而尽可能保存影像数据的真实性。

多维影像融合这项“黑科技”主要包括数据预处理、图像分割、特征提取以及匹配判断这几个过程。听上去可能让人感到有些懵逼,简单来说:数据预处理是指医学影像数据库中含有海量的、不同来源的原始数据, 其中带有大量模糊的、不完整的、带有噪声和冗余的信息。因此在数据挖掘前, 必须对这些信息进行清理和过滤, 以确保数据的一致性和确定性, 将其变成适合挖掘的形式。

我们很清楚,医学影像数据库里包含大量的图像数据。为了便于说明,我们把这些图像数据比作各种食材,将最终处理完成的信息比作鱼香肉丝这道菜。

数据预处理,可以把它想象成清洗食材的过程,要做鱼香肉丝这道菜,你得先把猪肉、胡萝卜、青椒乃至于葱姜蒜都一一洗净,滤掉残渣,留下精华,才能做接下来的步骤。这个阶段,包括图像去噪、增强、平滑、锐化等工作,统称为数据预处理。

“食材”清洗完毕后,就进入到图像分割和特征提取环节,这个环节我们可以假设为“食材”的切丝切段的过程。以国内知名医学影像公司汇医慧影为例,利用多维影像融合技术,通过器官形态模型,图像边缘特征模型,以及神经网络聚类模型,计算机自动将盆腔CT的膀胱,前列腺,直肠等自动分割(分割精度<2mm.),从而为后期的智能匹配和判断提供必备的图像处理工具。<>

最后一个环节,我们将经过前两道工序处理好的“食材”,和着葱姜蒜炒成一盘鱼香肉丝,这便是图像匹配和聚类的过程。这个阶段的PACS系统所依赖的核心技术为深度学习,也就是我们所说的人工智能,接下来,我们来了解下人工智能是如何应用到医学影像领域的。

不准确、缺口大,人工智能的出场背景

今年8月,国务院印发了《“十三五”国家科技创新规划》的通知,人工智能成为一大重点。《规划》明确指出,重点发展大数据驱动的类人智能技术方法;突破以人为中心的人机物融合理论方法和关键技术,研制相关设备、工具和平台;在基于大数据分析的类人智能方向取得重要突破,实现类人视觉、类人听觉、类人语言和类人思维,支撑智能产业的发展。

在我们探讨如何将人工智能应用到医学影像之前,先要搞清楚在没有人工智能的情况下,医学影像所面临的两个问题。

据动脉网了解,医疗数据中有超过90%的数据来自于医学影像,但是这些数据大多要进行人工分析。人工分析的缺点很明显,第一是不精确,只能凭借经验去判断,很容易误判。中国医学会的一份误诊数据资料显示,中国临床医疗每年的误诊人数约为5700万人,总误诊率为27.8%,器官异位误诊率为60%,恶性肿瘤平均误诊率为40%,如鼻咽癌、白血病、胰腺癌等,肝结核、胃结核等肺外结核的平均误诊率也在40%以上。

第二是缺口大,按照动脉网蛋壳研究院的数据,目前我国医学影像数据的年增长率约为30%,而放射科医师数量的年增长率约为4.1%,其间的差距是23.9%,放射科医师数量增长远不及影像数据增长。这意味着放射科医师在未来处理影像数据的压力会越来越大,甚至远远超过负荷。

这点从现阶段放射科医师的工作状况也能看出来,今年1月份,医学界曾对1241名医学影像医生做过调查,其中有一项数据很值得注意:有超过71%的影像医生期盼放射假的回归。

报告里的数据显示,有超过50%的医生工作时间在8小时以上,20.6%的医生每天平均工作时间超过10个小时,多位医生反映放射假有名无实。不少医生留言,希望有天能享受到被剥夺已久的放射休假和公休假,多陪陪家人!

那么,面对目前医学影像误诊率高、缺口大的问题,应该通过何种方式去改变呢?最好的答案,便是人工智能。

人工智能的黑科技——多层卷积神经网络结构

人工智能在医学影像的应用主要分为两个部分:第一个部分是图像识别,在前文我们已经作了说明;第二个部分深度学习,是人工智能应用的最核心环节。这两个部分都是基于医学影像大数据所进行的数据上的挖掘和应用。

2006年,神经网络领域的大师Geoffrey Hinton教授与其博士生在《Science》和相关期刊上发表了论文,首次提出了“深度信念网络”的概念。与传统的训练方式不同,“深度信念网络”有一个“ 预训练 ”(pre-training)的过程,这可以方便的让神经网络中的权值找到一个接近最优解的值,之后再使用“ 微调 ”(fine-tuning)技术来对整个网络进行优化训练。这两个技术的运用大幅度减少了训练多层神经网络的时间。他给多层神经网络相关的学习方法赋予了一个新名词–“ 深度学习 ”。

2012年,Hinton教授的研究团队参加了斯坦福大学Fei-Fei Li教授等组织的ImageNet ILSVRC大规模图像识别评测任务。该任务包括120万张高分辨率图片,1000个类比。Hinton教授团队使用了全新的黑科技多层卷积神经网络结构,突破性地将图像识别错误率从26.2%降低到了15.3%。 这一革命性的技术,让神经网络深度学习以极快的速度跃入了医疗和工业领域,这才有了后来一系列使用该技术的医学影像公司的出现。

比如国际知名的医学影像公司Enlitic和国内刚刚获得有峰瑞资本600 万天使轮融资的DeepCare。都是通过积累大量影像数据和诊断数据,来不断对的神经元网络进行深度学习训练,从而提高医生诊断的准确率。

以Enlitic公司开发的恶性肿瘤检测系统为例,它通过使用肺癌相关图像数据库 “LIDC(Lung Image Database Consortium)”和 “NLST(National Lung Screening Trial)”进行验证,结果发现,该公司开发的系统的肺癌检出精度比一名放射技师检查肺癌的精度高5成以上。

总而言之,人工智能结合医学影像的益处多多,患者、放射科医师、医院均能从人工智能的应用中受益。人工智能不仅能更帮助患者更快速地完成健康检查,包括X光、B超、核磁共振等。同时也可以帮助影像医生削减读片时间,提升效率,降低误诊的概率,通过提示可能的副作用来辅助诊断。

随着人工智能和医学影像大数据在医学影像领域的逐渐普及和应用,医学影像所面临的准确度和大缺口的问题便可以迎刃而解,两者的融合,将成为医学影像发展的重要方向。


来源:动脉网(微信号:vcbeat)   作者:郝雪阳

为你推荐

国家药监局、公安部、国家卫健委、国家医保局等7部门联合印发《医药代表管理办法》资讯

国家药监局、公安部、国家卫健委、国家医保局等7部门联合印发《医药代表管理办法》

这是自2020年9月国家药监局发布《医药代表备案管理办法(试行)》以来的首次修订。

2026-05-07 21:48

泽安生物完成3800万美元融资,加速推进“髓系细胞衔接器”免疫治疗管线 资讯

泽安生物完成3800万美元融资,加速推进“髓系细胞衔接器”免疫治疗管线

本轮融资由高瓴创投(GL Ventures)领投,一家国际主权财富基金大额跟投,博裕创投、五源资本、蓝驰创投等多家现有股东亦追加投资

2026-05-07 11:07

拜耳asundexian(BAY 2433334片)用于降低缺血性卒中或短暂性脑缺血发作成人患者的卒中(复发)风险的注册申请获国家药品监督管理局药品审评中心受理资讯

拜耳asundexian(BAY 2433334片)用于降低缺血性卒中或短暂性脑缺血发作成人患者的卒中(复发)风险的注册申请获国家药品监督管理局药品审评中心受理

用于降低缺血性卒中或短暂性脑缺血发作(TIA)成人患者的 卒中(复发)风险,不包含心源性栓塞性卒中患者”的上市申请已获国家药品监督管理局药品审评中心受理。

2026-05-07 10:48

全球首个CDK2/4/6抑制剂获批第二个适应症资讯

全球首个CDK2/4/6抑制剂获批第二个适应症

5月6日,中国生物制药发布公告,下属企业正大天晴自主研发的库莫西利胶囊(商品名:赛坦欣)获得国家药品监督管理局批准,联合氟维司群用于激素受体(HR)阳性、人表皮生长因子...

2026-05-06 18:13

蚂蚁阿福启动“健康中国体检关怀行动”,为1亿人免费解读体检报告资讯

蚂蚁阿福启动“健康中国体检关怀行动”,为1亿人免费解读体检报告

春季是传统的体检季,可很多人拿到体检报告却犯了难。一项5000名网友参与的调研显示,80%的受访者表示体检报告没有得到详细讲解,也不知道检后该怎么做;75%的受访者没有按体检...

2026-05-06 17:13

第28个世界哮喘日:儿童哮喘早识别、规范治疗,守护患儿健康呼吸资讯

第28个世界哮喘日:儿童哮喘早识别、规范治疗,守护患儿健康呼吸

进入5月,气温波动、花粉增多、呼吸道病毒活跃,哮喘也随之进入急性发作的高峰期。今年5月5日,恰逢第28个“世界哮喘日”——以“确保每位

2026-05-05 20:33

康方生物授权的Summit美股大跌资讯

康方生物授权的Summit美股大跌

2025年4月30日,美股上市公司Summit Therapeutics对外公布截至 2026 年 3 月 31 日第一季度财务业绩及业务进展,其中最受关注的无疑是从康方生物(09926 HK)获得授权的...

2026-05-05 20:02

对比,生物医学新技术临床转化应用审批工作规范征求意见稿与正式稿有哪些不同?资讯

对比,生物医学新技术临床转化应用审批工作规范征求意见稿与正式稿有哪些不同?

4月30日,国家卫健委官网正式发布《生物医学新技术临床转化应用审批工作规范(试行)》,与4月19日发布的征求意见稿有哪些变化?

2026-05-05 10:58

生物医学新技术与药品、医疗器械的界定资讯

生物医学新技术与药品、医疗器械的界定

4月30日,国家卫健委官网发布《生物医学新技术与药品、医疗器械界定指导原则(暂行)》。对于生物医学新技术与药品、医疗器械的操作边界进行指导。

2026-05-05 10:51

又一家药企被取消国家药品集采中选资格资讯

又一家药企被取消国家药品集采中选资格

4月30日,国家组织药品联合采购办公室发布公告,取消哈尔滨力强药业有限责任公司洛索洛芬钠凝胶贴膏中选资格并将该企业列入违规名单。

2026-04-30 15:19

国家药监局原副局长陈时飞被判14年资讯

国家药监局原副局长陈时飞被判14年

4月29日,上海市第二中级人民法院一审公开宣判国家药品监督管理局原党组成员、副局长陈时飞受贿案,对被告人陈时飞以受贿罪判处有期徒刑14年,并处罚金人民币400万元;扣押在案...

2026-04-30 10:08

黄果任国家药品监督管理局局长资讯

黄果任国家药品监督管理局局长

任命黄果为国家药品监督管理局局长,免去李利的国家药品监督管理局局长职务。

2026-04-29 21:46

微滔生物完成超 5000 万美元 A 轮、A + 轮融资,专注体内 CAR-T 细胞疗法赛道资讯

微滔生物完成超 5000 万美元 A 轮、A + 轮融资,专注体内 CAR-T 细胞疗法赛道

本轮融资由正心谷资本与德诚资本分别领投,OrbiMed(奥博资本)、汉康资本、卫材创新风投基金、建发新兴投资等知名机构跟投,老股东启明创投、顺禧资本、杏泽资本持续加码

2026-04-29 13:21

“A to H 18A第一股”诞生!迈威生物正式登陆香港联交所主板资讯

“A to H 18A第一股”诞生!迈威生物正式登陆香港联交所主板

2026年4月28日,迈威(上海)生物科技股份有限公司(以下简称“迈威生物”,A股代码:688062 SH,港股代码:02493 HK)在香港联合交易所主板正式挂牌上市,成为首家“A to H”的18A上市公司。

2026-04-28 19:22

全面接轨国际,药物临床试验质量管理规范再升级资讯

全面接轨国际,药物临床试验质量管理规范再升级

根据国家药监局发布的2025年第125号公告,自2026年3月31日后实施的药物临床试验,均适用《E6(R3):药物临床试验质量管理规范技术指导原则》(下称 ICH E6(R3))。

2026-04-28 19:13

百济神州引入PD-1/CTLA-4/VEGF-A三抗资讯

百济神州引入PD-1/CTLA-4/VEGF-A三抗

4月28日,百济神州发布公告称,2026年4 月 24 日,百济神州有限公司的全资子公司广州百济神州生物制药有限公司与华辉安健(北京)生物科技有限公司签订了一份《独家选择权、...

2026-04-28 09:49

希润医疗完成数千万元融资,打造全链条脑机接口康复产品线资讯

希润医疗完成数千万元融资,打造全链条脑机接口康复产品线

由无锡梁溪科创产业基金独家投资。

2026-04-27 13:19

一家环保上市企业要10亿元收购一家CRO公司资讯

一家环保上市企业要10亿元收购一家CRO公司

4月26日晚间,创业板上市公司中赋科技发布公告,计划筹资收购军科正源(北京)药物研究有限责任公司。

2026-04-27 11:02

司美格鲁肽专利已经到期,为什么国内还没有产品获批上市资讯

司美格鲁肽专利已经到期,为什么国内还没有产品获批上市

2026年3月底,司美格鲁肽核心化合物专利在中国正式到期。

2026-04-26 18:56