高亦博:推进肿瘤临床大数据研究应用的需求和挑战

医疗器械 来源:中国数字医学
2017
04/19
19:04
中国数字医学 医疗器械

国家癌症中心依托中国医学科学院肿瘤医院,是全国肿瘤防治研究和信息交流的中心,承担着采集和发布全国肿瘤登记数据、建立全国癌症防治协作网络、开展全国癌症防控科学研究的职责,牵头组织实施城市、农村、淮河流域癌症早诊早治项目以及肿瘤高发现场工作,也是国家肿瘤规范化诊治质控中心、国家肿瘤临床医学研究中心等,是全国肿瘤临床大数据汇集、分析、研究、上报、发布的中心。在参与国家癌症中心/中国医学科学院肿瘤医院承担的肿瘤临床大数据相关研究项目过程中,也曾反复遇到一些难点和问题,在处理过程中得出了一些经验和体会,由此对未来的肿瘤大数据研究重点和难点有了更深认识。

肿瘤临床大数据系列研究布局

医科院肿瘤医院胸外科早在“十五”、“十一五”时期,即依托中国抗癌协会食管癌专业委员会,牵头开展全国食管癌规范化诊治监察网络平台的建设工作。作为国内最早建立的肿瘤专病大数据智能化信息网络平台,联网全国82家在食管癌临床诊治方面具有较大规模和较高水平的三级甲等医院,并设立了12个地区级分中心,涵盖了除台湾、西藏的所有省级行政单位,采用规范化的数据标准和网络直报平台,累计录入食管癌的手术和综合治疗病例3.26万例,为全国食管癌诊治技术和模式的规范化做出了独特贡献,作为“食管癌规范化诊治关键技术的研究与应用推广”的重要组成部分,获得2013年国家科学技术进步奖一等奖。

十二五期间,在此前食管癌临床大数据网络建设和研究成功经验的基础上,国家癌症中心/肿瘤医院承担了国家科技支撑计划项目“基于癌症监测信息网络的肿瘤规范化诊治研究”和国家高技术发展(863)计划“恶性肿瘤大数据处理分析与应用研究”的任务,针对我国发病率、死亡率高,社会负担较重的八大肿瘤:肺癌、肝癌、食管癌、胃癌、结肠癌、直肠癌、乳腺癌、宫颈癌,联网东北、华北、华中、华东、华南、西南、西北七个大区,14家有代表性和地区领先示范作用的省级肿瘤医院/癌症中心,开展肿瘤大数据获取、存储、处理与分析的关键技术研究,构建肿瘤大数据中心和系统平台;应用大数据技术对肿瘤治疗过程中产生的海量临床数据进行处理与分析,形成以肿瘤单病种为主题的数据集;构建知识库及分析模型库,为肿瘤疾病的诊治提供决策支持;开展肿瘤规范化诊治研究,建立质量控制体系,优化肿瘤防控策略,提高肿瘤的综合诊治水平等。

肿瘤临床大数据系列研究主要内容和进展

当前肿瘤大数据研究的具体内容可以简要概括为以下几个方面:①确定采集数据的内容及规范:包括患者人口学基本信息、发病及诊断信息、治疗信息、随访信息、科研信息等;②构建全国癌症监测网络:搭建网络基础架构、数据交换、数据中心、业务应用、综合管理等;③构建肿瘤单病种数据库:确定各专业数据库字段,将结构化字段自动导入系统,采用数据挖掘工具将非结构化数据纳入等;④综合数据分析:预定报表模型深入挖掘分析肿瘤分型,诊疗,癌症死亡分析,癌症控制统计分析,治疗费用等;⑤数据上报质量控制:设计信息系统标准数据接口,规范数据字典;收集各医院的接口数据,校验上报数据,对整体性、种类完整性、数据项完整性等进行检查;数据清洗,处理问题数据,收集原始资料,保障数据溯源;组织医疗专业人员进行业务逻辑核查和数据修正,并对数据字典和采集规范进行补充、完善等;⑥癌症规范化诊治研究:制定或更新适合中国国情的癌症诊治规范,修改完善符合我国患者特点的癌症分期标准,获得符合循证医学的高级别证据用以指导临床。

截至2016年,项目已经由行业专家协商制定拟采集的数据内容及规范,编制统一的数据字典,结合我国广泛采用的医疗信息化系统特点,确定了包括电子病历、检验检查、处方医嘱、治疗计划、随访信息等在内的20个大项、400余个小项的采集规范;完成国家癌症中心与 14 家省级肿瘤医院的加密VPN网络接入,完成服务器、防火墙、网关等基本硬件的部署,实现了数据推送和抓取;建立了自主知识产权的集成开发环境,支持各种结构化、半结构化、非结构化数据的处理。参考大数据项目的数据规范和工作经验,制定了多种常见肿瘤的单病种规范化诊治的医疗质控指标,已上报国家卫生计生委医政医管局。

肿瘤临床大数据研究中的常见问题与解决

通常认为,可以视为大数据的数据资源一般具有:数据总量大、数据结构和类型复杂、单位数据价值密度较低、生成速度快等几个共同特征。因此其数据特征与常规的基础和临床医学研究、循证医学临床试验等均有比较显著的区别,对开展和从事大数据研究的医疗机构和相关专业人员提出了独特的需求和挑战。在此仅举三个典型话题进行初步的探讨。

1.保障医院信息化系统运营安全是开展临床大数据研究的前提

医院信息化系统已成为大型医院临床业务正常运转的必备条件,其持续稳定运行的保障是医院信息部门的工作重点。另一方面由于工作职责优先级的不同,医疗机构开展的公共卫生、基因组学研究对大数据存储、管理和分析的需求往往不能从院级医疗信息平台得到充分保障,时常造成资源的重复建设,提高了研究的时间、人力和经费成本。两方面的矛盾需求可以采用与医院业务系统相对独立建立大数据研究专用数据仓库,并且在运行压力较小时与集成平台或临床数据仓库通信的方式获取数据来解决,直至开发成具有比较完整独立的业务逻辑的产品后,再反哺业务系统。

2. 临床大数据内涵和外延的延伸模糊了数据规范性、规则完备性、参照完整性的边界

除了临床诊疗中被动积累的业务系统运行数据、电子病历和影像检查数据以外,医疗机构主动开展的肿瘤相关基础和临床研究也产生了具有庞大数据量或涉及大规模人群的基因组学、人群或队列筛查体检数据等,已成为肿瘤大数据的重要来源。但由于各自数据类型和结构特征的巨大差异,很少有成熟的医疗信息化平台或工具可以将之整合,导致付出很高成本获得的数据资源难以充分发挥其作用和价值。此外,尽管临床大数据的采集不再设置很高门槛,然而循证医学临床研究范式中的选择性偏倚、幸存者偏倚、测量偏倚等混杂偏倚和数据间的交互作用仍是设计数据分析策略、报表、发布研究结论等过程中需要充分考虑的问题,即肿瘤临床大数据研究本质上仍然属于医学研究,其结论的得出不应因为采用大数据技术而对方法的合理性或结论的可信度降低要求。

3. 需要着力注意避免专业偏见和关注虚假需求

当前从事大数据研究开发的复合型人才严重缺乏,从业人员很大一部分来自于IT产业,或者具有分子生物学或生物信息学基础研究背景,然而不同学科、不同角色的需求大相径庭,在研究和产品中常会限于先验偏见或偏离真实需求。比较典型的例子如以下四种。

(1)不能摆脱原有专业思维习惯:肿瘤学和基因组学研究常倾向于使用覆盖数百个基因,可能有较多新发现的基因测序Panel,甚至用全外显子组、全基因组测序在临床样本中进行筛选,然而临床应用需求则主要集中于有靶向和免疫治疗药物使用指征的个别基因甚至个别突变位点的检测。过多的基因分析结果给临床解读、医患沟通和实际应用都带来了过多的工作量,却难有明确的临床获益。

(2)对研发成本和实用难度估计不足:部分医疗大数据研究团队在尚无充分证据时,贸然将产品定位为替代医生的智力劳动,然而其成本或效率优势仍主要存在于纸面估算,只关注到理论边际成本很低的优势,而对前期开发、验证和推广的时间成本和社会成本估计不足。

(3)研究目的与真实需求错配:例如以媒体报道的看病难、看病贵为默认前提,而实际上在很多情况下一般性医疗服务可及性不差,但是有效需求不足;优质医疗服务可及性差,但由于负荷已满而缺乏进一步提高可及性的动力。部分所谓颠覆性技术成果并未设置严格的对照,缺乏专业权威认可的严格实践检验,并且没有充分考虑医疗行为主客体即医生与患者的心理诉求。

(4)超越知识和技术发展阶段:通过机器学习支持临床决策支持和提高诊疗水平,必须依赖大批高质量的训练数据和详尽临床转归、结局、随访等信息的迭代优化,这样的数据仍然十分稀缺。近年来生物医学界已经越来越多地意识到公开发表论文中,大部分的结论无法严格重现。根据众所周知的“Garbage In,Garbage Out”(无用输入,无用输出)一般规律,当大多数医生诊疗水平无法与顶尖专家相比时,大数据研究方式反而有可能成为劣势。

结语和展望

随着大数据和互联网技术的飞速发展,以及临床大数据研究开发的快速推进,肿瘤临床大数据研究未来的发展方向仍会继续坚持科学审慎原则,整合生物-医学大数据,推动临床真实需求导向和应用驱动的增量改进。以国家级重大研发项目为牵引,依托肿瘤早诊早治和规范化诊治体系、医保单一付费体系等,医疗大数据的所有权、使用权、收益权的归属问题,患者知情同意、隐私保护,医疗机构信息烟囱、信息孤岛等长期困扰临床大数据技术发展的问题有望得到缓解。

来源:中国数字医学

为你推荐

司美格鲁肽专利已经到期,为什么国内还没有产品获批上市资讯

司美格鲁肽专利已经到期,为什么国内还没有产品获批上市

2026年3月底,司美格鲁肽核心化合物专利在中国正式到期。

2026-04-26 18:56

药品附条件批准上市申请审评审批工作程序资讯

药品附条件批准上市申请审评审批工作程序

附条件批准时,每个附条件批准的适应症单独设置药品注册证书有效期,原则上,在确证性研究完成时限的基础上增加一年。确证性研究完成时限由药审中心在审评中与申请人沟通交流后...

2026-04-26 10:58

CDE:抗体偶联药物首次申报临床试验药学资料撰写指导原则资讯

CDE:抗体偶联药物首次申报临床试验药学资料撰写指导原则

本指导原则基于 ICH M4Q( R1)总体框架, 格式体例与之保持一致, 在其框架下结合抗体偶联药物的药学研究特点,细化了 IND 申报药学资料的撰写要求,旨在为该类药物 IN...

2026-04-25 21:39

蚂蚁健康向医院开放“智慧医疗AI一体化方案” 支持智能体、云陪诊、本地化模型部署资讯

蚂蚁健康向医院开放“智慧医疗AI一体化方案” 支持智能体、云陪诊、本地化模型部署

4月25日,在2026中国医院信息网络大会(CHIMA 2026)上,蚂蚁健康面向全国医院及医疗机构推出“智慧医疗AI一体化方案”。

2026-04-25 20:09

美敦力 5.5 亿美元收购 Scientia Vascular,加码神经血管赛道布局资讯

美敦力 5.5 亿美元收购 Scientia Vascular,加码神经血管赛道布局

Scientia Vascular 是专注于神经血管创新器械研发的新兴企业,核心产品管线聚焦颅内血管病变介入治疗领域

2026-04-25 15:50

聚焦预防接种全龄升级,多方合力开展“成人全周期免疫促进暨带状疱疹公益科普”资讯

聚焦预防接种全龄升级,多方合力开展“成人全周期免疫促进暨带状疱疹公益科普”

4月25日,国家疾病预防控制局在上海举办主题宣传活动,呼吁“预防接种,苗助健康,全民行动”。

2026-04-25 15:41

超亿元 A 轮融资!奥明星程以 AI4S 定义下一代生物智能基础设施资讯

超亿元 A 轮融资!奥明星程以 AI4S 定义下一代生物智能基础设施

由深创投与复星医药(复健资本)联合领投,太平股权、广东中医药大健康基金、杭实集团等多家头部投资机构、产业链龙头企业及多地国资跟投。

2026-04-24 18:28

Cytiva ÄKTA与Biacore系列产品实现本地生产, 以“桐庐样本”赋能生物医药“加速度”资讯

Cytiva ÄKTA与Biacore系列产品实现本地生产, 以“桐庐样本”赋能生物医药“加速度”

依托桐庐生产基地,Cytiva持续提升本土供应能力,以更短的交付周期与定制化支持,精准匹配中国研发节奏,深度践行“在中国,为中国”承诺

2026-04-24 18:13

全球首个治疗遗传性耳聋基因疗法获批资讯

全球首个治疗遗传性耳聋基因疗法获批

4 月 23 日,再生元宣布,美国 FDA 已经加速批准其在研基因疗法Otarmeni(lunsotogene parvec-cwha)上市,该药品成为首个也是目前唯一获批用于治疗遗传性听力损失的基因疗法。

2026-04-24 18:01

CDE:治疗用重组蛋白药物首次申报临床试验药学资料撰写指导原则资讯

CDE:治疗用重组蛋白药物首次申报临床试验药学资料撰写指导原则

本指导原则基于 ICH M4Q( R1)总体框架, 格式体例与之保持一致, 在其框架下结合治疗用重组蛋白药物的药学研究特点,细化了 IND 申报药学资料的撰写要求,旨在为该类药...

2026-04-24 12:44

甘李药业GLP-1R博凡格鲁肽Ⅲ期临床试验完成首例受试者给药资讯

甘李药业GLP-1R博凡格鲁肽Ⅲ期临床试验完成首例受试者给药

4月23日,甘李药业发布公告,博凡格鲁肽(研发代号:GZR18)注射液正在中国开展的适应症成人肥胖患者的中度至重度阻塞性睡眠呼吸暂停(OSA)的Ⅲ期临床试验,于近日成功完成首例...

2026-04-24 10:25

天鹜科技发布MatwingsVenus™,给AI一个共享实验室资讯

天鹜科技发布MatwingsVenus™,给AI一个共享实验室

天鹜科技是一家 AI 驱动的全栈式蛋白质研发平台公司

2026-04-24 09:12

应世生物再冲港交所 IPO:手握国内唯一 III 期 FAK 抑制剂,专攻肿瘤耐药后市场资讯

应世生物再冲港交所 IPO:手握国内唯一 III 期 FAK 抑制剂,专攻肿瘤耐药后市场

公司战略性聚焦黏着斑激酶(FAK)及整合素通路,这些靶点对肿瘤细胞的顽强生存能力至关重要。

2026-04-23 22:00

华东医药2025年创新收入大增64.2%,2026Q1扣非净利创单季历史新高资讯

华东医药2025年创新收入大增64.2%,2026Q1扣非净利创单季历史新高

2026年4月23日晚间,华东医药(000963 SZ)发布2025年年度报告及2026年第一季度业绩。

2026-04-23 21:45

默克与谷歌云达成一项10亿美元的AI合作资讯

默克与谷歌云达成一项10亿美元的AI合作

此次合作,默克期望将自身在药物研发、科学管理、市场运营等方面能力与人工智能、云平台相结合,帮助默克全球约7 5万名员工提升生产力。

2026-04-23 13:00

神经介入与神经外科植入材料等7类医用耗材分类与代码及医保通用名资讯

神经介入与神经外科植入材料等7类医用耗材分类与代码及医保通用名

近日,国家医保局发布《神经介入与神经外科植入材料等7类医用耗材分类与代码及医保通用名》公开征求意见的公告。

2026-04-23 11:29

真实生物阿兹夫定与哆希替尼联合疗法最新消息资讯

真实生物阿兹夫定与哆希替尼联合疗法最新消息

近日,真实生物在美国癌症研究协会(AACR 2026)年会以壁报形式展示了阿兹夫定与哆希替尼联合疗法的临床前研究成果,标题为标题:Azvudine Combined with Doxitinib,a Potential Therapy for EGFRm+ NSCLC。

2026-04-23 11:07

老百姓大药房、养天和等部分药店被曝涉嫌违规使用医保资金资讯

老百姓大药房、养天和等部分药店被曝涉嫌违规使用医保资金

近日,老百姓大药房、养天和等部分药店被曝涉嫌违规使用医保资金。

2026-04-22 21:19

华东医药独家商业化产品CXG87上市申请获受理,呼吸治疗赛道布局深化资讯

华东医药独家商业化产品CXG87上市申请获受理,呼吸治疗赛道布局深化

华东医药股份有限公司(以下简称“华东医药”或“公司”)全资子公司华东医药(杭州)有限公司独家商业化产品CXG87(布地奈德福莫特罗吸入粉雾剂(IV)胶囊型)用于治疗哮喘的药...

2026-04-22 17:53

瞳沐医疗完成数千万元 Pre-A 轮融资,加速眼科智能手术系统临床落地资讯

瞳沐医疗完成数千万元 Pre-A 轮融资,加速眼科智能手术系统临床落地

本轮融资由爱博弘盛、启航创投联合领投,明恒美康跟投,丰和资本担任独家财务顾问。

2026-04-22 10:32