当肿瘤遭遇“信息泄露”

医疗健康 来源:古槿科学网博客 作者:古槿
2016
12/23
16:42
古槿科学网博客
作者:古槿
医疗健康

“外”如探测浩瀚的宇宙,“内”如揭示人体细胞的奥秘,海量的信息必将改变人类社会、改变人类自己。

人类已经逐步进入信息爆炸的时代,各种个人信息、网络行为、生活习惯,甚至各种所谓的隐私、银行账号密码等“机密”信息均无法避免遭遇各种泄露门、监控门事件。肿瘤这个邪恶的幽灵隐藏在体内,时刻准备攫取资源来扩张自己的军队。而我们却对之毫无察觉。 但随着以新一代测序技术为代表的高通量生物检测技术的发展,肿瘤的机密信息也无处遁形,遭遇着前所未有的“信息泄露”,肿瘤的DNA、RNA、蛋白质、代谢物等生物信息都暴露于人类的检测之下。这些海量信息被称为组学信息(omics),如:DNA序列信息是基因组(genomics)、染色质结构和各种基因组修饰是表观遗传组(epigenomics),另外还有转录组、蛋白质组、代谢组等等。从这些泄漏的信息,我们该如何来窥探肿瘤的“隐私”?如何推出更好的对付“肿瘤”的办法?

拿到海量的肿瘤组学数据我们能做什么?首要任务是建立肿瘤的信息档案。就像是地理测绘测绘,首先要用测到的数据把地图绘制出来。目前,几个国际癌症基因组计划,如ICGC(International Cancer Genome Consortium)、TCGA(The Cancer Genome Atlas),都致力于推动肿瘤分子图谱的构建。利用TCGA的数据,可以识别在肿瘤细胞中发生的体突变,并从中识别出影响蛋白质结构与功能的突变位点(Niu et al., Nat Genet 2015),另一项类似的研究从超过7000余对肿瘤/癌旁配对样本中识别出超过47000个非同义突变位点,极大的提高了人们对肿瘤突变谱的认识(Shen et al., Am J Human Genet 2016)。基于突变谱,可以更好的估计靶向药物的潜在应用比例,经计算估计约40%的病人可能会受益于靶向药物(Rubio-Perez et al., Cancer Cell 2015)。

但由于肿瘤的高度异质性以及不同中心采样和检测手段的差异,单个项目所纳入的样本量仍然远远不够,以肝癌为例,在TCGA中有约400例样本,已经是目前公开数据集里样本数最多的了。为了更好的绘制“肿瘤的地图”,必须建立跨更多数据源的大规模图谱。比如本课题组构建的肝细胞肝癌(Hepatocellular Carcinoma,HCC)组学图谱HCCDB,已经收录了约3500例临床样本的基因/miRNA表达数据、约800例DNA甲基化数据、约600例CNV数据(来源于17组研究),目前可提供表达谱的网页浏览服务。多来源/多中心、大规模的组学数据是建立肿瘤信息档案的基础,基于这些收录的数据,我们已经开展了HCC的DNA甲基化图谱分析(Zheng et al. Brief Bioinform 2016),正在进行基于表达谱的HCC分型研究。同时,HCC相关研究人员可以方便的查询分析结果,指导相关的实验设计,提出更加合理的假设。比如某研究人员正在关注HCC肿瘤干细胞的调控机制,他可以用EPCAM、AFP、SPP1等候选基因来查询相关的通路或基因。信息爆炸的时代或者说大数据时代,绘制各种“地图”是实现数据价值的第一步,从多个维度、多个层次构建“肿瘤地图”是以信息技术攻克癌症的基础和关键。类似的,大肠癌也建立了超过4000例样本(来源于18组研究)的大规模数据集,并基于该数据集分析出大肠癌的四个分子亚型,并得到了每个分子亚型所特有的分子和表型特征(Guinney et al. Nat Med 2015)。

有了基础地图之后,我们当然需要将其绘制得更加精细,并利用“先人的知识”对其进行仔细的标注,比如在军事地图上需要标注出关键的制高点、隘口等。这个时候人工智能技术就非常重要了,针对癌症组学数据高维、异质等特性,需要更好机器学习方法对数据进行挖掘和建模,比如聚类(分子分型,如多组学整合聚类方法LRAcluster)(Wu et al. BMC Genomics 2015)、预测(分子标志物),核心调控网络识别(分子机理)(Gu et al. Mol BioSyst 2014))及其可能的调控策略(药物干预)等。由于生命系统高度复杂,组学数据并不能很好的完成“地图标注”的任务,必须要跟专家知识、文献信息有机的结合起来。这对传统基于采样数据的机器学习方法无疑是新的挑战。可以预见,要更好的解读肿瘤的信息,必须建立可融合采样数据和知识数据的新的人工智能方法。深度学习(deep learing)(LeCun et al. Nature 2015)与层级贝叶斯学习(hierarchical Bayesian learning)(Ghahramani. Nature 2015; Lake et al. Science 2015)的结合是否是可行的路径?这些都还有待进一步的研究。

随着生物医学检测技术与人工智能的发展,肿瘤的“机密信息”将不断的被披露,人们将拥有更多肿瘤诊疗的新手段。

参考文献

Ghahramani. Probabilistic machine learning and artificial intelligence. Nature 2015, 421:452-459.

Gu et al. Gene module based regulator inference identifying miR-139 as a tumor suppressor in colorectal cancer. Molecular BioSystems 2014, 10(12):3249-3254.

Guinney et al. The consensus molecular subtypes of colorectal cancer. Nat Med 2015, 21(11):1350-1362.

Lake et al. Human-level concept learning through probabilistic program induction. Science 2015, 350(6266):1332-1339.

LeCun et al. Deep Learning. Nature 2015, 521:436-444.

Niu et al. Protein-structure-guided discovery of functional mutations across 19 cancer types. Nat Genet 2016, 48(8):827-837.

Rubio-Perez, et al. In Silico Prescription of Anticancer Drugs to Cohorts of 28 Tumor Types Reveals Targeting Opportunities. Cancer Cell 2015, 27:382-396.

Shen et al. Proteome-Scale Investigation of Protein Allosteric Regulation Perturbed by Somatic Mutations in 7,000 Cancer Genomes. Am J Hum Genet 2016, EPub.

Wu et al. Fast dimension reduction and integrative clustering of large-scale multi-omics data using low-rank approximation: application to cancer molecular classification. BMC Genomics 2015, 16:1022.

Zheng et al. Genome-wide DNA methylation analysis identifies candidate epigenetic markers and drivers of hepatocellular carcinoma. Brief Bioinform 2016, Epub.

来源:古槿科学网博客   作者:古槿

为你推荐

第四批全国中成药集采与第二批接续采购中选结果资讯

第四批全国中成药集采与第二批接续采购中选结果

近日,全国中成药联合采购办公室正式发布《关于公布全国中成药采购联盟集中采购中选结果的通知》,备受业界关注的第四批全国中成药集中带量采购及第二批接续采购中选结果尘埃落定。

2026-06-20 21:08

科创板支持脑机接口、基因工程相关创新企业上市,已有企业申报资讯

科创板支持脑机接口、基因工程相关创新企业上市,已有企业申报

近日,上交所发布《上海证券交易所科创板企业发行上市申报及推荐暂行规定(征求意见稿)》,对外公开征求意见。

2026-06-19 22:12

又是一个父亲节,关注和做好前列腺癌早期筛查资讯

又是一个父亲节,关注和做好前列腺癌早期筛查

前列腺癌被称为中老年男性的隐形杀手——隐形在于早期几乎没有症状,杀手则在于部分恶性程度高的前列腺癌进展迅速,一旦发生转移,预后显著变差。

2026-06-19 14:59

低活跃预测不等于低风险,台风、飓风、强降雨和洪涝企业应做好哪些应对?资讯

低活跃预测不等于低风险,台风、飓风、强降雨和洪涝企业应做好哪些应对?

随着北半球夏季极端天气高发期到来,台风、飓风、强降雨和洪涝等风暴相关风险进入重点关注阶段。世界领先的健康和安全风险服务企业国际SOS提醒在全球运营的企业:风暴季准备的关...

2026-06-18 21:41

药石科技发布“绿色智能化学引擎”战略,强化下一代疗法CRDMO平台能力资讯

药石科技发布“绿色智能化学引擎”战略,强化下一代疗法CRDMO平台能力

CPHI China 2026期间,南京药石科技股份有限公司(股票代码:300725 SZ,以下简称“药石科技”)在上海举行集团战略发布会

2026-06-18 13:49

第二批全国中药饮片集采中选结果公示资讯

第二批全国中药饮片集采中选结果公示

6月16日,全国中药饮片联盟集中采购拟中选结果正式公布,根据公示结果信息,共有21465条拟中选信息,公示期至6月22日。

2026-06-18 10:42

因美纳在华推出移动式生信分析解决方案,推进蛋白质组学生态合作资讯

因美纳在华推出移动式生信分析解决方案,推进蛋白质组学生态合作

近日,因美纳正式推出“因美纳生信移动宝”,该生信分析解决方案采用移动式部署模式,旨在将DRAGEN™驱动的高性能算力直接送达科研与临床研究一线。同期,因美纳进一步强化其在...

2026-06-18 09:55

治疗早泄药物国内获批资讯

治疗早泄药物国内获批

6月15日,国家药监局药品批准证明文件送达信息显示,Plethora Solutions 和复星医药(600196 SH;02196 HK)联合申报的 5 1 类药物利多卡因丙胺卡因气雾剂获批上市,此为...

2026-06-17 21:36

新诺威名称变更为石药创新资讯

新诺威名称变更为石药创新

6月16日晚间,新诺威发布公告称,公司证券简称由新诺威变更为石药创新,证券代码“300765”保持不变,变更日期为2026年6月17日。

2026-06-17 09:13

第四届诺华中国患者日举办,照亮更有温度的患者支持生态资讯

第四届诺华中国患者日举办,照亮更有温度的患者支持生态

6月16日,第四届诺华中国患者日在上海成功举办。

2026-06-16 19:03

第106批仿制药参比制剂目录资讯

第106批仿制药参比制剂目录

经国家药品监督管理局仿制药质量和疗效一致性评价专家委员会审核确定,现发布仿制药参比制剂目录(第一百零六批)。

2026-06-16 16:18

武田制药公布Oveporexton新关键性研究数据资讯

武田制药公布Oveporexton新关键性研究数据

在第40届美国联合专业睡眠学会年会(SLEEP 2026)上公布的3期研究次要及探索性终点结果进一步显示,Oveporexton在广泛的日间及夜间症状方面带来改善

2026-06-16 12:58

兆科眼科硫酸阿托品滴眼液澳洲上市注册申请获受理资讯

兆科眼科硫酸阿托品滴眼液澳洲上市注册申请获受理

6月15日,兆科眼科发布公告称,公司就其用于减慢儿童近视加深疗法的硫酸阿托品滴眼液(0 02%剂量,产品代码:NVK002)提出的注册申请已获澳洲Therapeutic Goods Administrati...

2026-06-16 10:53

和铂医药和百图生科宣布联合成立AI医药公司资讯

和铂医药和百图生科宣布联合成立AI医药公司

6月15日,和铂医药和百图生科联合宣布,双方将建立全面战略合作伙伴关系,联合创立一家面向全球市场的新型AI管线研发公司MegaStream Techbio。

2026-06-16 10:25

陪审团认定安进故意侵权,和铂医药最高可获6060万美元赔偿资讯

陪审团认定安进故意侵权,和铂医药最高可获6060万美元赔偿

今日,和铂医药(02142 HK)发布公告,美国特拉华州联邦地区法院的陪审团就和铂医药针对安进公司(Amgen Inc )及其子公司Teneobio, Inc (以下合称“安进”)提起的专利侵...

2026-06-15 21:28

应对超重肥胖严峻挑战,辉瑞新一代GLP-1埃诺格鲁肽头对头研究验证临床优势资讯

应对超重肥胖严峻挑战,辉瑞新一代GLP-1埃诺格鲁肽头对头研究验证临床优势

超重与肥胖已是全球不可忽视的公共卫生挑战。

2026-06-15 19:58

年内创新药上市企业最大回购计划资讯

年内创新药上市企业最大回购计划

港股上述企业,中国生物制药(正大天晴为其旗下公司)今日发布公告,2026年6月12日,公司董事会决议通过一项股份购买计划,将视市场情况于未来12个月以不超过20亿港元总价在公开...

2026-06-15 15:56

拜耳研发开放日:共探医药创新未来资讯

拜耳研发开放日:共探医药创新未来

“拜耳研发开放日”活动近日在拜耳·亦庄开放创新中心举办。

2026-06-15 12:18

蚂蚁阿福拍皮肤功能升级,试水“AI+医生把关”协作模式资讯

蚂蚁阿福拍皮肤功能升级,试水“AI+医生把关”协作模式

6月15日, "蚂蚁阿福 "宣布“拍皮肤”功能升级:可识别皮肤病种类从50种增至100多种,覆盖99%的线上就医常见皮肤问题。

2026-06-15 11:27

再鼎医药ADC药物注射用维替索妥尤单抗获批资讯

再鼎医药ADC药物注射用维替索妥尤单抗获批

6月9日,再鼎医药宣布国家药品监督管理局(NMPA)已批准缇乐注射用维替索妥尤单抗)的生物制品上市许可申请(BLA)。

2026-06-15 09:23