“外”如探测浩瀚的宇宙,“内”如揭示人体细胞的奥秘,海量的信息必将改变人类社会、改变人类自己。
人类已经逐步进入信息爆炸的时代,各种个人信息、网络行为、生活习惯,甚至各种所谓的隐私、银行账号密码等“机密”信息均无法避免遭遇各种泄露门、监控门事件。肿瘤这个邪恶的幽灵隐藏在体内,时刻准备攫取资源来扩张自己的军队。而我们却对之毫无察觉。 但随着以新一代测序技术为代表的高通量生物检测技术的发展,肿瘤的机密信息也无处遁形,遭遇着前所未有的“信息泄露”,肿瘤的DNA、RNA、蛋白质、代谢物等生物信息都暴露于人类的检测之下。这些海量信息被称为组学信息(omics),如:DNA序列信息是基因组(genomics)、染色质结构和各种基因组修饰是表观遗传组(epigenomics),另外还有转录组、蛋白质组、代谢组等等。从这些泄漏的信息,我们该如何来窥探肿瘤的“隐私”?如何推出更好的对付“肿瘤”的办法?
拿到海量的肿瘤组学数据我们能做什么?首要任务是建立肿瘤的信息档案。就像是地理测绘测绘,首先要用测到的数据把地图绘制出来。目前,几个国际癌症基因组计划,如ICGC(International Cancer Genome Consortium)、TCGA(The Cancer Genome Atlas),都致力于推动肿瘤分子图谱的构建。利用TCGA的数据,可以识别在肿瘤细胞中发生的体突变,并从中识别出影响蛋白质结构与功能的突变位点(Niu et al., Nat Genet 2015),另一项类似的研究从超过7000余对肿瘤/癌旁配对样本中识别出超过47000个非同义突变位点,极大的提高了人们对肿瘤突变谱的认识(Shen et al., Am J Human Genet 2016)。基于突变谱,可以更好的估计靶向药物的潜在应用比例,经计算估计约40%的病人可能会受益于靶向药物(Rubio-Perez et al., Cancer Cell 2015)。
但由于肿瘤的高度异质性以及不同中心采样和检测手段的差异,单个项目所纳入的样本量仍然远远不够,以肝癌为例,在TCGA中有约400例样本,已经是目前公开数据集里样本数最多的了。为了更好的绘制“肿瘤的地图”,必须建立跨更多数据源的大规模图谱。比如本课题组构建的肝细胞肝癌(Hepatocellular Carcinoma,HCC)组学图谱HCCDB,已经收录了约3500例临床样本的基因/miRNA表达数据、约800例DNA甲基化数据、约600例CNV数据(来源于17组研究),目前可提供表达谱的网页浏览服务。多来源/多中心、大规模的组学数据是建立肿瘤信息档案的基础,基于这些收录的数据,我们已经开展了HCC的DNA甲基化图谱分析(Zheng et al. Brief Bioinform 2016),正在进行基于表达谱的HCC分型研究。同时,HCC相关研究人员可以方便的查询分析结果,指导相关的实验设计,提出更加合理的假设。比如某研究人员正在关注HCC肿瘤干细胞的调控机制,他可以用EPCAM、AFP、SPP1等候选基因来查询相关的通路或基因。信息爆炸的时代或者说大数据时代,绘制各种“地图”是实现数据价值的第一步,从多个维度、多个层次构建“肿瘤地图”是以信息技术攻克癌症的基础和关键。类似的,大肠癌也建立了超过4000例样本(来源于18组研究)的大规模数据集,并基于该数据集分析出大肠癌的四个分子亚型,并得到了每个分子亚型所特有的分子和表型特征(Guinney et al. Nat Med 2015)。
有了基础地图之后,我们当然需要将其绘制得更加精细,并利用“先人的知识”对其进行仔细的标注,比如在军事地图上需要标注出关键的制高点、隘口等。这个时候人工智能技术就非常重要了,针对癌症组学数据高维、异质等特性,需要更好机器学习方法对数据进行挖掘和建模,比如聚类(分子分型,如多组学整合聚类方法LRAcluster)(Wu et al. BMC Genomics 2015)、预测(分子标志物),核心调控网络识别(分子机理)(Gu et al. Mol BioSyst 2014))及其可能的调控策略(药物干预)等。由于生命系统高度复杂,组学数据并不能很好的完成“地图标注”的任务,必须要跟专家知识、文献信息有机的结合起来。这对传统基于采样数据的机器学习方法无疑是新的挑战。可以预见,要更好的解读肿瘤的信息,必须建立可融合采样数据和知识数据的新的人工智能方法。深度学习(deep learing)(LeCun et al. Nature 2015)与层级贝叶斯学习(hierarchical Bayesian learning)(Ghahramani. Nature 2015; Lake et al. Science 2015)的结合是否是可行的路径?这些都还有待进一步的研究。
随着生物医学检测技术与人工智能的发展,肿瘤的“机密信息”将不断的被披露,人们将拥有更多肿瘤诊疗的新手段。
参考文献
Ghahramani. Probabilistic machine learning and artificial intelligence. Nature 2015, 421:452-459.
Gu et al. Gene module based regulator inference identifying miR-139 as a tumor suppressor in colorectal cancer. Molecular BioSystems 2014, 10(12):3249-3254.
Guinney et al. The consensus molecular subtypes of colorectal cancer. Nat Med 2015, 21(11):1350-1362.
Lake et al. Human-level concept learning through probabilistic program induction. Science 2015, 350(6266):1332-1339.
LeCun et al. Deep Learning. Nature 2015, 521:436-444.
Niu et al. Protein-structure-guided discovery of functional mutations across 19 cancer types. Nat Genet 2016, 48(8):827-837.
Rubio-Perez, et al. In Silico Prescription of Anticancer Drugs to Cohorts of 28 Tumor Types Reveals Targeting Opportunities. Cancer Cell 2015, 27:382-396.
Shen et al. Proteome-Scale Investigation of Protein Allosteric Regulation Perturbed by Somatic Mutations in 7,000 Cancer Genomes. Am J Hum Genet 2016, EPub.
Wu et al. Fast dimension reduction and integrative clustering of large-scale multi-omics data using low-rank approximation: application to cancer molecular classification. BMC Genomics 2015, 16:1022.
Zheng et al. Genome-wide DNA methylation analysis identifies candidate epigenetic markers and drivers of hepatocellular carcinoma. Brief Bioinform 2016, Epub.
来源:古槿科学网博客 作者:古槿
为你推荐

诺和诺德与阿里健康启动战略合作,助力慢病管理数字化升级
2025年6月16日,诺和诺德与阿里健康宣布达成战略合作。在国家持续推进“体重管理年”行动的背景下,双方将依托诺和诺德百余年深耕慢病领域的专业经验和创新治疗方案,以及阿里健...
2025-06-16 14:58

治疗阿尔茨海默病国产新药断货与思考
近日,许多患者家属反映买不到治疗阿尔茨海病的新药甘露特钠胶囊,经过了解,也证实该药在许多医院和药店确实“断货”,作为中国治疗阿尔茨海默病处方量最大的药物之一,也是目...
文/上海市精神卫生中心肖世富 广州医科大学附属第二医院刘军 北京和睦家医院李慧英 2025-06-16 11:35

连续第四年,2025年纠正医药购销领域和医疗服务中不正之风工作要点发布
发挥穿透式审计监督优势,加强医药行业专项审计。打通从原材料采购、药品耗材生产、招标采购的监管通路,将监管重点向生产端覆盖。探索建立药品生产加工到流通使用全过程可追溯...
2025-06-13 22:55

国家卫健委:人间传染的高致病性病原微生物实验活动审批管理办法
本办法适用于三级、 四级实验室从事《人间传染的病原微生物目录》 规定的应当在三级、 四级实验室开展的人间传染的高致病性病原微生物或者疑似高致病性病原微生物实验活动的审批。
2025-06-13 22:34

半年融资超2亿元,美创医疗攻克“卡脖子”技术
此次融资将加速美创医疗在医用植入级ePTFE材料产线建设、创新产品研发及商业化推广上的布局,助推中国高端医疗器械真正实现进口替代。
2025-06-13 13:22

拟再易主,派林生物或变为央企控股企业
日前,派林生物发布公告称,中国生物技与派林生物控股股东共青城胜帮英豪投资合伙企业(简称“胜帮英豪”)签署收购框架协议,拟受让后者持有的21 03%股份。若本次交易顺利推进...
2025-06-13 12:43

依视路®星趣控®亮相Vision China 2025,重磅发布依视路®星趣控®2.0镜片
在2025年视觉健康创新发展国际会议(Vision China)期间,儿童青少年近视管理品牌依视路®星趣控®重磅发布全“星”一代儿童青少年解决方案——依视路®星趣控®2 0镜片
2025-06-13 11:28

景嘉航完成数千万元天使轮融资,专注新型靶向放射性药物开发
近日,杭州景嘉航生物医药科技有限公司(AB-RayBio Therapeutics,简称“景嘉航”)完成数千万元人民币的天使轮融资,由杭实资管领投,正
2025-06-13 10:53

CDE:已取得药品批准文号的两种或者两种以上具有独立的适应症和用法用量的化学药品,如何申请组合包装?
已取得药品批准文号的两种或者两种以上具有独立的适应症和用法用量的化学药品,如申请组合包装,应通过什么途径提出申请,申报资料有什么要求?
2025-06-12 21:44

赛诺菲加速尼塞韦单抗全球发货,提前数月助力医务工作者应对今年RSV流行季
赛诺菲将于2025年第三季度初启动尼塞韦单抗的全球发货工作,以确保在2025-2026年呼吸道合胞病毒流行季来临前,实现广泛供应。
2025-06-12 17:31

CDE发布《先进治疗药品的范围、归类和释义(征求意见稿)》
本文件所称先进治疗药品,是指符合药品相关管理规定,按照药品的路径进行研制、生产、经营、 使用和监管,且经体外操作生产并在人体内发挥预期功能的细胞治疗药品、基因治疗药...
2025-06-11 22:06

安图生物注销了一控股子公司
近日,安图生物发布公告称,公司控股子公司安图莫比已完成注销手续,该公司是安图生物与Mobidiag Oy(以下简称Mobidiag)在6年前成立的合资企业,伴随着注销,如今正式落幕。
2025-06-11 15:25

因美纳发布2024年度企业社会责任报告,持续释放基因组学的力量
报告重点阐述了因美纳在推动精准医疗更加可及、赋能公众与社群、在业务中践行可持续发展、尽责运营和秉持诚信领导原则等方面的持续努力。
2025-06-11 14:21

破解传统疗法局限,华东医药脂溢性皮炎外用制剂国内III期临床获批
由中美华东申报的一项评价0 3%罗氟司特泡沫(ZORYVE®)在脂溢性皮炎患者中有效性和安全性的多中心、随机、双盲、赋形剂平行对照的III期临床试验申请获得批准。
2025-06-11 09:57

医药领域有哪些新探索,中办 国办关于深入推进深圳综合改革试点深化改革创新扩大开放的意见
深化药品医疗器械审评审批制度改革,提升口岸药品监管和检验检测能力。完善临床急需进口药品、医疗器械使用及监督管理制度,探索将国际新药临床真实世界数据用于进口药品注册上...
2025-06-10 22:13

默克治疗腱鞘巨细胞瘤的药物匹米替尼上市许可申请获受理
基于III期MANEUVER研究的阳性数据,这是Pimicotinib这一潜在“同类最优”TGCT治疗药物的全球首个申报
2025-06-10 14:25