2016年,全球新发癌症数量超过1400万人,并导致了900万人的死亡。癌症在发达国家中已成为主要死亡原因之一,美国每年逝世的5个人当中有一人是因癌症致死。根据美国抗癌协会和国际癌症协会数据,所有的癌症都是越早治疗、治疗效果越好。癌症的早期发现,可以为病理诊断和治疗赢取更多的时间,能极大提高治愈率与患者生存周期及质量。癌症的早期筛查是个万亿级别的市场。
资本市场的火爆,得益于近十余年基因测序技术的迅猛发展,特别是在肿瘤领域的广泛应用。另一方面,机器学习技术在基因大数据处理上的大量应用,积累了前所未有的知识。这些全新的知识及组合为医疗界打开了一扇新世界的大门,使得医学工作者对许多疾病的认识、筛查和治疗都有了新的渠道和信息。
基因测序技术的进步使得基因分析更加的高效快捷
人可以被看作一台极其精密的仪器,人的一生,万亿计的细胞在体内不断复制更新,每代复制严格相同,但存在极其微小的错误率,造成所谓的基因突变。绝大多数突变无关紧要,少量突变造成抑制生长的基因的功能失常,或者激活生长基因,变成癌细胞。而癌细胞一旦逃避了免疫系统的监控,就造成生长失控变成癌组织。
一条人的基因组序列共有30亿位,按正常排版打印在A4纸上,大概有华盛顿纪念碑那么高。人与人之间会有小于千分之一的差异,癌细胞与自身的正常细胞基因组序列也会有细微的差别。基因测序的进步,让鉴别这些差别成为一件快速、高效、低成本的事。
计算机运算速度和能力的发展,进一步推动了基因分析的进步
由于人类基因组的复杂性,测序数据量非常庞大,一个人的全基因组测序数据可以达到上百G。普通的计算机技术和统计学方法无法在短时间内很好地处理这些信息,而机器学习的发展以及GPU运算的进步逐渐为科研工作者解决了这一难题。现在只需要将基因测序的数据输入经过机器学习反复训练的模型中,计算机就可以很快的分析出目标区域是否存在变异,进而找到可能变异的基因点位为医生提供更多的可用于诊断及治疗的信息。正是因为机器学习和基因测序技术的日渐成熟,以癌症筛查和诊断为首的各类疾病早筛项目渐渐成为科研及创投的热点。
机器学习是近年来非常火热的技术方向
简单来说,机器学习就是为计算机提供大量的数据,而这些数据都有他们各自对应的标签,例如我们想教会计算机识别图片中的动物,我们则要提供各种各样的动物图片,并且每一张图片都带有对应的标签,这个是猫,这个是狗等等。机器在分析大量的数据之后会在图片之中找到规律,例如猫在图片中大多是独来独往,而许多有狗的图片中还有别的动物或人类。通过这些信息,计算机不断地调整,更新它的数学模型。
当有新的图片到来时,计算机就可以根据建立好的模型来判断哪个是猫,哪个是狗。当然,这只是一个非常简单的机器学习的例子,现在的机器学习已经被广泛应用于自动驾驶,数据分析,信息挖掘,治疗诊断等等许多在过去只有人类能够胜任的工作。成百上千的学习模型被开发出来,甚至有许多不需要大量数据,或者不需要带标签的数据就能学习的模型。正如70-80年代计算机开始爆发一般,这确实是一个机器学习的黄金年代。
今天就为大家详细的阐述一下机器学习是怎样与基因测序紧密合作完成癌症早筛的。
ctDNA是什么
想理解基于基因测序的癌症早筛首先需要理解什么是ctDNA。ctDNA是circulating tumor DNA的缩写,也称为循环肿瘤DNA。是一种存在于血液、尿液、脑脊液等体液中的细胞外的基因片段,主要来自于坏死或凋亡的肿瘤细胞。ctDNA是癌症的特定标记物,如果能在血液中检测出ctDNA通常就意味着体内有癌症正在发生,这也是癌症早筛的基本原理。
然而,因为ctDNA和由正常细胞产生的游离DNA碎片是混合在一起的,只占所有游离DNA(cell-free DNA,cfDNA)含量的0.1%-1%之间,因此准确检测出ctDNA的难度相当的大。其中所涉及到的信号降噪,降低假阳性、假阴性的发生率等都是难度相当高的科研课题。
即使在体液中发现了ctDNA,由于血液循环,ctDNA可能来源于身体的任意一处,确定肿瘤在体内的生长位置也是另一件高难度的事情。得益于近些年肿瘤基因组测序结果的大量积累,科学家们发现了多种具有组织特异性的踪迹。通过机器学习的途径,结合这些踪迹信息,科学家们就能通过ctDNA来大致判断组织来源。
当然,人工智能的发展并不代表我们可以轻松地解决问题。尽管在现如今,机器学习,乃至深度学习已经拥有了许多开源的算法,哪怕只是一个普通人也可以在一定程度的学习后,运用现有的接口去开发一些简单的模型。但是也正是因为如此,不同层次的算法人才所做出的产品质量和效果也截然不同。正如汽车制造的普及使得人人都可以拥有自己的汽车,但是普通人与赛车手之间车技的差距却仍然非常明显。
同样,也因为这是个高度跨学科、知识密集型的领域,肿瘤早筛的创业团队在机器学习方面的专精程度和对肿瘤病理学的理解导致了产品质量和效果的巨大差距。譬如,由于人类基因组的高度复杂,和当前二代测序技术依然存在一定的错误,使得数据分析成为极为关键的一环。团队需要对测序数据的非常熟悉,精通数据挖掘的应用,以及对肿瘤临床知识有精准的理解。
来源:海投联盟
为你推荐

诺和诺德与阿里健康启动战略合作,助力慢病管理数字化升级
2025年6月16日,诺和诺德与阿里健康宣布达成战略合作。在国家持续推进“体重管理年”行动的背景下,双方将依托诺和诺德百余年深耕慢病领域的专业经验和创新治疗方案,以及阿里健...
2025-06-16 14:58

治疗阿尔茨海默病国产新药断货与思考
近日,许多患者家属反映买不到治疗阿尔茨海病的新药甘露特钠胶囊,经过了解,也证实该药在许多医院和药店确实“断货”,作为中国治疗阿尔茨海默病处方量最大的药物之一,也是目...
文/上海市精神卫生中心肖世富 广州医科大学附属第二医院刘军 北京和睦家医院李慧英 2025-06-16 11:35

连续第四年,2025年纠正医药购销领域和医疗服务中不正之风工作要点发布
发挥穿透式审计监督优势,加强医药行业专项审计。打通从原材料采购、药品耗材生产、招标采购的监管通路,将监管重点向生产端覆盖。探索建立药品生产加工到流通使用全过程可追溯...
2025-06-13 22:55

国家卫健委:人间传染的高致病性病原微生物实验活动审批管理办法
本办法适用于三级、 四级实验室从事《人间传染的病原微生物目录》 规定的应当在三级、 四级实验室开展的人间传染的高致病性病原微生物或者疑似高致病性病原微生物实验活动的审批。
2025-06-13 22:34

半年融资超2亿元,美创医疗攻克“卡脖子”技术
此次融资将加速美创医疗在医用植入级ePTFE材料产线建设、创新产品研发及商业化推广上的布局,助推中国高端医疗器械真正实现进口替代。
2025-06-13 13:22

拟再易主,派林生物或变为央企控股企业
日前,派林生物发布公告称,中国生物技与派林生物控股股东共青城胜帮英豪投资合伙企业(简称“胜帮英豪”)签署收购框架协议,拟受让后者持有的21 03%股份。若本次交易顺利推进...
2025-06-13 12:43

依视路®星趣控®亮相Vision China 2025,重磅发布依视路®星趣控®2.0镜片
在2025年视觉健康创新发展国际会议(Vision China)期间,儿童青少年近视管理品牌依视路®星趣控®重磅发布全“星”一代儿童青少年解决方案——依视路®星趣控®2 0镜片
2025-06-13 11:28

景嘉航完成数千万元天使轮融资,专注新型靶向放射性药物开发
近日,杭州景嘉航生物医药科技有限公司(AB-RayBio Therapeutics,简称“景嘉航”)完成数千万元人民币的天使轮融资,由杭实资管领投,正
2025-06-13 10:53

CDE:已取得药品批准文号的两种或者两种以上具有独立的适应症和用法用量的化学药品,如何申请组合包装?
已取得药品批准文号的两种或者两种以上具有独立的适应症和用法用量的化学药品,如申请组合包装,应通过什么途径提出申请,申报资料有什么要求?
2025-06-12 21:44

赛诺菲加速尼塞韦单抗全球发货,提前数月助力医务工作者应对今年RSV流行季
赛诺菲将于2025年第三季度初启动尼塞韦单抗的全球发货工作,以确保在2025-2026年呼吸道合胞病毒流行季来临前,实现广泛供应。
2025-06-12 17:31

CDE发布《先进治疗药品的范围、归类和释义(征求意见稿)》
本文件所称先进治疗药品,是指符合药品相关管理规定,按照药品的路径进行研制、生产、经营、 使用和监管,且经体外操作生产并在人体内发挥预期功能的细胞治疗药品、基因治疗药...
2025-06-11 22:06

安图生物注销了一控股子公司
近日,安图生物发布公告称,公司控股子公司安图莫比已完成注销手续,该公司是安图生物与Mobidiag Oy(以下简称Mobidiag)在6年前成立的合资企业,伴随着注销,如今正式落幕。
2025-06-11 15:25

因美纳发布2024年度企业社会责任报告,持续释放基因组学的力量
报告重点阐述了因美纳在推动精准医疗更加可及、赋能公众与社群、在业务中践行可持续发展、尽责运营和秉持诚信领导原则等方面的持续努力。
2025-06-11 14:21

破解传统疗法局限,华东医药脂溢性皮炎外用制剂国内III期临床获批
由中美华东申报的一项评价0 3%罗氟司特泡沫(ZORYVE®)在脂溢性皮炎患者中有效性和安全性的多中心、随机、双盲、赋形剂平行对照的III期临床试验申请获得批准。
2025-06-11 09:57

医药领域有哪些新探索,中办 国办关于深入推进深圳综合改革试点深化改革创新扩大开放的意见
深化药品医疗器械审评审批制度改革,提升口岸药品监管和检验检测能力。完善临床急需进口药品、医疗器械使用及监督管理制度,探索将国际新药临床真实世界数据用于进口药品注册上...
2025-06-10 22:13

默克治疗腱鞘巨细胞瘤的药物匹米替尼上市许可申请获受理
基于III期MANEUVER研究的阳性数据,这是Pimicotinib这一潜在“同类最优”TGCT治疗药物的全球首个申报
2025-06-10 14:25