机器学习的黄金年代,早期癌症治愈率或达98%

医疗健康 来源:海投联盟
2017
06/06
10:02
海投联盟 医疗健康

2016年,全球新发癌症数量超过1400万人,并导致了900万人的死亡。癌症在发达国家中已成为主要死亡原因之一,美国每年逝世的5个人当中有一人是因癌症致死。根据美国抗癌协会和国际癌症协会数据,所有的癌症都是越早治疗、治疗效果越好。癌症的早期发现,可以为病理诊断和治疗赢取更多的时间,能极大提高治愈率与患者生存周期及质量。癌症的早期筛查是个万亿级别的市场。

资本市场的火爆,得益于近十余年基因测序技术的迅猛发展,特别是在肿瘤领域的广泛应用。另一方面,机器学习技术在基因大数据处理上的大量应用,积累了前所未有的知识。这些全新的知识及组合为医疗界打开了一扇新世界的大门,使得医学工作者对许多疾病的认识、筛查和治疗都有了新的渠道和信息。

基因测序技术的进步使得基因分析更加的高效快捷

人可以被看作一台极其精密的仪器,人的一生,万亿计的细胞在体内不断复制更新,每代复制严格相同,但存在极其微小的错误率,造成所谓的基因突变。绝大多数突变无关紧要,少量突变造成抑制生长的基因的功能失常,或者激活生长基因,变成癌细胞。而癌细胞一旦逃避了免疫系统的监控,就造成生长失控变成癌组织。

一条人的基因组序列共有30亿位,按正常排版打印在A4纸上,大概有华盛顿纪念碑那么高。人与人之间会有小于千分之一的差异,癌细胞与自身的正常细胞基因组序列也会有细微的差别。基因测序的进步,让鉴别这些差别成为一件快速、高效、低成本的事。

计算机运算速度和能力的发展,进一步推动了基因分析的进步

由于人类基因组的复杂性,测序数据量非常庞大,一个人的全基因组测序数据可以达到上百G。普通的计算机技术和统计学方法无法在短时间内很好地处理这些信息,而机器学习的发展以及GPU运算的进步逐渐为科研工作者解决了这一难题。现在只需要将基因测序的数据输入经过机器学习反复训练的模型中,计算机就可以很快的分析出目标区域是否存在变异,进而找到可能变异的基因点位为医生提供更多的可用于诊断及治疗的信息。正是因为机器学习和基因测序技术的日渐成熟,以癌症筛查和诊断为首的各类疾病早筛项目渐渐成为科研及创投的热点。

机器学习是近年来非常火热的技术方向

简单来说,机器学习就是为计算机提供大量的数据,而这些数据都有他们各自对应的标签,例如我们想教会计算机识别图片中的动物,我们则要提供各种各样的动物图片,并且每一张图片都带有对应的标签,这个是猫,这个是狗等等。机器在分析大量的数据之后会在图片之中找到规律,例如猫在图片中大多是独来独往,而许多有狗的图片中还有别的动物或人类。通过这些信息,计算机不断地调整,更新它的数学模型。

当有新的图片到来时,计算机就可以根据建立好的模型来判断哪个是猫,哪个是狗。当然,这只是一个非常简单的机器学习的例子,现在的机器学习已经被广泛应用于自动驾驶,数据分析,信息挖掘,治疗诊断等等许多在过去只有人类能够胜任的工作。成百上千的学习模型被开发出来,甚至有许多不需要大量数据,或者不需要带标签的数据就能学习的模型。正如70-80年代计算机开始爆发一般,这确实是一个机器学习的黄金年代。

今天就为大家详细的阐述一下机器学习是怎样与基因测序紧密合作完成癌症早筛的。

ctDNA是什么

想理解基于基因测序的癌症早筛首先需要理解什么是ctDNA。ctDNA是circulating tumor DNA的缩写,也称为循环肿瘤DNA。是一种存在于血液、尿液、脑脊液等体液中的细胞外的基因片段,主要来自于坏死或凋亡的肿瘤细胞。ctDNA是癌症的特定标记物,如果能在血液中检测出ctDNA通常就意味着体内有癌症正在发生,这也是癌症早筛的基本原理。

然而,因为ctDNA和由正常细胞产生的游离DNA碎片是混合在一起的,只占所有游离DNA(cell-free DNA,cfDNA)含量的0.1%-1%之间,因此准确检测出ctDNA的难度相当的大。其中所涉及到的信号降噪,降低假阳性、假阴性的发生率等都是难度相当高的科研课题。

即使在体液中发现了ctDNA,由于血液循环,ctDNA可能来源于身体的任意一处,确定肿瘤在体内的生长位置也是另一件高难度的事情。得益于近些年肿瘤基因组测序结果的大量积累,科学家们发现了多种具有组织特异性的踪迹。通过机器学习的途径,结合这些踪迹信息,科学家们就能通过ctDNA来大致判断组织来源。

当然,人工智能的发展并不代表我们可以轻松地解决问题。尽管在现如今,机器学习,乃至深度学习已经拥有了许多开源的算法,哪怕只是一个普通人也可以在一定程度的学习后,运用现有的接口去开发一些简单的模型。但是也正是因为如此,不同层次的算法人才所做出的产品质量和效果也截然不同。正如汽车制造的普及使得人人都可以拥有自己的汽车,但是普通人与赛车手之间车技的差距却仍然非常明显。

同样,也因为这是个高度跨学科、知识密集型的领域,肿瘤早筛的创业团队在机器学习方面的专精程度和对肿瘤病理学的理解导致了产品质量和效果的巨大差距。譬如,由于人类基因组的高度复杂,和当前二代测序技术依然存在一定的错误,使得数据分析成为极为关键的一环。团队需要对测序数据的非常熟悉,精通数据挖掘的应用,以及对肿瘤临床知识有精准的理解。

来源:海投联盟

为你推荐

创新疗法再传积极信号,多奈单抗3年长期研究验证阿尔茨海默病干预“越早越好”资讯

创新疗法再传积极信号,多奈单抗3年长期研究验证阿尔茨海默病干预“越早越好”

TRAILBLAZER-ALZ 2长期扩展研究结果显示,在大多数研究参与者完成治疗后,记能达依然可以持续发挥减缓疾病进展的作用

2025-08-01 21:51

赛诺菲获得维亚臻在研药物普乐司兰钠注射液大中华区权利资讯

赛诺菲获得维亚臻在研药物普乐司兰钠注射液大中华区权利

同类首创 RNA 干扰(RNAi)治疗候选药物将为中国患者提供潜在治疗选择。

2025-08-01 19:21

资讯

"HER2阳性肿瘤诊疗能力提升工程启动会"召开,赋能HER2阳性胆道肿瘤精准诊疗

近日,【HER2阳性肿瘤诊疗能力提升工程】(以下简称“工程”)启动会在沪召开。会上,众多嘉宾围绕胆道肿瘤领域的治疗进展及趋势进行分享与探讨,以期推动该疾病领域的精准诊疗...

2025-08-01 15:38

华领医药首次半年扭亏,华堂宁上半年大卖176.4万盒资讯

华领医药首次半年扭亏,华堂宁上半年大卖176.4万盒

日前,华领医药发布发布业绩预告称,公司在今年上半年实现利润约11 84亿元,和去年中报的亏损1 4亿元相比,实现了自2018年上市以来的首次扭亏。

2025-08-01 11:16

礼来公布替尔泊肽重磅研究数据,或重塑糖尿病合并心血管病治疗格局资讯

礼来公布替尔泊肽重磅研究数据,或重塑糖尿病合并心血管病治疗格局

这是首个头对头比较替尔泊肽和度拉糖肽的心血管结局研究,纳入了来自30个国家 地区总计超过13,000名2型糖尿病合并动脉粥样硬化性心血管疾病成人患者, 历时超过4 5年,是迄今...

2025-08-01 08:57

国家医保局制定新上市药品首发价格机制资讯

国家医保局制定新上市药品首发价格机制

据央视新闻7月31日报道,为鼓励药品研发创新,国家医保局制定了新上市药品首发价格机制。

2025-07-31 23:50

QiviData数据分析系统实现医药数据分析国产化突破,助力CRO破解“卡脖子”难题资讯

QiviData数据分析系统实现医药数据分析国产化突破,助力CRO破解“卡脖子”难题

在医药研发外包(CRO)领域长期依赖海外数据分析工具的背景下,杭州启维软件有限公司近日宣布,其自主研发的QiviData数据分析系统V2 0已通过国家级技术验证,并与国内头部CRO企...

2025-07-31 17:26

体检争议事件引发公众健康焦虑,用AI解读体检报告量激增40%资讯

体检争议事件引发公众健康焦虑,用AI解读体检报告量激增40%

近日,一则 "女子十年体检未提示患癌风险,确诊时已是肾癌晚期 "的新闻持续发酵,也引发了公众对健康问题的关注,甚至有网友自嘲 "为体检焦虑到失眠 "。

2025-07-31 16:48

普丽妍完成近5000万美元C轮融资,再生医美龙头加速技术布局资讯

普丽妍完成近5000万美元C轮融资,再生医美龙头加速技术布局

本轮融资由未来资产资本(中国)领投,老股东雅惠投资、华泰紫金追加投资

2025-07-31 16:28

因美纳升级旗舰检测产品,加速全面肿瘤基因组分析可及资讯

因美纳升级旗舰检测产品,加速全面肿瘤基因组分析可及

因美纳TruSight™ Oncology 500 v2研究型检测产品现已上市,集成内置HRD生物标志物检测,周转时间更短,组织样本需求更低

2025-07-31 15:11

搭建递送技术平台,我国创新药企布局新型体内CAR-T疗法资讯

搭建递送技术平台,我国创新药企布局新型体内CAR-T疗法

“目前高端的细胞治疗药物价格仍高达每针数十万甚至上百万元,但通过mRNA和先进的递送技术,把高度个性化的定制疗法转变为通用型药物,将有机会把成本降至大多数患者可负担的范...

2025-07-30 17:25

中眸医疗完成数千万元融资,加速眼科基因治疗全球布局资讯

中眸医疗完成数千万元融资,加速眼科基因治疗全球布局

此次融资资金将主要用于加速核心产品ZM-02的全球多中心临床试验及后续管线开发,进一步巩固公司在眼科基因治疗领域的领先地位。

2025-07-30 17:18

恒润达生CAR-T 疗法获批上市资讯

恒润达生CAR-T 疗法获批上市

7月30日,国家药监局官网显示,恒润达生的雷尼基奥仑赛注射液(商品名:恒凯莱)获批上市。

2025-07-30 13:07

蚂蚁AI健康应用AQ推出多个“院士 AI分身”,日均免费问诊近万人资讯

蚂蚁AI健康应用AQ推出多个“院士 AI分身”,日均免费问诊近万人

顶级医学专家上线“数字分身”,正在掀起一场 AI 看病风潮。7月30日,蚂蚁集团AI健康应用AQ数据显示,中国科学院院士王建安“AI分身”上线仅3天咨询量激增280%,AI让顶级大专...

2025-07-30 12:08

刚刚,国家药监局原副局长陈时飞被立案审查资讯

刚刚,国家药监局原副局长陈时飞被立案审查

7月30日,中央纪委国家监委网站发布公告:经中共中央批准,中央纪委国家监委对国家药品监督管理局原党组成员、副局长陈时飞严重违纪违法问题进行了立案审查调查。

2025-07-30 09:20

“肝能修复站”公益快闪沪上启动,专家支招科学管理脂肪肝资讯

“肝能修复站”公益快闪沪上启动,专家支招科学管理脂肪肝

由中国医药卫生文化协会发起,快速消费品健康公司欧彼乐(Opella)、益丰大药房、意领科技联合支持的全民肝脏健康守护行动——“肝能修复站”公益快闪,于上海徐汇滨江正式启动。

文/张蓉蓉 2025-07-30 09:17

京津冀持续暴雨,蚂蚁集团AQ上线专区提供健康科普及线上义诊服务资讯

京津冀持续暴雨,蚂蚁集团AQ上线专区提供健康科普及线上义诊服务

近日,华东、华北、东北等地持续强降雨,引发洪涝和地质灾害,社会各界紧急响应。为了方便受强降雨影响的群众获得一站式的信息及服务,7月29日,蚂蚁集团旗下AI健康应用AQ推出“...

2025-07-29 20:25

讯飞医疗亮相WAIC,牵头《医疗健康行业智能体标准体系》10项核心子标准资讯

讯飞医疗亮相WAIC,牵头《医疗健康行业智能体标准体系》10项核心子标准

7月26日,以“智能时代、同球共济”为主题的2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC)在上海开幕。大模型在医疗领域的应用正从概念验证走向产业化落地,如何建...

2025-07-29 17:50