华大基因一纸关于成立前瞻业务单元,由前华大基因CEO王俊负责探索以人工智能为核心的新业务。一时间,各种猜想、祝福和阴谋论充斥于媒体和社交网络。历经十五年,华大基因在基因组方面的强悍实力早已蜚声海内外,但人工智能?虽然炙手可热,但这真的足以让王俊投入下一个十五年?把目光投向一家美国初创公司,或许这能给我们一些启示。
Deep Genomics,源自多伦多大学的一家创业公司。对人工智能稍有了解的人就能看出这个名字的含义:Deep Genomics = Deep Learning + Genomics。Deep Genomics致力于利用机器学习算法来预测基因组上的突变会如何改变细胞,进而知道会给人体带来什么改变。Deep Genomics的第一个产品是SPIDEX,预测基因组突变对RNA剪切的影响。关于SPIDEX的方法学细节,可以查看2015年1月的Science。机器学习专家、基因组学专家和精准医疗专家组成的团队,让这个公司很快就登上了Nature Biotechnology、科学美国人、WIRED、CBC新闻等学术、科普、科技和传统媒体。
Deep Learning,深度学习,一种模拟人类大脑工作方式的机器学习算法,近年来被广泛用于语音识别、图像识别等海量非结构化数据学习。Google、Facebook、微软等IT巨头在深度学习领域都投入巨资,国内的百度挖来深度学习领域的华人大神余凯成立百度深度学习研究院,随后再引入深度学习巨匠Andrea Ng担任研究院院长。余凯老师今年从百度离职,据悉将在人工智能芯片方面开始创业----可以相信,余凯老师看到了以深度学习为代表的机器学习技术更广阔的应用场景和商业化前景。
通过模拟人脑的工作方式设计和开发人工智能模型和算法一直以来就是人工智能领域的一个重要发展方向。脑科学的发展,让我们知道人类的大脑是通过很多层结构对数据进行抽象和学习的。但传统的神经网络算法,受制于数据量和计算能力,往往只有很少的几层。即便如此,神经网络算法也广泛的用于互联网、工业控制、以及生命科学等诸多领域。随着以分布式存储和计算、GPU和MIC等众核计算技术在最近十来年的神速进步,以及互联网在采集数据方面的强大能力,人们开始研究如何实现有更复杂的层次结构,可以处理更复杂的数据,尤其是非结构化数据的机器学习算法。深度学习中所谓的深度就来自这复杂的层次结构,让人觉得是一个深不见底的黑洞。
如前所述,深度学习在语音识别、图像识别等领域取得了巨大的成功,让这些之前只存在于科幻电影中的技术迅速地步入大众生活。但在生命科学领域,这个被宣称正在快速从实验科学变为理论科学、数据科学的领域,深度学习并没有带来革命性的变化,零星的科研论文出现在生物信息学和基因组学的学术期刊上,波澜不惊。相对于图像数据和语音数据,生命科学数据获取的高成本使得数据积累量还远远满足不了一般意义上的深度学习模型的需求,而商业模型的不成熟也阻碍了商业机构在这方面的投入。
Deep Genomics 在技术方面的工作已经发表在了今年一月份的Science和去年6月份的Bioinformatics上,最新的工作即将在Nature Biotechnology上发表。例如,在Bioinformatics上发表的文章中,主要的数据是11019份小鼠的可变外显子(alternative exons)的RNA-Seq数据,然后据此构建深度神经网络来预测组织间的剪切模式。显然,使用小鼠和局限于外显子,大幅度的降低了构建大规模训练数据集的成本。一万多份样本,在图形、机器感知等领域还是很小的样本,但在生命科学领域,尤其是高通量组学领域,已经算得上是不小的样本量了。但这并不是高不可攀,安徽医科大学发表在Nature Genetics上的银屑病项目也对约两万人的样本进行了目标区域捕获测序。对这样规模的数据构建深度学习模型,在模型设计和计算效率上都不存在太大的困难。
随着基因组学技术在医学,尤其是诊断领域的市场不断扩大,华大基因已经从一家发不出工资的体制外科研机构走向基础研究和商业化并重的行业巨头。从买来无以伦比的测序能力,“工业化生产”的基因组学论文,到收购Complete Genomics进军行业上游获得有自主知识产权的基因组数据产出能力。下一步,如何让从这些数据中挖掘出更有价值的东西,人工智能是不可或缺的工具。
Deep Genomics走出了人工智能和基因组数据整合商业化的一步,华大基因会在这条道路上前进多远?
十五年,或许还走不完这条路。
来源:biodata 微信公众号 作者: 陈钢
为你推荐

诺和诺德与阿里健康启动战略合作,助力慢病管理数字化升级
2025年6月16日,诺和诺德与阿里健康宣布达成战略合作。在国家持续推进“体重管理年”行动的背景下,双方将依托诺和诺德百余年深耕慢病领域的专业经验和创新治疗方案,以及阿里健...
2025-06-16 14:58

治疗阿尔茨海默病国产新药断货与思考
近日,许多患者家属反映买不到治疗阿尔茨海病的新药甘露特钠胶囊,经过了解,也证实该药在许多医院和药店确实“断货”,作为中国治疗阿尔茨海默病处方量最大的药物之一,也是目...
文/上海市精神卫生中心肖世富 广州医科大学附属第二医院刘军 北京和睦家医院李慧英 2025-06-16 11:35

连续第四年,2025年纠正医药购销领域和医疗服务中不正之风工作要点发布
发挥穿透式审计监督优势,加强医药行业专项审计。打通从原材料采购、药品耗材生产、招标采购的监管通路,将监管重点向生产端覆盖。探索建立药品生产加工到流通使用全过程可追溯...
2025-06-13 22:55

国家卫健委:人间传染的高致病性病原微生物实验活动审批管理办法
本办法适用于三级、 四级实验室从事《人间传染的病原微生物目录》 规定的应当在三级、 四级实验室开展的人间传染的高致病性病原微生物或者疑似高致病性病原微生物实验活动的审批。
2025-06-13 22:34

半年融资超2亿元,美创医疗攻克“卡脖子”技术
此次融资将加速美创医疗在医用植入级ePTFE材料产线建设、创新产品研发及商业化推广上的布局,助推中国高端医疗器械真正实现进口替代。
2025-06-13 13:22

拟再易主,派林生物或变为央企控股企业
日前,派林生物发布公告称,中国生物技与派林生物控股股东共青城胜帮英豪投资合伙企业(简称“胜帮英豪”)签署收购框架协议,拟受让后者持有的21 03%股份。若本次交易顺利推进...
2025-06-13 12:43

依视路®星趣控®亮相Vision China 2025,重磅发布依视路®星趣控®2.0镜片
在2025年视觉健康创新发展国际会议(Vision China)期间,儿童青少年近视管理品牌依视路®星趣控®重磅发布全“星”一代儿童青少年解决方案——依视路®星趣控®2 0镜片
2025-06-13 11:28

景嘉航完成数千万元天使轮融资,专注新型靶向放射性药物开发
近日,杭州景嘉航生物医药科技有限公司(AB-RayBio Therapeutics,简称“景嘉航”)完成数千万元人民币的天使轮融资,由杭实资管领投,正
2025-06-13 10:53

CDE:已取得药品批准文号的两种或者两种以上具有独立的适应症和用法用量的化学药品,如何申请组合包装?
已取得药品批准文号的两种或者两种以上具有独立的适应症和用法用量的化学药品,如申请组合包装,应通过什么途径提出申请,申报资料有什么要求?
2025-06-12 21:44

赛诺菲加速尼塞韦单抗全球发货,提前数月助力医务工作者应对今年RSV流行季
赛诺菲将于2025年第三季度初启动尼塞韦单抗的全球发货工作,以确保在2025-2026年呼吸道合胞病毒流行季来临前,实现广泛供应。
2025-06-12 17:31

CDE发布《先进治疗药品的范围、归类和释义(征求意见稿)》
本文件所称先进治疗药品,是指符合药品相关管理规定,按照药品的路径进行研制、生产、经营、 使用和监管,且经体外操作生产并在人体内发挥预期功能的细胞治疗药品、基因治疗药...
2025-06-11 22:06

安图生物注销了一控股子公司
近日,安图生物发布公告称,公司控股子公司安图莫比已完成注销手续,该公司是安图生物与Mobidiag Oy(以下简称Mobidiag)在6年前成立的合资企业,伴随着注销,如今正式落幕。
2025-06-11 15:25

因美纳发布2024年度企业社会责任报告,持续释放基因组学的力量
报告重点阐述了因美纳在推动精准医疗更加可及、赋能公众与社群、在业务中践行可持续发展、尽责运营和秉持诚信领导原则等方面的持续努力。
2025-06-11 14:21

破解传统疗法局限,华东医药脂溢性皮炎外用制剂国内III期临床获批
由中美华东申报的一项评价0 3%罗氟司特泡沫(ZORYVE®)在脂溢性皮炎患者中有效性和安全性的多中心、随机、双盲、赋形剂平行对照的III期临床试验申请获得批准。
2025-06-11 09:57

医药领域有哪些新探索,中办 国办关于深入推进深圳综合改革试点深化改革创新扩大开放的意见
深化药品医疗器械审评审批制度改革,提升口岸药品监管和检验检测能力。完善临床急需进口药品、医疗器械使用及监督管理制度,探索将国际新药临床真实世界数据用于进口药品注册上...
2025-06-10 22:13

默克治疗腱鞘巨细胞瘤的药物匹米替尼上市许可申请获受理
基于III期MANEUVER研究的阳性数据,这是Pimicotinib这一潜在“同类最优”TGCT治疗药物的全球首个申报
2025-06-10 14:25