华大基因一纸关于成立前瞻业务单元,由前华大基因CEO王俊负责探索以人工智能为核心的新业务。一时间,各种猜想、祝福和阴谋论充斥于媒体和社交网络。历经十五年,华大基因在基因组方面的强悍实力早已蜚声海内外,但人工智能?虽然炙手可热,但这真的足以让王俊投入下一个十五年?把目光投向一家美国初创公司,或许这能给我们一些启示。
Deep Genomics,源自多伦多大学的一家创业公司。对人工智能稍有了解的人就能看出这个名字的含义:Deep Genomics = Deep Learning + Genomics。Deep Genomics致力于利用机器学习算法来预测基因组上的突变会如何改变细胞,进而知道会给人体带来什么改变。Deep Genomics的第一个产品是SPIDEX,预测基因组突变对RNA剪切的影响。关于SPIDEX的方法学细节,可以查看2015年1月的Science。机器学习专家、基因组学专家和精准医疗专家组成的团队,让这个公司很快就登上了Nature Biotechnology、科学美国人、WIRED、CBC新闻等学术、科普、科技和传统媒体。
Deep Learning,深度学习,一种模拟人类大脑工作方式的机器学习算法,近年来被广泛用于语音识别、图像识别等海量非结构化数据学习。Google、Facebook、微软等IT巨头在深度学习领域都投入巨资,国内的百度挖来深度学习领域的华人大神余凯成立百度深度学习研究院,随后再引入深度学习巨匠Andrea Ng担任研究院院长。余凯老师今年从百度离职,据悉将在人工智能芯片方面开始创业----可以相信,余凯老师看到了以深度学习为代表的机器学习技术更广阔的应用场景和商业化前景。
通过模拟人脑的工作方式设计和开发人工智能模型和算法一直以来就是人工智能领域的一个重要发展方向。脑科学的发展,让我们知道人类的大脑是通过很多层结构对数据进行抽象和学习的。但传统的神经网络算法,受制于数据量和计算能力,往往只有很少的几层。即便如此,神经网络算法也广泛的用于互联网、工业控制、以及生命科学等诸多领域。随着以分布式存储和计算、GPU和MIC等众核计算技术在最近十来年的神速进步,以及互联网在采集数据方面的强大能力,人们开始研究如何实现有更复杂的层次结构,可以处理更复杂的数据,尤其是非结构化数据的机器学习算法。深度学习中所谓的深度就来自这复杂的层次结构,让人觉得是一个深不见底的黑洞。
如前所述,深度学习在语音识别、图像识别等领域取得了巨大的成功,让这些之前只存在于科幻电影中的技术迅速地步入大众生活。但在生命科学领域,这个被宣称正在快速从实验科学变为理论科学、数据科学的领域,深度学习并没有带来革命性的变化,零星的科研论文出现在生物信息学和基因组学的学术期刊上,波澜不惊。相对于图像数据和语音数据,生命科学数据获取的高成本使得数据积累量还远远满足不了一般意义上的深度学习模型的需求,而商业模型的不成熟也阻碍了商业机构在这方面的投入。
Deep Genomics 在技术方面的工作已经发表在了今年一月份的Science和去年6月份的Bioinformatics上,最新的工作即将在Nature Biotechnology上发表。例如,在Bioinformatics上发表的文章中,主要的数据是11019份小鼠的可变外显子(alternative exons)的RNA-Seq数据,然后据此构建深度神经网络来预测组织间的剪切模式。显然,使用小鼠和局限于外显子,大幅度的降低了构建大规模训练数据集的成本。一万多份样本,在图形、机器感知等领域还是很小的样本,但在生命科学领域,尤其是高通量组学领域,已经算得上是不小的样本量了。但这并不是高不可攀,安徽医科大学发表在Nature Genetics上的银屑病项目也对约两万人的样本进行了目标区域捕获测序。对这样规模的数据构建深度学习模型,在模型设计和计算效率上都不存在太大的困难。
随着基因组学技术在医学,尤其是诊断领域的市场不断扩大,华大基因已经从一家发不出工资的体制外科研机构走向基础研究和商业化并重的行业巨头。从买来无以伦比的测序能力,“工业化生产”的基因组学论文,到收购Complete Genomics进军行业上游获得有自主知识产权的基因组数据产出能力。下一步,如何让从这些数据中挖掘出更有价值的东西,人工智能是不可或缺的工具。
Deep Genomics走出了人工智能和基因组数据整合商业化的一步,华大基因会在这条道路上前进多远?
十五年,或许还走不完这条路。
来源:biodata 微信公众号 作者: 陈钢
为你推荐

阿斯利康最新披露:在中国或面临800万美元新罚款
据相关报道,英国当地时间4月29日,阿斯利康在最新季度的财报会议上透露,就在华涉嫌非法进口药品一事,公司可能可能会在中国面临一项新的罚款。
2025-04-30 15:53

君合盟生物重组A型肉毒毒素临床试验双线突破,覆盖严肃医疗与消费医疗两大领域
用于成人中、重度眉间纹适应症的III期临床试验在组长单位北京大学第一医院正式启动并完成首例入组。针对成人脑卒中后上肢痉挛治疗的II期临床试验由复旦大学附属华山医院牵头并顺...
2025-04-30 12:39

科塞尔医疗完成近亿元B+轮融资,加速血管介入器械全领域平台化布局
本轮融资由国内知名投资机构铁投巨石领投,苏高新金控持续追加投资,园雍投资跟投,资金将用于核心产品研发、全球市场推广及产能扩建。
2025-04-28 16:54

凯西集团2024财年实现双位数营收增长,不断投资研发,聚焦可持续发展
凯西集团(Chiesi Group)是一家以研发为基石的意大利国际制药集团,总部位于意大利帕尔马,业务覆盖全球31个国家和地区。在2024财年,凯西集团圆满收官,取得了强劲的财务业绩...
2025-04-28 11:29

别让肺结节成心结,肺健康清“结”公益行动在人民日报社正式启动
2025年4月27日,《爱肺行动》之别让肺结节成心“结”——肺健康清“结”公益行动,在北京人民日报社正式启动,由广东省钟南山医学基金会、江苏养无极药业有限公司发起,联合京东健康...
2025-04-28 10:26

被忽视的“经期头痛”,专家提醒频繁发作需及时就医
偏头痛是一种常见的慢性神经血管性疾病,不仅有中到重度的头痛症状,还常伴随多种复杂症状比如恶心、呕吐、畏光、畏声等。女性偏头痛的发病率是男性的2~3倍,约20%~25%的女性偏...
2025-04-28 09:42

A股上市公司未名医药的核心子公司,被停产
4月24日晚间,未名医药发布公告称,4月22日,天津市药监局发布公告,对公司控股子公司天津未名生物医药有限公司(以下简称“天津未名”)进行了药品GMP符合性检查。经综合评定、...
2025-04-27 11:34

瑞博生物港交所递表,小核酸药物龙头企业有望登陆资本市场
瑞博生物成立于2007年,专注于RNA干扰(RNAi)技术开发及小核酸药物产业化,是全球最早布局该领域的开拓者之一。
2025-04-27 10:36

Cytiva与中欧创新医药与健康研究中心签署全面合作协议
双方将携手在细胞治疗药物成果转化领域展开全面合作,推动大湾区生物医药产业的蓬勃发展,打造全球生物医药创新高地。
2025-04-25 19:49

精鼎医药任命 Charlotte Moser为公司首席医疗官,负责领导全球医学战略
今日(4月25日),致力于为客户提供I至IV期全方位临床开发服务的跨国合同研究组织(CRO)精鼎医药宣布,公司已任命 Charlotte Moser博士出任首席医疗官。
2025-04-25 15:06

强生宣布锐珂(埃万妥单抗注射液)联合化疗方案在华获批,用于EGFR TKI经治后局部晚期或转移性非小细胞肺癌患者治疗
强生公司今日(4月25日)宣布,旗下创新治疗药物锐珂®(埃万妥单抗注射液)正式获得国家药品监督管理局批准,与卡铂和培美曲塞联合给药,适用于治疗携带表皮生长因子受体(EGFR...
2025-04-25 15:00

《新英格兰医学杂志》发布: 研究证实速福达可将流感病毒家庭传播概率降低32%
罗氏全球今日(4月25日)宣布,速福达®(玛巴洛沙韦)III期临床试验CENTERSTONE研究详细结果在《新英格兰医学杂志》(NEJM)上发布。结果显示研究达到了主要终点:流感感染者单...
2025-04-25 13:34