DeepMind划时代杰作!AlphaFold蛋白结构预测击败人类夺冠

医疗健康 来源:动脉网 作者:李艳瑜
2018
12/05
10:43
动脉网
作者:李艳瑜
医疗健康

11月2日,在墨西哥坎昆举行的第13届全球蛋白质结构预测竞赛(Critical Assessment of protein Structure Prediction,CASP)上。组织者宣布,DeepMind 的最新人工智能程序 ——AlphaFold 在一项极其困难的任务中击败了所有对手,成功预测生命基本分子——蛋白质的三维结构。

作为一项基础技术,DeepMind在自己博客中,将AlphaFold 称为在展示人工智能研究推动和加速新科学发现方面的“第一个重要里程碑”。

通过跨学科方法,DeepMind汇集了来自结构生物学,物理学和机器学习领域的专家,以应用尖端技术,仅根据其基因序列预测蛋白质的3D结构。

在获悉这一划时代的技术性突破后,动脉网试图通过以下逻辑,还原DeepMind再次战胜人类模型的“里程碑”事件,以及DeepMind在医疗领域所做的探索。

1. 蛋白质结构预测的划时代意义

2. DeepMind凭借什么夺冠

3. AI算法将漫长费力的预测过程缩短至几小时

4. DeepMind的AI落地将给医学带来多少颠覆

曾获得诺贝尔奖的科学难题

蛋白质是维持生命所必需的大而复杂的分子。几乎我们身体所执行的所有功能 : 收缩肌肉、感知光线或将食物转化为能量, 都可以追溯到一种或多种蛋白质以及它们如何移动和变化。这些蛋白质的配方, 称为基因。

任何给定的蛋白质可以做什么取决于其独特的3D结构。例如,构成我们免疫系统的抗体蛋白质是“Y形”的,并且类似于独特的钩子。通过锁定病毒和细菌,抗体蛋白能够检测和标记引起疾病的微生物以进行消灭。

类似地,胶原蛋白的形状像绳索,其在软骨,韧带,骨骼和皮肤之间传递张力。其他类型的蛋白质包括CRISPR和Cas9,它们像剪刀一样起作用,切割和粘贴DNA;抗冻蛋白,其3D结构允许它们结合冰晶并防止生物冻结;核糖体就像一个程序化的装配线,帮助自己构建蛋白质。

但是纯粹从其基因序列中找出蛋白质的三维形状是一项复杂的任务,科学家们已经发现了几十年的挑战。挑战在于DNA仅包含有关蛋白质构建块序列的信息,称为氨基酸残基,形成长链。预测这些链如何折叠成蛋白质的复杂3D结构就是所谓的“蛋白质折叠问题”。

预测蛋白质3D结构模型示意(图片来源:DeepMind官网)

“蛋白质折叠”是一种令人难以置信的分子折叠形式,科学界以外很少有人讨论,但却是一个非常重要的问题。生物由蛋白质构成,生物体功能由蛋白质形状决定。理解蛋白质的折叠方式可以帮助研究人员走进科学和医学研究的新纪元。

因此,蛋白质折叠(Protein Folding)问题被列为“21世纪的生物物理学”的重要课题,它是分子生物学中心法则尚未解决的一个重大生物学问题。蛋白质可在短时间中从一级结构折叠至立体结构,研究者却无法在短时间中从氨基酸序列计算出蛋白质结构,甚至无法得到准确的三维结构。

美国NIH的Christian Anfinsen博士因为发现蛋白质不需要其他帮助就可以自发地完成蛋白质折叠的过程,于1972年获得了诺贝尔化学奖。

DeepMind的联合创始人兼首席执行官Demis Hassabis说:“对DeepMind来说,这是一个非常关键的时刻,这是一个‘灯塔’项目,是我们在人员和资源方面的第一项重大投资,同时也是正在成为一个基本的、非常重要的、现实世界的科学问题。”

早在2017年,美国科罗拉多大学“JILA物理研究中心”的生物物理学家们通过更细致地测量了蛋白质折叠后发现,其折叠过程比科学家们曾经的预测更为复杂。这意味着,有关蛋白质,我们的了解程度尚在皮毛。

蛋白质分子的基本组成是氨基酸链。通过一系列中间过程,像折纸一样,氨基酸链折叠成三维结构,之后才具有功能。准确地描述这个折叠过程,需要已知所有中间状态的形态。最新研究就揭示这个过程中许多未知的状态,这一研究成果公布在3月3日的Science杂志上。

AI如何成功预测蛋白质3D结构?

此次让DeepMind再一次崭露头角的CASP, 被认为是蛋白质结构领域“奥林匹克竞赛”。在这次比赛上,DeepMind团队(参赛名为“A7D”)成功在43个参赛蛋白中拿到25个单项最佳模型,累计总分120.35排名第一。而根据第13届全球蛋白质结构预测竞赛官方披露的成绩,总分第2名的团队是一支名为“Zhang”的团队,总分为107.03。

据DeepMind介绍,该项成果的设计源于使用神经网络预测物理特性以及构建蛋白质结构预测的新方法。

这两种方法都依赖于深度神经网络,这些神经网络经过训练可以从其基因序列中预测蛋白质的特性。DeepMind的网络预测的属性是:(a)氨基酸对之间的距离和(b)连接这些氨基酸的化学键之间的角度。第一个发展是对常用技术的进步,这些技术估计氨基酸对是否彼此接近。

鉴于要研究的新蛋白质,AlphaFold使用神经网络预测氨基酸对之间的距离,以及连接它们的化学键之间的角度。在第二步中,AlphaFold调整草图结构以找到最节能的布置。

DeepMind训练了一个神经网络来预测蛋白质中每对残基之间的距离的单独分布。然后将这些概率组合成评估所提出的蛋白质结构的准确度的分数。此外,还训练了一个单独的神经网络,该网络使用汇总的所有距离来估计建议的结构与正确答案的接近程度。

使用神经网络预测物理特性(图片来源:DeepMind官网)

第二种方法通过梯度下降优化得分- 通常用于机器学习的数学技术,用于进行小的、渐进的改进这导致高度精确的结构。该技术应用于整个蛋白质链而不是在组装之前必须单独折叠的碎片,降低了预测过程的复杂性。

构建蛋白质结构预测的新方法(图片来源:DeepMind官网)

使用这些评分函数,DeepMind能够搜索蛋白质图像,找到与我们的预测相匹配的结构。第一种方法建立在结构生物学中常用的技术上,并且用新的蛋白质片段反复替换蛋白质结构的片段。为了构建AlphaFold,DeepMind在数千种已知蛋白质上训练了一个神经网络,直到它可以预测单独使用氨基酸的3D结构。

一旦AlphaFold被提供了一种新蛋白质,它就会利用其神经网络来预测其组成氨基酸对之间的距离,以及它们连接化学键之间的角度,形成一个牵伸结构。然后,AlphaFold调整此结构以找到最节能的结构。

虽然AlphaFold花了两周的时间来预测第一个蛋白质结构,但该程序现在可以在几个小时内完成。

AI将漫长费力的预测过程缩短至几小时

根据英国《卫报》报道中的数据显示,截至2010年,只有0.6%的已知蛋白序列被解析出了相应的结构。

在过去的五十年中,科学家们已经能够使用冷冻电子显微镜,核磁共振或X射线晶体学等实验技术来确定实验室中蛋白质的形状,但每种方法都依赖于大量的试验和错误,这可能需要每年高达数万美元的成本。这就是为什么生物学家正在转向人工智能方法,以此作为这一漫长而费力的过程的替代方案。

对于蛋白质折叠的复杂性,曾有外媒载文称,用当今最快的计算机模拟计算蛋白质折叠,要花100年。不过是在当时最快的计算机每秒几万亿甚至十几万亿次浮点运算的速度下,虽然目前性能最强悍的超级计算机每秒运算速度峰值可达20亿亿次,对于蛋白质折叠的模拟计算仍有可能耗费科学家数年乃至数十年的时间。

每个蛋白质都是一个氨基酸链,而后者的类型就有 20 种。蛋白质可以在氨基酸之间扭曲、折叠,因此一种含有数百个氨基酸的蛋白质有可能呈现出数量惊人(10 的 300 次方)的结构类型。通常,已经发现功能失常的蛋白质会导致疾病,并且历史上,用药物瞄准其结构、激活或停用它们会产生治愈效果。由于计算机的算法和算力局限,直到现在,了解蛋白质的结构并不容易。

根据中国科学院生物物理研究所生物大分子国家重点实验室研究员,中国科学院院士王志珍的观点,蛋白质的折叠和构象发生错误将会造成一些疾病,如阿尔茨海默氏症,帕金森氏症,亨廷顿氏症和囊性纤维化等。随着蛋白质折叠研究的深入,人们会发现更多疾病的真正病因和更加针对性的治疗方法,从而设计更有效的要素。

如果科学家能够学会从化学成分中预测蛋白质的形状,他们可以弄清楚它的作用,它可能会误导和造成伤害,并设计新的抗击疾病或履行其他职责。简而言之,了解蛋白质如何折叠,研究人员可以开创科学和医学进步的新时代。

以老年痴呆症(学名为阿尔茨海默氏症)为例,它在人体的潜伏期长达十几年之久,且病因复杂,以目前的医学技术,临床上甚至很难在发病前几年检测出这一疾病。

幸运的是,由于基因测序成本的快速降低,基因组学领域的数据非常丰富。因此,在过去几年中,依赖于基因组数据的预测问题的深度学习方法变得越来越流行。DeepMind关于这个问题的工作产生了AlphaFold,并于今年提交给了CASP。

DeepMind在博客中称:“我们很自豪能成为CASP组织者称之为‘计算方法预测蛋白质结构能力的前所未有的进步’的一部分,在进入的团队中排名第一。我们的团队专注于从头开始建模目标形状的难题,而不使用先前解析的蛋白质作为模板。我们在预测蛋白质结构的物理性质时达到了高度的准确性,然后使用两种不同的方法来构建完整蛋白质结构的预测。”

在2013年的某科技课题年度报告中(详见:http://www.nstrs.cn/xiangxiBG.aspx?id=64700,该报告仅作参照,不代表任何实际预测或判断)我们发现这样的描述:“虚拟药物筛选及计算生物学受计算机资源及计算方法与软件的限制,难以对数千万个化合物进行比较系统的虚拟筛选,也难以实现一般蛋白质结构的从头折叠模拟,无法满足创新药物和计算生物学研究的需求。因此,迫切需要开发超大规模并行的虚拟筛选,蛋白质折叠分子动力学模拟平台,来满足生命科学及创新药物研究的需求。”

从这个方向来看,DeepMind的蛋白质结构预测的应用场景之一将是用于药物创新的化合物筛选。

实际上,早在2016年AlphaGo计划击败李世石之后,DeepMind就迅速将目光投向了蛋白质折叠。2017年10月,DeepMind在一次公开采访中表示,团队开始对人工智能在药物开发中的应用感兴趣,而新药开发的关键一步,就是对靶点蛋白质三维结构的精准测算。

雷丁大学研究员Liam McGuffin表示:“预测任何蛋白质折叠形状的能力是一个大问题。它对解决许多21世纪的问题具有重大意义,影响健康、生态、环境,并基本上解决任何涉及生命系统的问题。”

屡屡突破技术创新,DeepMind在医疗领域的探索

在AlphaGo一战成名后,DeepMind曾经尝试过许多用于数据驱动的工具和技术,特别是支持人工智能的机器学习方法,为改善医疗保健系统和服务提供了希望。Alphabet的执行主席 Eric Schmidt曾表示,以AlphaGo为代表的新的深度学习能力可以提高日常生产力,为企业带来无数的机会,特别是在医疗保健、交通运输和政府领域。

眼底筛查

2016年3月,DeepMind Health(现已纳入Google Health)使用与AlphaGo系统相同的深度学习技术。已经与伦敦大学学院和Moorfields眼科医院的研究人员使用深度学习技术创建软件,通过3D扫描识别数十种常见眼病,然后建议患者进行治疗。

这项工作是三个机构之间多年合作的结果。虽然该软件尚未准备好用于临床,但它可以在几年内部署在医院中。

根据发表在《Nature Science》上的论文中描述,该软件在基于深度学习的既定原则,该原理使用算法来识别数据中的常见模式。在这种情况下,数据是使用称为光学相干断层扫描或OCT的技术对患者眼睛进行3D扫描,创建这些扫描大约需要10分钟,并且需要从眼睛内部表面反射近红外光,这样做可以创建组织的3D图像,这是评估眼睛健康的常用方法。

该软件接受了来自约7,500名患者的近15,000次OCT扫描的培训。这些人都在Moorfields眼科医院接受治疗。在一项测试中,AI的判断与八位医生组成的诊断进行了比较,该软件在94%的时间内提出了同样的建议。

乳腺癌筛查

2018年4月,Deepmind 加入了伦敦帝国理工学院英国帝国癌症研究中心领导的一项开创性的新研究合作伙伴关系,探讨人工智能技术是否可以帮助临床医生更快更有效地诊断乳腺癌乳腺癌。

研究将分析2007年至2018年期间在医院采集的大约30,000名妇女乳房X线照片。这些将通过AI技术与已经提供的历史去除乳房X线照片一起进行分析。通过英国OPTIMAM乳腺X线摄影数据库,研究该技术是否能够比现有的筛查技术更有效地发现这些X射线上癌组织的迹象。在项目过程中,Jikei大学医院也将分享来自大约30,000名女性的乳房超声检查和3,500次乳房MRI检查。

这些合作为通过提供DeepMind可用于培训医疗保健工作算法的数据在NHS中更多地使用AI奠定了基础。

协助医生制定放疗计划

2018年9月,Deepmind 伦敦大学医院NHS基金会信托基金放射治疗部门正在开发一种人工智能(AI)系统,该系统能够分析头颈癌的医学扫描图像并作为专家临床医生以类似的标准将其分类。在计划放射治疗时,器官分割过程是一个必不可少但耗时的步骤。Deepmind正在开发一种新的性能指标,用于评估认为更能代表临床过程的模型性能,以及一个测试集,帮助医生进行器官分割与危及器官勾画。

预测急性肾损伤恶化风险

2018年2月,Deepmind与美国退伍军人事务部(VA)建立医学研究合作伙伴关系,该部门是世界领先的医疗保健组织之一,负责为美国各地的退伍军人及其家人提供高质量的医疗服务。

该项目正在与世界知名的VA临床医生和研究人员一起,分析来自大约700,000个历史脱敏医疗记录,以确定机器学习是否能够准确地识别患者恶化的风险因素并正确预测其发病,主要专注于急性肾损伤(AKI)。

从DeepMind的上述研究可以发现,其在人工智能技术在诸多领域的探索仍处于试验阶段,并未进入临床阶段。

有媒体观点认为,实际上,AI在生物学的整合并非个例。近年来以google为首的人工智能团队在生物医药领域全面开花,已经在癌症病理图片识别,基因组突变检测,疾病风险评估等诸多领域取得了等于与人类水平,甚至超过人类水平的耀眼成绩。但这些表面看上去很成功的模型也都不可避免地受到普适性、可用性、可解释性的障碍。

从算法上来看,DeepMind对于蛋白质折叠基础研究的技术突破具有划时代的意义。尽管Hassabis表示,DeepMind并没有完全解决蛋白质折叠问题,预测只是第一步。“蛋白质折叠是一个极具挑战的问题,但我们有一个很好的系统,以及一些尚未实施的想法。”

一个事实是,虽然AlphaFold的成就确实值得称赞,但只有在研究论文中详细介绍并进行同行评审时,才能理解该方法的独创性,并成为一项研究成果。

话虽如此,AlphaFold在该事件中的全面成功是一个明显的迹象,科学界可能很快就能够借助技术有效地预测蛋白质的结构。

随着其视野从游戏转向现实世界的问题,看看DeepMind下一步把目光投向哪些科学问题也将是有趣的。

参考链接:

https://deepmind.com/blog/alphafold/

https://www.theguardian.com/science/2018/dec/02/google-deepminds-ai-program-alphafold-predicts-3d-shapes-of-proteins

https://mp.weixin.qq.com/s/QAzcRAnZOmlBAm3PM7ZLNA

https://mp.weixin.qq.com/s/6BTN7WTQlIyrEEgNYUR7kQ

来源:动脉网

作者:李艳瑜

医谷链

Google医疗AI商业化提速!合并DeepMind健康业务,重组Google Health

来源:动脉网   作者:李艳瑜

为你推荐

扬厉医药完成亿元级B轮融资,启明创投独家投资资讯

扬厉医药完成亿元级B轮融资,启明创投独家投资

本轮融资由启明创投独家领投,公司现有股东泰福资本、杭州国资、润璋创投继续跟投,融资资金将全额用于多款核心产品的临床研究推进。

2025-11-13 17:26

直击医工转化核心命题,全球医疗科技创新生态大会勾勒中国源创新路径资讯

直击医工转化核心命题,全球医疗科技创新生态大会勾勒中国源创新路径

波士顿科学、丹纳赫、西门子医疗三家全球领先的医疗科技企业,以开放协同的姿态诠释了“生态共融”的核心内涵,成为行业关注的焦点。

文/张蓉蓉 2025-11-13 13:18

北大医药董事长涉嫌刑事犯罪被批捕资讯

北大医药董事长涉嫌刑事犯罪被批捕

11月12日晚间,北大医药股份有限公司发布公告,公司董事长、总裁徐晰人先生因被刑事拘留,暂时无法正常履职,授权公司董事陈岳忠先生代为行使董事长职责,授权公司常务副总裁余...

2025-11-13 10:08

Illumina® Protein Prep 以NGS蛋白质组学技术为全球超过40家客户提供突破性的精准解决方案,涵盖从学术机构到大型国家生物样本库资讯

Illumina® Protein Prep 以NGS蛋白质组学技术为全球超过40家客户提供突破性的精准解决方案,涵盖从学术机构到大型国家生物样本库

自 9 月全球商业化上市以来,Illumina Protein Prep 以“开箱即用”的解决方案显著提升蛋白质组学研究的可及性,目前因美纳全球客户已完成逾 4 万个样本的处理

2025-11-13 09:24

数说心律,同心共创——共话心脏节律管理创新方案资讯

数说心律,同心共创——共话心脏节律管理创新方案

在第八届中国国际进口博览会期间,美敦力心脏节律管理业务部成功举办“数说心律,同心共创”主题活动,聚焦“以患者为中心”的创新实践,推动先进疗法造福中国。

2025-11-12 15:33

安科生物增资博生吉,获得PA3-17 注射液CAR-T产品大中华区独家代理权资讯

安科生物增资博生吉,获得PA3-17 注射液CAR-T产品大中华区独家代理权

11月11日晚间,安科生物发布公告称公司与博生吉医药科技(苏州)有限公司签署《增资协议》与《独家代理框架协议》,达成新一轮深度战略合作。

2025-11-11 22:53

首届默沙东研发中国科学日在京成功举办资讯

首届默沙东研发中国科学日在京成功举办

深化本土创新合作生态,助力中国创新走向全球化

2025-11-11 21:58

熙源安健获得超2亿元A轮融资,加速核心管线进展和全球化布局资讯

熙源安健获得超2亿元A轮融资,加速核心管线进展和全球化布局

本轮融资由北京市医药健康产业投资基金领投,渶策资本、光华梧桐、比邻星创投跟投,老股东顺禧基金、启明创投持续加投,行远致同担任财务顾问。

2025-11-11 21:52

诺华的核药将在嘉兴量产资讯

诺华的核药将在嘉兴量产

近日,跨国药企巨头诺华宣布其放射配体疗法(RLT)药物派威妥(镥[177Lu]特昔维匹肽注射液)的两个适应症同时获得国家药品监督管理局批准,分别为用于治疗既往接受过雄激素受体...

2025-11-11 18:23

国家医保局:开展医保经办全业务流程智能审核试点资讯

国家医保局:开展医保经办全业务流程智能审核试点

国家医保局确定北京市、天津市、河北省、辽宁省、浙江省、湖南省、重庆市医疗保障局为试点单位,开展医保经办全业务流程智能审核试点工作。

2025-11-11 18:15

华东医药创新药罗氟司特乳膏0.15%特应性皮炎适应症在华申报上市,强化自免皮肤领域布局资讯

华东医药创新药罗氟司特乳膏0.15%特应性皮炎适应症在华申报上市,强化自免皮肤领域布局

适用于6岁及以上轻度至中度特应性皮炎患者的局部外用治疗。

2025-11-11 17:56

贺普药业乙肝创新药物获突破性进展资讯

贺普药业乙肝创新药物获突破性进展

近日,第76届美国肝病研究协会(AASLD)年会在美国华盛顿开幕。由上海贺普药业研发的乙肝创新药贺普拉肽临床研究取得突破性进展,以大会报告形式公布了治疗慢性乙肝II期随机双盲...

2025-11-10 20:57

远大医药复方鼻喷剂莱特灵®国内成功获批,过敏性鼻炎迎全新复方治疗方案资讯

远大医药复方鼻喷剂莱特灵®国内成功获批,过敏性鼻炎迎全新复方治疗方案

全球创新药Ryaltris®复方鼻喷剂(“GSP 301 NS”或“莱特灵®”)已获国家药监局颁发药品注册证书,且在药品审评过程中未收到补充资料通知,实现“零发补”获批上市。

2025-11-10 17:37

创新医疗国际合作新范本,复星凯瑞与沙特Fakeeh共拓细胞治疗新里程资讯

创新医疗国际合作新范本,复星凯瑞与沙特Fakeeh共拓细胞治疗新里程

此次签约聚焦CAR-T细胞治疗领域,双方就共同推进该技术在沙特的临床落地和本地化发展达成了合作意向。

2025-11-10 17:32

安永吴晓颖:从“辅助工具”到“核心能力”,生成式 AI 将重塑医疗器械行业竞争格局资讯

安永吴晓颖:从“辅助工具”到“核心能力”,生成式 AI 将重塑医疗器械行业竞争格局

第八届中国国际进口博览会上,安永正式发布《生成式人工智能在医疗器械行业潜在应用》白皮书。

文/张蓉蓉 2025-11-10 16:26

科莱恩大亚湾制药产能升级落地,加码药用辅料与原料药布局资讯

科莱恩大亚湾制药产能升级落地,加码药用辅料与原料药布局

近日,科莱恩在惠州大亚湾生产基地举行护理化学品扩建项目投产仪式,此次 8000 万瑞士法郎(约7亿人民币)的战略投资中,制药领域产能升级成为核心亮点。

文/张蓉蓉 2025-11-10 15:33

赛诺菲大中华区总裁施旺:八载全勤赴进博,以“中国方案”筑梦健康中国资讯

赛诺菲大中华区总裁施旺:八载全勤赴进博,以“中国方案”筑梦健康中国

赛诺菲长期看好中国市场的繁荣前景,对医疗健康领域的未来充满信心。

2025-11-10 10:24

“医药险协同聚力,让生命无惧风雨”,罗氏医药险生态联盟启动资讯

“医药险协同聚力,让生命无惧风雨”,罗氏医药险生态联盟启动

11月7日,在第八届中国国际进口博览会上,罗氏制药展台举行了“以患者为中心,聚力守护新生”为主题的医药险生态联盟仪式。

2025-11-10 09:56

华东医药FIC三重激动剂DR10624最新临床数据披露,降低甘油三酯达75%,减少肝脏脂肪达67%资讯

华东医药FIC三重激动剂DR10624最新临床数据披露,降低甘油三酯达75%,减少肝脏脂肪达67%

DR10624在治疗重度高甘油三酯血症(SHTG)的II期临床研究(“DR10624-201研究”)中取得的重要成果

2025-11-09 21:31