网易首页 > 网易号 > 正文 申请入驻

生物学50年难题被解决,蛋白质版“阿法狗”预测结构准确性达92.4

0
分享至

郑集杨 发自 凹非寺
量子位 报道 | 公众号QbitAI

一早醒来,发现搞蛋白质结构研究的朋友都在纷纷自嘲:要失业了。

啊这,怎么回事?原来是结构生物学,迎来了一个「革命性」的突破。

11月30日,DeepMind宣布:AlphaFold 2,这个AI已经成功解决蛋白质折叠的问题。

这一次,AlphaFold的“准确性”均分,直接从原本的60+/100,提升至了92.4/100

而过去十几年,其他方法只能在40分左右徘徊。

△图源:Deepmind

两年前,上一版本的AlphaFold便已经取得了里程碑的突破,但是,仍然没有完全解决蛋白质折叠问题。而这次AlphaFold 2,则更进一步。

这一巨大的突破,直接引爆了全网,Nature、Science纷纷报道,生物界和AI大牛们也纷纷祝贺。

甚至很少露面的DeepMind创始人哈萨比斯,也亲自出面介绍:

DeepMind背后的终极愿景一直是构建通用人工智能,利用通用人工智能来极大地加速科学发现的步伐,帮助我们更好地了解周围世界。

而哥大生物学助理教授Mohammed AlQuraishi,更是评价道:

蛋白质结构AI进入“ImageNet时代”。

如此重大的突破,究竟带来了什么呢?让我们来快速且全面地了解一下。

CASP中斩获92.4的均分

就在11月30日,第14次CASP评估的评价结果公布了。

CASP始于1994年,是蛋白质结构预测的评估标准和全球社区,评价每两年进行一次。

△图源:Science

从1994年起,随着技术的进步,蛋白质的预测准确性在不断增加,而在今年,迎来了重大突破,预测准确性得分达到了92.4/100。

而这,便是DeepMind的AlphaFold 2系统带来的。

AlphaFold 2在所有目标上测试结果:GDT的平均得分为92.4,较难蛋白质的中位数得分也达到了87.0,这比第二名高出了25分。

GDT(Global Distance Test),是用来衡量预测准确性的主要指标。

简单来说,GDT就是:预测结果对于正确位置,在距离上的一个综合评分。

能斩获92.4的准确性高分,这说明,预测的结果,误差基本不超过一个原子的大小

这无疑是巨大的突破。

对此,CASP发起人,计算生物学家约翰·莫尔特(John Moult)表示:

从某种意义上说,蛋白质折叠的问题已经解决了。

端到端的训练

如此强大的AlphaFold 2系统,不免让人好奇,它是如何训练出来的呢?

首先,研究人员把折叠的蛋白质认为是一个「空间图」,其中残基是节点,边缘连接着非常接近的残基。

之后,建立了一个基于注意力机制的神经网络系统,端到端进行了训练。

建立的这个系统会试图解释这个图的结构,同时对它正在构建的隐式图进行推理。

在这个推理过程,还会用到生物学中已知的信息进行完善,如:进化中的同源序列多序列比对(MSA)氨基酸残基对等。

通过重复这一过程,该系统对蛋白质的潜在物理结构进行了强有力的预测,并能够在几天内确定高度准确的结构。

此外,AlphaFold还使用了内部置信度度量指标来判断蛋白质结构中哪些部分是可靠的。

之后,研究人员在公开的数据上训练了这个系统,这些数据库包括大约170000个蛋白质结构,其中便有许多未知结构的蛋白质序列。

这个训练过程花费了几周的时间,使用了大约128个TPUv3内核(大约相当于100-200个GPU)。

实验证明AlphaFold确实靠谱

不过,所谓技术突破,都总会引来一些质疑。

连组织者都担心:DeepMind可能一直在以某种方式作弊。

因此,德国马克斯·普朗克发育生物学研究所蛋白质进化学系主任安德烈·卢帕斯(Andrei Lupas)提出了一个特殊的挑战:预测一种来自古细菌群中古细菌物种的膜蛋白。

十年来,科学家虽然获取了这个蛋白质的X射线晶体结构,但是一直无法解释它。

而AlphaFold 2,输出了一个三部分构成的蛋白质详细图像,中间有两个长长的螺旋臂。

而该模型,使卢帕斯和他的同事能够理解他们的X射线数据。

这个过程,只用了半小时证,实验结果完全符合AlphaFold的预测结构。

卢帕斯惊呼:「这几乎是完美的。」

他们不可能这么作弊,我不知道他们是怎么做到的。

AlphaFold 2凭事实,告诉大家:这个进展确实真实而且靠谱的。

解决50年的挑战

克里斯蒂安·安芬森在1972年诺贝尔化学奖的获奖感言中,提出了一个著名的假设,即理论上,蛋白质的氨基酸序列应该完全决定其结构。

正是由于这一假设,引发了50年的探索,即能够仅基于1D氨基酸序列通过计算预测蛋白质的3D结构。

然而,一个主要的挑战是,一种蛋白质在进入最终的3D结构之前,理论上可以折叠的方式数量是天文数字。

1969年,Cyrus Levinthal指出,通过蛮力计算来列举一种典型蛋白质的所有可能构型需要比已知宇宙的年龄更长的时间——Levin thal估计了一种典型蛋白质的10^300种可能构象。

要知道,AlphaGo面对的围棋问题复杂度也就是10^171,蛋白质折叠问题比围棋复杂度高出129个数量级!

DeepMind的研究人员对此说道:DeepMind方法将产生深远的影响,其中包括极大地加快新药的开发速度。

马里兰大学的结构生物学家Shady Grove则表示:

这是一个已有50年历史的问题,我从没想过一辈子中能看到这个。

相关新闻:

一个困扰生物学家50年的问题,被AI突破了

众所周知,蛋白质就是一串氨基酸而已。

可是,拿到氨基酸的排列顺序,你能猜出它会折叠出怎样的三维结构么?恐怕很难。就算是天天研究蛋白质的科学家们,也被这个问题困扰了50年。

如今有只AI,能以前所未有的准确率预测蛋白结构。它给出的答案与蛋白质的真实结构之间,大约只差一个原子的宽度:

蓝色为AI预测结果,绿色为标准答案丨DeepMind

这只AI名叫AlphaFold,来自谷歌DeepMind,和会下棋的AlphaGo师出同门。它刚刚在蛋白结构预测比赛CASP14上,超越所有对手获得优胜。

消息发表之后,学界备受鼓舞。AlphaFold的存在,仿佛让科学家拥有了上帝视角。Nature把马普所生物学家Andrei Lupas的一句评论当做了新闻标题:它会改变一切

怎样的一场比赛

拿到一个氨基酸序列,每只AI都会给出自己预测的三维结构。

那么,拥有近100位参赛选手的CASP挑战赛,是依靠什么来衡量各位选手的得分?

首先,标准答案是通过低温电子显微镜(Cryo-EM)等等学界标配的实验方法检测蛋白质本身,得出的相对精确的三维结构。

然后,对比标答和选手答案之间的相似度,利用的方法叫做Global Distance Test(全球距离测试,简称GDT)。GDT满分为100,通常只要选手得分超过90,就认为一道题目做对了。

GDT评测标准丨DeepMind

把所有题目算在一起,AlphaFold得分的中位数达到了92.4,大约2/3的题目都做对了。这个成绩比其他选手高出一大截。

即便在最难的一组题目“自由建模(Free-Modelling Category)”当中,AlphaFold的中位数也有87.0分,比第二名高出25分。

CASP挑战赛两年一届,从1994年开始至今已经举办了14届,大致相当于蛋白结构预测界的奥林匹克。

比赛创办人之一、马里兰大学教授John Moult毫不吝惜对这只AI的赞美。他说,从某种程度上看,(蛋白结构预测)问题已经解决了。

对于那些AlphaFold预测与标答出现分歧的题目,Moult教授也认为,并不能确定是AI预测出了差错,还是实验室结果本身有问题。

AI是怎样炼成的

那么,AlphaFold的工作原理是怎样的?

DeepMind研究团队说,一个折叠的蛋白质可以视为一张空间图(Spatial Graph):构成蛋白质的每个残基(residue)都是图中一个节点(node),然后有边(edge)把距离相近的节点连在一起。

如此一来,过往已知结构的那些蛋白质,都可以用这样的眼光来看待。在日复一日的训练之中,AI逐渐熟悉了图上节点相连的规律。再遇到陌生考题的时候,便可以按照之前摸出的规律,连出一幅新的图来。

残基相连的方式预测丨DeepMind

2018年,AlphaFold官宣之初,便拿下了CASP13冠军。虽然,那时它的得分中位数没有达到90,也就是总体上没达到系统判定正确的分数线,却也远远超越了其他选手。

从那时起,欢呼和质疑一并到来了。许多人都担心,这只AI用某种人们不知道的方式作了弊。

不过,在一种名叫Orf3a的蛋白质上,AlphaFold证明了自己。加州大学伯克利分校的分子神经生物学家Stephen Brohawn说,AI预测出的蛋白结构,和后来实验室用低温电子显微镜做出的成像十分接近。

那么,AI拥有这样的能力,到底意味着什么?

影响了谁的工作

大约半个世纪以前,有位名叫克里斯蒂安·安芬森的科学家,在研究RNA酶的时候发现:对一些蛋白质来说,只要环境不变,它的天然结构便只由氨基酸序列决定。

安芬森丨National Institutes of Health

换句话说,给定一个氨基酸序列,理论上就可以预测出蛋白质的三维结构

安芬森因此获得了1972年的诺贝尔化学奖。他提出的这条假说也有了个响亮的名号:安芬森原则

后来的几十年间,科学家们在预测蛋白结构的路上艰难地前行,希望有朝一日能把“理论上”这几个字去掉。

毕竟,蛋白质的功能,要靠折叠成特定的结构才能实现。

而那些设计新药或者新酶的科学家们,如果能了解某种蛋白质的结构,便可以更好地预判某种蛋白质能不能和特定的分子结合,进而带来他们希望看到的反应。

假如AI能够准确预测蛋白质的结构,许多科学家的工作(没有被取代的话)可能都会变得更高效。

参考文献

[1] The AlphaFold team. (2020, November 30). AlphaFold: A solution to a 50-year-old grand challenge in biology. Retrieved from https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

[2] Callaway, E. (2020, November 30). 'It will change everything': DeepMind's AI makes gigantic leap in solving protein structures. Retrieved December 01, 2020, from https://www.nature.com/articles/d41586-020-03348-4

[3] Robert F. ServiceNov. 30, 2., Charles PillerNov. 29, 2., Jop de VriezeNov. 25, 2., Jon CohenNov. 25, 2., Shreya DasguptaNov. 25, 2., Kai KupferschmidtNov. 24, 2., . . . Lucy HicksOct. 30, 2. (2020, November 30). 'The game has changed.' AI triumphs at solving protein structures. Retrieved December 01, 2020, from https://www.sciencemag.org/news/2020/11/game-has-changed-ai-triumphs-solving-protein-structures

作者:栗子

编辑:Luna

一个AI

今年AlphaFold还预测了新冠病毒几种蛋白的结构,就等对答案了。

责任编辑:曹逸群_NB19194

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不建议你吃三文鱼的原因,只有一个

不建议你吃三文鱼的原因,只有一个

丁香生活研究所
2024-04-18 12:09:41
拍客|“王婆说媒”现场男子与女主播发生冲突 工作人员:会加强现场安保

拍客|“王婆说媒”现场男子与女主播发生冲突 工作人员:会加强现场安保

封面新闻
2024-04-19 16:52:06
新版《成都市物业管理条例》10月1日起实施,业主有权提出物业费调价,车位不得只售不租

新版《成都市物业管理条例》10月1日起实施,业主有权提出物业费调价,车位不得只售不租

红星新闻
2024-04-18 19:18:23
突然确诊!上海人熟悉的她坦言:曾恨不得抓紧每分钟赚钱,如今……

突然确诊!上海人熟悉的她坦言:曾恨不得抓紧每分钟赚钱,如今……

上观新闻
2024-04-19 22:29:22
河南一高校运动会,白裙学姐杀疯,网友:理工院校也有豪门白月光

河南一高校运动会,白裙学姐杀疯,网友:理工院校也有豪门白月光

育学笔谈
2024-04-16 13:18:40
万科真的是中国房地产最后一颗“雷”吗?

万科真的是中国房地产最后一颗“雷”吗?

经理人杂志
2024-04-17 11:10:54
给兵器取名只服古龙,金庸10大兵器名字跟古龙10大兵器相比差远了

给兵器取名只服古龙,金庸10大兵器名字跟古龙10大兵器相比差远了

武侠新世界
2024-04-19 09:32:59
约翰逊“不做历史罪人”让俄罗斯愕然,乌军多条战线击退俄军

约翰逊“不做历史罪人”让俄罗斯愕然,乌军多条战线击退俄军

史政先锋
2024-04-19 23:48:03
老婆让她闺蜜给我做个男科手术,半梦半醒之间,我感觉自己下半身的触感不对劲

老婆让她闺蜜给我做个男科手术,半梦半醒之间,我感觉自己下半身的触感不对劲

户外阿崭
2024-04-18 11:15:48
400人,她丈夫是出轨界天花板吧_699_95

400人,她丈夫是出轨界天花板吧_699_95

王小花说情感
2024-04-18 21:27:09
国足危!连失2单刀,输得遗憾,为何0球0分?董路一针见血:就2字

国足危!连失2单刀,输得遗憾,为何0球0分?董路一针见血:就2字

话体坛
2024-04-19 23:40:53
淘汰樊振东!林高远赛后一番发言谦虚低调?球迷担心:或难赢张本

淘汰樊振东!林高远赛后一番发言谦虚低调?球迷担心:或难赢张本

开心体育站
2024-04-19 23:29:01
沈梦辰和老公排队买华为,杜海涛胖回180斤,小两口牵手恩爱十足

沈梦辰和老公排队买华为,杜海涛胖回180斤,小两口牵手恩爱十足

娱乐圈酸柠檬
2024-04-19 18:12:35
明年起,个人存款超过50万的居民,或将面临“三大麻烦”!

明年起,个人存款超过50万的居民,或将面临“三大麻烦”!

腊五
2024-04-19 23:23:47
给女友买3600一套的JK,她却穿着陪别人睡

给女友买3600一套的JK,她却穿着陪别人睡

新青年大院NEWYOUTH
2024-04-18 20:24:33
30岁的世界之窗,已经没有人去“看世界”了?

30岁的世界之窗,已经没有人去“看世界”了?

深圳微时光
2024-04-17 21:06:31
老杜模仿许妈穿阔腿裤,上链接还没直播商家反应快直接给她下架了

老杜模仿许妈穿阔腿裤,上链接还没直播商家反应快直接给她下架了

娱乐圈酸柠檬
2024-04-19 22:48:06
房价调整第一城,取消限购了!

房价调整第一城,取消限购了!

城市财经
2024-04-19 11:41:41
又一省会城市全面取消限购!曾是反炒房“优等生”

又一省会城市全面取消限购!曾是反炒房“优等生”

南方都市报
2024-04-19 10:20:39
以色列不讲武德,说好的下个月回击,却突然向伊朗发射导弹

以色列不讲武德,说好的下个月回击,却突然向伊朗发射导弹

山河路口
2024-04-19 11:05:21
2024-04-20 07:12:49
量子位
量子位
追踪人工智能动态
9300文章数 175238关注度
往期回顾 全部

科技要闻

最沉默的李想,最便宜的理想

头条要闻

媒体:以色列对伊朗的反报复刀刀见血 要真的打痛伊朗

头条要闻

媒体:以色列对伊朗的反报复刀刀见血 要真的打痛伊朗

体育要闻

米切尔这次对线不会输了吧

娱乐要闻

北影节开幕之夜,内娱女星千娇百媚

财经要闻

新华资管香港的秘密:猛投地产或致巨亏

汽车要闻

风神L7预售 东风汽车北京车展阵容公布

态度原创

健康
游戏
房产
旅游
数码

这2种水果可降低高血压死亡风险

诸葛亮北伐路上的头号克星郭淮,王者之心里换成姜维能不能拿下?

房产要闻

国企下场,海口疯狂抢地!

旅游要闻

西宁“下南关”:高原老街的烟火气

数码要闻

三星Neo QLED 8K QN900D体验:4K内容秒变8K 片源不再是问题

无障碍浏览 进入关怀版