AlphaFold預(yù)測了幾乎所有已知蛋白質(zhì)!涵蓋100萬物種2.14億結(jié)構(gòu),數(shù)據(jù)集開放免費用
DeepMind創(chuàng)始人:這是給人類的一份禮物
明敏 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
全世界幾乎所有已知蛋白質(zhì)結(jié)構(gòu),都被AlphaFold預(yù)測出來了!
在預(yù)測出人類98.2%蛋白質(zhì)一年后,DeepMind的重磅成果再次引爆學術(shù)界。
包括植物、細菌、真菌在內(nèi)的100萬個物種、2.14億個蛋白質(zhì)結(jié)構(gòu),現(xiàn)在都增加到了數(shù)據(jù)集中。
其中80%結(jié)構(gòu)的可信度達到了足以支撐研究實驗的水平,更有35%達到了高置信度。
而且這些數(shù)據(jù)全部免費開放!
DeepMind表示,以后查找蛋白質(zhì)結(jié)構(gòu),會像使用搜索引擎一樣簡單。
創(chuàng)始人哈撒比斯發(fā)推激動地說:
這是我們給全人類的一份禮物。
整個科研圈也再次被點燃,網(wǎng)友紛紛表示:難以置信,感謝開放數(shù)據(jù)集!
難以想象這會為藥物研發(fā)帶來什么!
像用搜索引擎一樣查找蛋白質(zhì)
這次數(shù)據(jù)集更新,主要增加了植物、細菌、動物和其他生物的蛋白質(zhì)結(jié)構(gòu)。
去年7月,AlphaFold數(shù)據(jù)集發(fā)布了人類98.5%的蛋白質(zhì)結(jié)構(gòu),以及包含大腸桿菌、果蠅、小鼠等20個科研常用生物的蛋白質(zhì)組數(shù)據(jù)。
數(shù)據(jù)集規(guī)模從之前的35萬個蛋白質(zhì)結(jié)構(gòu),一下子提升到了大約2.14億個。
DeepMind創(chuàng)始人哈撒比斯表示,這基本上可以說是“整個蛋白質(zhì)宇宙”了。
這意味著更多領(lǐng)域的研究可以被大幅提速。
斯克里普斯研究轉(zhuǎn)化所創(chuàng)始人Eric Topol表示:
過去確定蛋白質(zhì)3D結(jié)構(gòu)往往需要數(shù)月或數(shù)年,而現(xiàn)在只用幾秒鐘。
要知道,蛋白質(zhì)作為生命活動的基石,其相關(guān)研究對藥物研發(fā)、疾病攻克、食品工程、農(nóng)業(yè)、工業(yè)等領(lǐng)域都有重要影響。
但是蛋白質(zhì)的研究卻非常復雜。
因為其功能由結(jié)構(gòu)決定,而其3D結(jié)構(gòu)又是由氨基酸以脫水縮合的方式組成多肽鏈,多肽鏈再盤曲折疊而成。
也就是說,即使科學家們已知了蛋白質(zhì)的氨基酸序列,可能的3D結(jié)構(gòu)情況仍舊非常多。
假設(shè)一個蛋白質(zhì)由100個氨基酸序列組成,那么它可能的3D結(jié)構(gòu)情況將多達2的100次方個。
過去很長一段時間里,蛋白質(zhì)預(yù)測工作主要通過科學家手動完成,比如施一公院士,就是用冷凍電鏡預(yù)測蛋白質(zhì)結(jié)構(gòu)的頂級專家。
計算機雖然也能預(yù)測蛋白質(zhì)結(jié)構(gòu),但是其準確性始終不高。
而這一局面,隨著AlphaFold2的誕生后開始發(fā)生變化。
2020年12月,AlphaFold2在CASP14(蛋白質(zhì)結(jié)構(gòu)預(yù)測比賽)中的成績,達到了史無前例的92.4/100。
和蛋白質(zhì)真實結(jié)構(gòu)之間只差一個原子的寬度,真正解決了蛋白質(zhì)折疊的問題。
在此半年后,DeepMind先后開源AlphaFold2、AlphaFold數(shù)據(jù)集,可謂是在學術(shù)圈扔下了一記重磅炸彈。
2021年底,Nature將AlphaFold2預(yù)測人類98.5%的蛋白質(zhì)并開源數(shù)據(jù)庫列入年度十大科學事件。
項目領(lǐng)隊John Jumper也因此入選年度十大人物。
已有50多萬學者訪問過數(shù)據(jù)庫
DeepMind最新公布數(shù)據(jù)顯示,目前全球已經(jīng)有190多個國家/地區(qū)、50多萬名研究人員訪問過AlphaFold數(shù)據(jù)集。
而學者們利用AlphaFold開展研究的成果也已經(jīng)開始顯現(xiàn)。
最近,發(fā)表在Science上的一篇研究表明,他們利用AlphaFold拼出了核孔復合體。
這個結(jié)構(gòu)由數(shù)百個蛋白質(zhì)組成,控制著細胞核的物質(zhì)進出,其相關(guān)研究是生物領(lǐng)域內(nèi)的重點課題。
在AlphaFold的輔助下,該團隊預(yù)測出了這一結(jié)構(gòu)中一些未知區(qū)域。
△黃色部分表示新預(yù)測結(jié)構(gòu)
DNDi(被忽視疾病藥物開發(fā)組織)也曾表示,AlphaFold2推動了他們在熱帶疾病藥物開發(fā)方面的研究。
樸茨茅斯大學酶創(chuàng)新中心(CEI)則利用AlphaFold2開發(fā)一些新的酶,可以用來降解污染環(huán)境的一次性塑料。
此外,過去一年來不少學術(shù)機構(gòu)都在開展AlphaFold的相關(guān)研究,以使得這一工具能夠讓更多學者便捷使用。
前不久,哥倫比亞大學發(fā)布了首個AlphaFold2完整復刻版模型,采用PyTorch框架。
與此同時,計算生物行業(yè)也成為了人們關(guān)注的焦點,不少公司都在推出相關(guān)業(yè)務(wù)。
或許正如網(wǎng)友所說,世界正在因此而改變。
- 4o-mini華人領(lǐng)隊也離職了,這次不怪小扎2025-08-19
- 宇樹機器人“撞人逃逸”火到國外,王興興回應(yīng):下次不遙控了2025-08-16
- 突破Claude-4編程上限!自進化Agent框架拿下新SOTA,已開源2025-08-19
- 讓OpenAI只領(lǐng)先5天,百川發(fā)布推理新模型,掀翻醫(yī)療垂域開源天花板2025-08-11