AI發(fā)現(xiàn)人類腎細(xì)胞有一半結(jié)構(gòu)未知,UCSD最新研究登上Nature,算法已開源
算法叫做MuSIC
曉查 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
我們的細(xì)胞再向下一級究竟有什么?細(xì)胞核、線粒體、內(nèi)質(zhì)網(wǎng)、高爾基體……
在中學(xué)生物課里我們知道了這些,然而它們就是亞細(xì)胞結(jié)構(gòu)的全部嗎?
絕對不是!
加州大學(xué)圣地亞哥分校(UCSD)醫(yī)學(xué)院的研究人員和合作者們,通過AI技術(shù)分析出了人類腎臟細(xì)胞的70種亞系統(tǒng),發(fā)現(xiàn)其中有一半都是人類未知的。
這項研究登上了最新一期的Nature。
腎細(xì)胞中一半成分未知
科學(xué)家研究細(xì)胞內(nèi)部的結(jié)構(gòu)主要使用兩種技術(shù):熒光顯微鏡成像和生物物理關(guān)聯(lián)。
第一種方法是用熒光物質(zhì)標(biāo)定蛋白質(zhì),并在顯微鏡范圍內(nèi)跟蹤它們的運動和關(guān)聯(lián)。由此科學(xué)家們得到了人類蛋白質(zhì)圖譜(HPA)數(shù)據(jù)。
生物物理關(guān)聯(lián),是使用一種特定的抗體將蛋白質(zhì)從細(xì)胞中拉出來,分析蛋白質(zhì)上結(jié)合著什么。現(xiàn)在,科學(xué)家們已經(jīng)有了BioPlex這一數(shù)據(jù)庫。
UCSD的研究者們,就是將HPA與BioPlex中的蛋白質(zhì)數(shù)據(jù)集合到一起,然后輸入到深度神經(jīng)網(wǎng)絡(luò)中。
AI會對蛋白質(zhì)之間的“距離”進行計算分析,最后得到多尺度整合細(xì)胞圖譜(MuSIC?Map)。
多年來,UCSD團隊一直對繪制細(xì)胞內(nèi)部工作圖感興趣。MuSIC的不同之處在于使用深度學(xué)習(xí)直接從細(xì)胞顯微鏡圖像繪制細(xì)胞圖譜。
此前,他們構(gòu)建了一種叫做DCell的神經(jīng)網(wǎng)絡(luò),并且用釀酒酵母細(xì)胞作為基礎(chǔ)研究模型。他們用所有關(guān)于細(xì)胞生物學(xué)和細(xì)胞層次的知識庫,來訓(xùn)練這個標(biāo)準(zhǔn)AI算法。
DCell可以根據(jù)基因突變的信息,預(yù)測細(xì)胞可能發(fā)生的行為,結(jié)果與實驗室里的細(xì)胞行為幾乎一致
MuSIC也是一種神經(jīng)網(wǎng)絡(luò),與DCell的不同之處在于,它是細(xì)胞顯微鏡圖像到亞細(xì)胞結(jié)構(gòu)的映射。
該團隊已經(jīng)將MuSIC的代碼開源。
通過MuSIC,研究人員發(fā)現(xiàn)了一組蛋白質(zhì)形成一種過去不熟悉的結(jié)構(gòu),最終確定該結(jié)構(gòu)是結(jié)合RNA的蛋白質(zhì)新復(fù)合體,該復(fù)合體可能涉及染色質(zhì)的剪接。
未來將擴展到所有人體細(xì)胞
搞清楚亞細(xì)胞結(jié)構(gòu)對于發(fā)現(xiàn)疾病病因有重要的意義,因為大多數(shù)疾病都可以歸結(jié)于到細(xì)胞的哪個部分出了故障。
例如,腫瘤之所以能夠生長,是因為基因沒能準(zhǔn)確轉(zhuǎn)化為特定蛋白質(zhì);代謝疾病是因為線粒體沒能正常工作。
但要了解在疾病中細(xì)胞的哪些部位出了故障,科學(xué)家首先需要一份完整的亞細(xì)胞結(jié)構(gòu)清單。
這篇論文的通訊作者Trey Ideker教授指出,這是一項測試MuSIC技術(shù)的試點研究,他們只研究了661種蛋白質(zhì)和一種細(xì)胞類型。
△?Trey Ideker教授的實驗室團隊
Ideker還表示,他們的下一步是研究整個人類細(xì)胞,然后再擴展到不同的細(xì)胞類型、人和物種。最終,通過比較健康和病變細(xì)胞之間的區(qū)別,更好地了解許多疾病的分子基礎(chǔ)。
參考鏈接:
[1]https://ucsdnews.ucsd.edu/pressrelease/we-might-not-know-half-of-whats-in-our-cells-new-ai-technique-reveals
[2]https://www.nature.com/articles/s41586-021-04115-9
[3]https://idekerlab.ucsd.edu/music/
[4]https://github.com/idekerlab/MuSIC