騰訊AI Lab 3篇蛋白質(zhì)組論文入選國(guó)際頂級(jí)期刊
從根本上闡釋生命提供重要技術(shù)參考
3月20日,騰訊 AI Lab實(shí)驗(yàn)室3篇蛋白質(zhì)組論文正式入選國(guó)際頂級(jí)學(xué)術(shù)期刊,論文分別在數(shù)據(jù)庫(kù)、AI建模、AI輔助臨床三個(gè)角度提出了全新的研究方案,為人類(lèi)高效精準(zhǔn)分析蛋白質(zhì)組數(shù)據(jù)、理解腫瘤微環(huán)境、發(fā)現(xiàn)生物學(xué)新機(jī)制打下堅(jiān)實(shí)基礎(chǔ),并從根本上闡釋生命提供重要技術(shù)參考。
科學(xué)界曾認(rèn)為,只要繪制出人類(lèi)基因組序列圖,就能了解疾病的根源,但事實(shí)并非如此。相同的基因往往有不同的表達(dá),比如,人體不同組織器官的基因組是一樣的,但是各個(gè)組織器官的蛋白質(zhì)組不完全一樣。中國(guó)科學(xué)院院士賀福初曾表示,要真正闡釋生命,必須從蛋白質(zhì)組中尋找答案。
目前,人類(lèi)對(duì)蛋白質(zhì)組的研究已經(jīng)進(jìn)入單細(xì)胞級(jí)別,但對(duì)于單細(xì)胞的研究缺乏足夠的大規(guī)模集成數(shù)據(jù)庫(kù),阻礙了研究人員獲取和探索單細(xì)胞蛋白質(zhì)組數(shù)據(jù)。騰訊 AI Lab研究人員在最新的論文中基于AI技術(shù),提供了目前全球數(shù)據(jù)量最大,覆蓋技術(shù)和數(shù)據(jù)集最為廣泛的單細(xì)胞蛋白質(zhì)數(shù)據(jù)庫(kù),包括133個(gè)基于抗體的單細(xì)胞蛋白質(zhì)組數(shù)據(jù)集,涉及超過(guò)3億個(gè)細(xì)胞和超過(guò)800個(gè)標(biāo)記/表面蛋白質(zhì),這個(gè)數(shù)據(jù)庫(kù)將為人類(lèi)探索蛋白質(zhì)組學(xué)提供詳細(xì)的數(shù)據(jù)參考。
針對(duì)單細(xì)胞蛋白質(zhì)組的研究,另一項(xiàng)重要的技術(shù)就是精準(zhǔn)檢測(cè)。準(zhǔn)確檢測(cè)單細(xì)胞內(nèi)部蛋白質(zhì)組的特征對(duì)于疾病篩查具有重要意義,但目前傳統(tǒng)的檢測(cè)技術(shù)存在諸多弊端,阻礙了單細(xì)胞蛋白質(zhì)組數(shù)據(jù)的準(zhǔn)確分析和使用。針對(duì)此,騰訊AI Lab在另一篇論文中,借助AI建模提出了一種新穎的多功能算法scPROTEIN,創(chuàng)造性解決了單細(xì)胞蛋白組學(xué)數(shù)據(jù)的特殊挑戰(zhàn)。這一研究成果為基于單細(xì)胞蛋白質(zhì)組的腫瘤發(fā)生發(fā)展機(jī)制研究、藥物靶點(diǎn)發(fā)現(xiàn)和腫瘤早篩和微環(huán)境研究提供重要的AI輔助作用。
如果說(shuō)上一篇論文聚焦的是單細(xì)胞內(nèi)部,那么在第3篇論文中,騰訊AI Lab的研究人員聚焦細(xì)胞外的組織結(jié)構(gòu),從更為宏觀的角度來(lái)分析特定組織中不同細(xì)胞類(lèi)型(比如腫瘤)的比例,從而更為科學(xué)的輔助治療。為此,騰訊AI Lab提出一種全新的反卷積方法,在單細(xì)胞數(shù)據(jù)的情況下,從組織蛋白質(zhì)組數(shù)據(jù)中挖掘出特定細(xì)胞類(lèi)型比例這一全新信息,從而獲取其中的腫瘤微環(huán)境信息,助力腫瘤輔診和預(yù)后分析。
據(jù)了解,騰訊AI Lab在AI for Science特別是生命科學(xué)領(lǐng)域深耕數(shù)年,具有豐富的知識(shí)和技術(shù)積累,研究領(lǐng)域包括單細(xì)胞多組學(xué)、蛋白質(zhì)結(jié)構(gòu)設(shè)計(jì)、蛋白質(zhì)折疊、AI制藥、空間組學(xué)和免疫組庫(kù)等,已發(fā)表scBERT和獼猴大腦圖譜等研究成果。成立于2016年的騰訊AI Lab,以“學(xué)術(shù)有影響,工業(yè)有產(chǎn)出”為目標(biāo),已經(jīng)將AI能力運(yùn)用在游戲、內(nèi)容、虛擬人以及醫(yī)療、醫(yī)藥、基因計(jì)算等多個(gè)場(chǎng)景中。
論文鏈接:
《SPDB: a comprehensive resource and knowledgebase for proteomic data at the single-cell resolution》 入選生物信息學(xué)領(lǐng)域數(shù)據(jù)庫(kù)方面專(zhuān)業(yè)期刊Nucleic Acids Research。
《A Versatile Deep Graph Contrastive Learning Framework for Single-cell Proteomics Embedding》入選Nature旗下方法學(xué)專(zhuān)業(yè)期刊Nature Methods。
《Deep domain adversarial neural network for the deconvolution of cell type mixtures in tissue proteome profiling》入選Nature旗下機(jī)器學(xué)習(xí)專(zhuān)業(yè)期刊Nature Machine Intelligence
- 北大開(kāi)源最強(qiáng)aiXcoder-7B代碼大模型!聚焦真實(shí)開(kāi)發(fā)場(chǎng)景,專(zhuān)為企業(yè)私有部署設(shè)計(jì)2024-04-09
- 剛剛,圖靈獎(jiǎng)揭曉!史上首位數(shù)學(xué)和計(jì)算機(jī)最高獎(jiǎng)“雙料王”出現(xiàn)了2024-04-10
- 8.3K Stars!《多模態(tài)大語(yǔ)言模型綜述》重大升級(jí)2024-04-10
- 谷歌最強(qiáng)大模型免費(fèi)開(kāi)放了!長(zhǎng)音頻理解功能獨(dú)一份,100萬(wàn)上下文敞開(kāi)用2024-04-10