科學(xué)家在人類身上發(fā)現(xiàn)155個(gè)新基因!都是“從0出現(xiàn)”
人類仍在進(jìn)化
豐色 蕭簫 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
“人類又偷偷進(jìn)化不帶上我?”
雖然是個(gè)段子,不過新研究發(fā)現(xiàn),人類的基因整體確實(shí)發(fā)生了進(jìn)化——
來自歐洲的一群科學(xué)家對新發(fā)布的人類基因數(shù)據(jù)集進(jìn)行了研究,發(fā)現(xiàn)了155個(gè)“獨(dú)特”的基因。
要知道,雖然新基因也可以從基因重復(fù)(復(fù)制基因)事件中誕生,即含有基因的DNA片段發(fā)生重復(fù),但這155個(gè)新基因卻是“憑空出現(xiàn)”的。
這些基因雖然非常?。╩icrogenes),但對人體的作用卻不可忽視,有些甚至與人類的某些特異性疾病有關(guān),包括肌肉萎縮癥、色素性視網(wǎng)膜炎等。
目前,這項(xiàng)研究正式登上《細(xì)胞》子刊Cell Reports,通訊作者之一Aoife McLysaght興奮地表示:
這是一個(gè)全新的領(lǐng)域。
這些基因往往被忽略,因?yàn)樗鼈兒茈y研究,但人們會越來越意識到它們是需要被關(guān)注和考慮的。
那么這些新基因究竟是什么,它們又長啥樣?
這些新基因是什么?
這些新基因的出現(xiàn),最初“并不起眼”——是以sORF的形態(tài)出現(xiàn)的。
ORF(open reading frame),全稱“開放閱讀框”,是基因序列的一部分,包含一段可以編碼蛋白的堿基序列。
sORF(small ORF)顧名思義,則是一種體積非常小的ORF,一般由不到300個(gè)核苷酸構(gòu)成。
雖然大部分sORF的出現(xiàn)只是一種生物噪聲(導(dǎo)致細(xì)胞內(nèi)mRNA和蛋白質(zhì)產(chǎn)生變化的一種生化反應(yīng)),但許多依舊具有編碼微蛋白?(microprotein)的潛能。
但sORF畢竟太小了,此前受限于技術(shù),一直被研究得不多,大部分基因也都沒有被注釋,更別提用它編碼出的微蛋白了。
然而,微蛋白的研究對于生物研究又是不可或缺的。
畢竟對于某些已經(jīng)有研究的生物學(xué)過程,微蛋白很可能也會參與其中,并在生理和病理過程中發(fā)揮重要作用,然而這些作用此前卻是未知的。
隨著技術(shù)的進(jìn)步,不少生物科學(xué)家們開始嘗試重新探索這一領(lǐng)域,試圖通過研究微蛋白,來探討它們對人類健康和疾病造成的影響。
根據(jù)長期對比觀察微蛋白,科學(xué)家們找到了一些sORF序列,這些序列具有高度保守性,被稱為高度保守序列(highly conserved)。
高度保守序列,指在不同類型生物體中非常相似的DNA序列。
研究認(rèn)為這些跨物種的相似性,可以證明某個(gè)基因完成了不同生物中的共同基本功能,因此在進(jìn)化過程中保留了這些序列。
大多數(shù)研究都會排除非保守性、新穎的基因序列。
這次,歐洲科學(xué)家們就基于一個(gè)從非規(guī)范ORF轉(zhuǎn)譯而來的微蛋白數(shù)據(jù)集,重構(gòu)了人類微蛋白的進(jìn)化起源。
結(jié)果,還真發(fā)現(xiàn)了不少此前沒注意到的基因。
44個(gè)與生命健康有關(guān)
首先,科學(xué)家們根據(jù)數(shù)據(jù)集,將這次發(fā)現(xiàn)的新基因與四種類人猿(apes)的基因進(jìn)行了比較。
類人猿包括黑猩猩(chimpanzee)、大猩猩(gorilla)、猩猩(orangutan)和長臂猿(gibbon)。
根據(jù)祖先序列重建(ASR,ancestral sequence reconstruction),研究者們發(fā)現(xiàn),與其他幾種類人猿動物相比,人類這些新生成的基因確實(shí)是從無到有(de novo)產(chǎn)生的:
整體與各種脊椎動物進(jìn)行對比后,研究人員發(fā)現(xiàn)了155個(gè)新的微基因,其起源和表型如下圖:
具體來說,在這155個(gè)新基因中,有44個(gè)與細(xì)胞培養(yǎng)物中的生長缺陷有關(guān)。
值得一提的是,這44個(gè)基因之前并沒有被科學(xué)家們重視。論文介紹稱,包括PhyloCSF在內(nèi)的比較基因組學(xué)方法,都沒有將它預(yù)測為一個(gè)保守的蛋白質(zhì)編碼區(qū),即能發(fā)揮功能性作用的。
然而,這些基因卻在維持生命系統(tǒng)健康過程中扮演了重要角色。
除此之外,科學(xué)家們還發(fā)現(xiàn)了3個(gè)包含與疾病相關(guān)DNA標(biāo)記的基因。
這些標(biāo)記分別與肌肉萎縮癥、色變性視網(wǎng)膜炎和阿拉基綜合征有關(guān)聯(lián)。
這三種基因的起源中,肌肉萎縮癥可以追溯到類人猿下目(Simiiformes),色素性視網(wǎng)膜炎則能被追溯到羊膜動物(Amniota)。
至于阿拉基綜合征,此前被認(rèn)為是人類特異性的,但直系同源基因也在黑猩猩中被轉(zhuǎn)錄,推測起源于人類和黑猩猩的共同祖先。
除了疾病,研究人員還發(fā)現(xiàn)了一種與人類心臟組織密切相關(guān)的新基因。
據(jù)作者介紹,它從大猩猩分裂出來后,立即出現(xiàn)在人類和黑猩猩身上:
它的出現(xiàn),證明了一個(gè)基因進(jìn)化成為“人體必需品”的速度有多快。
關(guān)于作者
一作Nikolaos Vakirlis,來自希臘瓦里“亞歷山大·弗萊明”生物醫(yī)學(xué)科學(xué)研究中心。
他表示這項(xiàng)研究早在2017年就已經(jīng)開始了,不過中途擱置了很久,直到一項(xiàng)新的研究發(fā)表,該研究中有一些數(shù)據(jù)對他們很有用,幫助他們重新開始了項(xiàng)目。
剩下三位作者具有同等貢獻(xiàn),其中Aoife McLysaght作為生物遺傳學(xué)領(lǐng)域?qū)<?、通訊作者,則來自都柏林三一學(xué)院。
她表示,他們研究的這些小尺寸DNA,基本處于基因組序列可解釋的邊緣、處于很難知道它是否具有生物學(xué)意義的區(qū)域,但真的很有意思。
而在未來,作者們表示,他們會進(jìn)一步地研究新發(fā)現(xiàn)的這些微基因究竟會起什么作用,了解它們是否可能直接參與某種類型疾病的形成。
“這仍將非常有趣?!?/p>
論文地址:
https://www.cell.com/cell-reports/fulltext/S2211-1247(22)01696-5
參考鏈接:
https://www.sciencedaily.com/releases/2022/12/221220112424.htm