新聞 > 科教 > 正文

MIT發布迄今最完整的中共病毒基因注釋圖譜…

你聽說過不需要科學實驗,而是基於現有數據或者圖譜,僅僅只是進行分析比對,就能得出相當精準結果的研究方法嗎?

日前,麻省理工學院(MIT)研究團隊宣布繪製出了迄今為止最完整的新冠病毒中共病毒)基因注釋圖譜。他們在通過比較大量相似病毒基因體後,確認了新冠病毒(SARS-CoV-2)基因體中未被發現的六個蛋白質編碼基因。

相關論文於5月11日發表在《自然・通訊》(Nature Communications)期刊上,通訊作者是麻省理工學院計算機科學馬諾利斯·凱利斯(Manolis Kellis)教授。

凱利斯在接受媒體採訪時表示:「我們能夠使用這種功能強大的比較基因體學方法進行進化簽名,以發現這一極其重要的基因體的真正功能性蛋白質編碼內容。」

西湖大學助理研究員鄢仁鴻對 DeepTech表示:「該研究主要採用大數據類比分析的研究手段,同時,他們自己有一套完善的驗證程序,來對新冠病毒的突變做了系統性的歸類研究,這對後續摸清病毒的進化規律具有重要的參考意義。」

圖丨相關論文(來源:Nature Communications)

新的功能性蛋白編碼基因被發現

新冠病毒屬於嚴重急性呼吸症候群相關的冠狀病毒,同時也是沙貝病毒(Sarbecovirus)的亞屬病毒,這類病毒其實與人類早有接觸,相似病毒也比較多。比如,導致2003年非典爆發的 SARS-CoV,雙方便屬於同一物種。

圖|新型冠狀病毒(來源:Pixabay)

在這種情況下,凱利斯團隊選擇通過比較基因體學來對這些相似病毒進行研究,比較基因體學是基於基因體圖譜和測序基礎上,對已知的基因和基因體結構進行比較的學科。

凱利斯此前也曾通過此類分析的計算技術來判斷物種之間某些 DNA或 RNA鹼基是否保守,並比較它們隨時間的進化模式。另外,該團隊還使用該技術將人類基因體與其他哺乳動物的基因體進行了比較,分析模式較為成熟。

圖|研究團隊使用44株 Sarbecovirus株的比較基因體學來解析新冠病毒蛋白編碼基因集(來源:Nature Communications)

在比較基因體學的理論支撐下,MIT研究團隊選擇了44種 Sarbecovirus基因體,對蛋白質編碼的進化特徵和重迭約束進行了量化分析,以區分那些具有重要功能性的突變。

研究員對這44個緊密相關且完整的冠狀病毒基因體和生成全基因體做比對,以評估蛋白質編碼和核苷酸水平的限制,並注釋同義受約束的密碼子。最終確認了新冠病毒基因體中的六個蛋白質編碼基因,並認為其他五個已經提出的不保守的基因區域不太可能編碼功能蛋白。

圖|重迭3a的新基因3c編碼蛋白質(來源:Nature Communications)

另外,研究團隊還有一個新發現,即編碼為 ORF3a的基因所在區域內還有另一個基因,科研人員將其命名為 ORF3c,該基因的 RNA鹼基與 ORF3a重迭,但卻有著不同的閱讀框。這種基因有一個奇特的屬性,它很少出現在大型基因體中,卻又是病毒里的常客,不過目前這個新冠病毒新基因的作用尚不清楚。

鄢仁鴻認為,這項研究比較突出的亮點在於,它發現了一些之前被認為是新冠病毒編碼基因的區域,並沒有編碼基因,而有一些被認為不會編碼基因的序列,其實很可能是蛋白質的編碼基因,從而幫助我們了解一些之前被忽略的蛋白在新冠疾病方面的具體功能。

一位來自復旦大學生命科學學院遺傳學研究所的教授對 DeepTech表示,MIT研究團隊通過比較基因體學取得了新的研究成果,在生物信息的分析比對上有自己的獨到之處,即便這並不是一個新的研究方法。

圖|使用多步驟決策過程來區分功能性蛋白質編碼基因(來源:Nature Communications)

研究人員還發現,由於基因名稱的不正確和相互矛盾,研究結果的準確性會出現許多波折,因此研究人員提出了命名新冠病毒基因的建議,並將這個建議發表在《病毒學》的另一篇論文中。

前文的復旦大學教授表示:「這個建議其實很有現實意義,不過在學術界,研究者往往有自己的個性及意願,建議很好,但想要實現基因統一命名難度並不小。」

新研究大大推動探索病毒突變進程

在這項新研究中,研究人員還分析了自首次發現新冠病毒以來出現的1800多個突變。事實上,病毒異變往往會使病毒更具攻擊性,從而導致人類的免疫系統很難發揮原有作用,感染性也會因此大幅提升,而此項研究恰好能在病毒突變方面給到精準評估。

復旦大學教授認為,這項研究分析了近2000個突變,而且也發現了一些幫助基因逃避免疫系統的關鍵蛋白,因此得出了突變可以產生免疫耐受作用的分析。「也就是說,這些在人群中傳播的突變,之所以能夠存活下來,說明是有免疫耐受功能的。這種基於生物信息的研究,就啟發性來說作用是相當大的。」

不過不同於前面進行的相似病毒間的比較,這次比較的是突變基因在大流行開始前後的進化速度。

一般情況下,在當前的疫情大流行之前,長期快速進化的基因會繼續進化,而緩慢進化的基因則會保持原有趨勢。但現在,研究人員發現了一種新模式,這說明它已經適應了新的人類宿主。凱利斯認為,這種發現有助於探索病毒的進化原理。

同樣有變化的是圍繞病毒遺傳物質的核衣殼蛋白區域,研究人員發現該區域的突變遠超預期,這和原有的歷史進化模式大相逕庭。

圖|突變病毒逃避免疫系統(來源:Pixabay)

凱利斯說:「新冠病毒整個基因體中變化最大的區域就是這種核衣殼蛋白的中間位置。我們推測那些在該區域不會突變的變異體會被人類免疫系統識別並消除,而那些在該區域隨機積累突變的變異體,實際上能夠更好地逃避人類免疫系統並保持循環。」

變體中出現的突變同樣引起了研究人員的關注,例如來自英格蘭的 B.1.1.7菌株、巴西的 P.1菌株和來自南非的 B.1.351菌株,這些變體中出現了許多更多危險的突變,正是在這些突變的幫助下,病毒才能從容避開免疫系統。更嚴重的是,這些變體中的每一個一般還會攜帶其他突變。

「這些變體中的每一個都有20多個其他突變,因此,重要的是要知道其中哪些可能在做某事,哪些卻沒有。」該研究的主要作者、MIT計算機科學與人工智慧實驗室(CSAIL)科學家歐文・榮格里斯(Irwin Jungreis)說道。這時,比較基因體學中的數據就派上了用場。

研究人員介紹,這些數據可以幫助其他科學家將注意力集中,全力對付那些看起來最有可能對病毒的感染力產生重大影響的突變上。當然,如果你有其他方面的研究需求,同樣可以使用這些帶注釋的基因圖集,他們目前在加利福尼亞大學聖克魯斯分校的基因瀏覽器上提供了相關服務。

談及該研究可提升的空間,鄢仁鴻表示:「研究的局限在於,這類分析缺少功能實驗數據的支持,得出的結果並不一定準確,還需要反覆的驗證,只能說是給出參考意見。」

研究結果尚缺乏實驗數據支持

迄今為止,人類與新冠病毒的對抗已經持續了很久,藥物和疫苗的研發仍然是解決疫情的重中之重。而且由於新冠病毒的突變性,科學家對新冠病毒基因體的填補過程一直存在巨大阻礙,在這種情況下,新冠病毒蛋白質編碼圖集的完善無異於一場及時雨,對破解病毒密碼起著至關重要的作用。

不過我們也要注意到,在該研究中,沙貝病毒屬下的所有已知病毒均屬於與嚴重急性呼吸系統症候群相關的冠狀病毒。因此,這項在目前已知的在沙貝病毒中可行的分析結果,可能並不適用於將來發現的其他沙貝病毒物種。

「有一點我們需要注意,這項研究主要是依據現有數據比對,但生物信息和實際情況一般差距很大,基因體學比對未必能夠保證其準確度,歸根結底還是需要大量實驗數據的支撐,不過它由此帶來的啟發性完全值得肯定。」復旦大學教授談道。

而且,對於新冠病毒的研究,我們的目光不能僅僅局限於新冠病毒基因體蛋白質編碼身上,它的 RNA結構同樣重要。但是這一點,很多人都會忽視,科學家們也不能例外,即使是 RNA在研究感染和疾病方面有著突出的表現。

圖| RNA如同大腦指揮而不負責具體執行(來源:Pixabay)

通常我們認為,病毒的遺傳信息會先編碼一些蛋白質,然後通過這些蛋白質來進行具體執行,而遺傳信息就是 RNA,它像一個大腦,並不具備執行功能,這些功能一般都是依靠它編碼的蛋白質來實現的。

對此,鄢仁鴻向 DeepTech解釋,「病毒的遺傳物質是 RNA,相比於 DNA來說,並沒有那麼穩定,因此在侵染過程中,可能會產生一些突變。比如,在複製自己自己遺傳信息的時候就容易有一些錯配,或者說點突變,這種點突變的概率是很低的,但是由於病毒複製基數比較大,因此可能會篩選出一些更具侵染性的病毒突變體。」

就像病毒和蛋白質的關係一樣,一方發布指令,一方嚴格執行。科學家們在進行科研工作時同樣需要做到這一點,既要有基於數據的理論分析,開創新思路,同時也要有大量的後期實驗做佐證。

尤其對於新冠病毒(中共病毒)這樣的病毒來說,相關的基因體圖集總是處在突變與補充的變化過程中。這也就要求科學家們需要從更加全面的角度考慮問題,通過不斷更新實驗數據,最終一步步走近科學真相。

責任編輯: 李韻  來源:深科技 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2021/0528/1598456.html