新聞 > 科教 > 正文

里程碑 人類基因體的完整測序終於完成了

二十年前,當人類基因體計劃和生物科技公司Celera Genomics宣布對人類基因體測序時,人類基因序列還並不真正完整。有大約15%的內容缺失:技術上的限制使研究人員無法弄清某些DNA片段是如何組合在一起的,特別是有許多重複字母(鹼基對)的地方。隨著時間的推移,科學家們解決了部分難題,但當時的人類基因體(遺傳學家自2013年以來一直將其作為參考)仍然缺少8%的完整序列。

現在,端粒到端粒(T2T)聯盟的研究人員填補了這些空白,該聯盟是由大約30個機構組成的國際合作組織。在5月27日題為"人類基因體的完整序列"的預印本論文中,加州大學聖克魯茲分校的基因體學研究員Karen Miga和她的同事報告說,他們已經對剩餘部分進行了測序,在這個過程中發現了大約115個編碼蛋白質的新基因,而本次測序總數為19969。

馬里蘭州貝塞斯達的美國國家生物科技信息中心的生物信息學家Kim Pruitt稱這個結果是一個"重要的里程碑"。

新的測序技術

新測序的基因(標號為)T2T-CHM13——在2013年版本的人類基因體序列上添加了近2億個鹼基對。

這一次,研究人員沒有從活人身上提取DNA,而是使用了從所謂的全性葡萄胎中提取的細胞系,這是當精子與沒有細胞核的卵子結合時形成的組織類型。由此產生的細胞只包含來自父親的染色體,因此研究人員不必區分來自不同人的兩套染色體。

Miga說,如果沒有加利福尼亞州門洛帕克的太平洋生物科學公司的新測序技術,這一壯舉幾乎是不可能的,該公司使用雷射掃描從細胞中分離出來的長段DNA——每個都有多達2萬個鹼基對。傳統的測序方法每次只讀取幾百個鹼基對。那時研究人員要將片段像拼圖一樣重新組合起來。較大的碎片更容易拼湊,因為它們更有可能包含重迭的序列。

然而,T2T-CHM13並不是人類基因體學的終點。T2T團隊在幾個區域上遭遇了困難,並估計大約0.3%的基因體可能包含錯誤;但沒有未被測序的片段。事實證明,在那幾處區域進行質量控制檢查是很困難的。

Miga預計,遺傳學科學家將很快確認新測序區域是否與人類疾病相關。

她希望未來的人類基因體序列將涵蓋所有內容,而不僅僅是容易閱讀的部分。現在對照基因體已經完成,一些技術上的障礙也已經解決,這應該更容易。她說:"我們需要在基因體學中達到一個新的標準,不是特殊的,而是常規的。」

責任編輯: 李韻  來源:煎蛋網 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2021/0609/1603731.html