新聞 > 科教 > 正文

出大事!新一輪DNA研究引發基因身份危機

宋雅·普若哈斯卡是德國萊比錫大學的一名生物信息學家。她每天的大部分時間都花在了收集、整理和分析有關基因的信息上。她的工作一刻也離不開基因,因此,她戲稱自己被基因「綁架」了。2008年夏天,普若哈斯卡決定要嘗試度過一個每天不用再將「基因」時刻掛在嘴邊的暑期。但是,令普若哈斯卡失望的是,這樣的嘗試根本無法實現,因為關於DNA的新一輪大規模研究引發了她和她的同事對基因本來性質的重新思考。

    
    百歲壽辰鬧危機
    
    研究人員不再將典型的基因視為對單個蛋白進行編碼的DNA片段。因為,對於基因的傳統規則來說,存在著太多的例外。研究人員發現,事實上,一些不同的蛋白質也許是由單一的DNA片段產生的。DNA所產生的絕大多數分子甚至也許都不是蛋白質,而是另一種稱為RNA的化學物質。人們熟知的DNA雙螺旋結構不再為遺傳所獨享。吸附在DNA上的其他分子能在具有相同基因的兩種有機物間產生顯著的差異,而且這些分子也能和DNA一起被繼承。
    
    換句話說,基因出現了身份危機。
    
    這場危機發生在基因一詞誕生100周年的前夕。基因一詞是由1909年丹麥遺傳學家威爾海姆·約翰森命名的,用來描述父母給下一代傳遞了什麼才使得它們發展出相同的性狀。像他那個時代的其他生物學家一樣,約翰森並不了解這個無形的因子是什麼東西。
    
    在接下來的60年裡,科學家們將基因這個詞從抽象的概念變為了具體的現實。他們對麵包黴菌和細菌,以及果蠅和玉米展開了實驗研究。他們發現了如何通過修飾細胞內的分子來改變花、眼睛及其他性狀。他們還指出了DNA是一對相互纏繞的鏈。到上世紀60年代,他們已經對基因作出了令人信服的定義。
    
    他們認為,基因是一個含有製造蛋白質分子指令的特定DNA片段。為了從基因製造蛋白質,細胞不得不讀取它,並建立一個單鏈副本----RNA外轉錄。接著,這個RNA就會被一簇用於建立蛋白質模板的核糖體分子抓住。
    
    基因也是遺傳的基本單位。每次細胞分裂時,它都會複製其基因,然後父母將這些基因中的一些傳遞給他們的後代。如果你從母親那裡繼承了一頭紅髮,或是罹患乳腺癌的潛因,那麼你就有可能繼承了一個有助於形成這些性狀的基因。
    
    基因的這種定義一直運行得相當好。1968年,分子生物學家岡瑟·斯坦特宣稱,下一代科學家的工作將是必須找出其中的細節。
    
    越來越多的怪異基因
    
    斯坦特和他同時代的科學家都非常清楚地知道,這其中的某些細節是非常重要的。他們知道,在蛋白質固定到其附近的DNA位時,基因可被關閉或開啟。他們還了解到,一些編碼RNA分子的基因從來不會變成蛋白質。相反,他們有其他的任務,如幫助建立核糖體內的蛋白質。
    
    但是,這些例外似乎顯得並不重要,還不足以引起科學家對基因的定義提出疑問。耶魯大學的生物信息學家馬克·格斯坦說:「生物學的工作方式迥異於數學。如果你在數學找到一個反例,你就必須回過頭去重新思考定義。生物學並不如此,當出現一、兩個反例時,人們更願意對其進行處理。」
    
    20世紀80年代和90年代,科學家們發現了越來越多的反例,當一個細胞產生一個RNA轉錄時,它會把巨大的DNA塊切斷,只留存一些小殘餘。(細胞複製的DNA部分稱為外顯子,被拋在一邊的部分稱為內含子。)大量非編碼的DNA片段存在於這些蛋白質編碼區域。人類基因體中的2.1萬個蛋白質編碼基因只占了整個基因體的1.2%。
    
    2000年,一個國際科學家小組完成了首個基因體----人體細胞中的所有遺傳物質的草圖。他們確定了許多蛋白質編碼基因的位置,但是人類基因體中98.8%的其他基因仍有待探索。
    
    從那時起,科學家們開始在基因體的叢林中不斷跋涉,一點一點地描繪著基因體的精妙細節。其中最大的一個項目就是「DNA元件的百科全書」,簡稱為 Encode。數以百計的科學家開始協同作戰,以確定人類基因體中每一個DNA片段的功能。去年夏天,他們發表了1%基因體的成果----大約300萬個 DNA「字符」。遺傳代碼是以字符形式表示的,就像電影標題「Gattaca」(千鈞一髮)中的每一個字母都代表著一種稱為鹼基的分子:G(鳥嘌呤),A(腺嘌呤),T(胸腺嘧啶),C(胞嘧啶)。Encode小組預計到明年就可以得出其他99%基因體的初步結果。

Encode的研究結果顯示,至少從傳統的基因定義標準看,基因體中充斥著各種怪異的基因。例如,一個單個的所謂基因可以產生一個以上的蛋白質。在一個稱為選擇性剪接的過程中,一個細胞可以選擇不同的外顯子組合製作出不同的副本。大約在30年前,科學家就首次發現了選擇性剪接的例子,但他們無法確定這種情況到底有多普遍。現在一些研究表明,幾乎所有的基因都被剪接。Encode小組估計,蛋白質編碼區域平均能產生5.7個不同的副本。不同種類的細胞似乎能從同一基因產生不同的副本。

  更為怪異的是,細胞常常將外顯子「扔進」來自其他基因的副本中。這些外顯子可能來自「遙遠的地方」,甚至來自不同的染色體。

  因此,Encode的負責人之一、冷泉港實驗室的托馬斯金格拉斯認為,「再也不能認為基因是在一個物理位置上的單一DNA片段,在我們所認為的基因體組織方式上,已出現了範式轉移」。

  遺傳的第二通道

  研究結果表明,基因體還以另一種方式被組織起來,這種方式給人們提出了一個問題,即重要的基因是怎樣遺傳的。我們的DNA上鑲嵌招數以百萬計的蛋白質和其他分子,他們決定著哪些基因能產生副本,哪些則不能。新細胞繼承了這些分子和DNA,換句話說,遺傳可流經第二個通道。

  第二通道的最突出的粒子就是一種叫做柳穿魚的普通花卉。大多數柳穿魚植物以鏡面對稱的方式長有白色花瓣,但是,某些柳穿魚則長有黃色的五角星。柳穿魚將這兩種花的形式傳遞給它們的後代。然而,它們花朵之間的差異並不歸結為它們DNA中的差異。

  相反,這種差異應歸結為附著於它們DNA的頂端(cap)模式。這些頂端由碳和氫組成,被稱為甲基族。星形柳穿魚在一個與花朵發育相關的基因上具有一種獨特的頂端模式。

  DNA不只是被甲基族覆蓋,還被軸樣的蛋白———組蛋白纏繞著,組蛋白能解開DNA的一股,從而使細胞不能從它製作副本。懸掛在DNA上所有這些分子,統稱為表觀遺傳標記,它們對於細胞形成身體內的最終形式是必不可少的。當一個胚胎成熟時,不同細胞內的表觀遺傳標記被改變,導致它們發育成不同的組織。一旦表觀遺傳標記的最終模式被確定,它就會死死地粘附於細胞。當細胞分裂時,它們的後代就會帶有同樣的一套標記。哈佛大學的布拉德利伯恩斯坦說:「它們能幫助細胞記住哪些基因要保留,哪些基因從來不被打開。」

  相較於基因體,科學家們對這種「表觀基因體」知之甚少。2008年9月,美國國立衛生研究院啟動了一項1.9億美元的計劃,著手繪製不同組織內DNA上的表觀遺傳標記。康奈爾大學的埃里克理查茲說:「從現在開始,我們就可以將基因之外的所有這些變化進行圖表化。」

  這項研究也許能對癌症及其他疾病的起源提供線索。長久以來,人們已經了解到,當DNA發生變異時,細胞很容易發生癌變。最近的一些研究表明,當表觀遺傳標記被干擾時,細胞也會更容易發生癌變,因為那些至關重要的基因被關閉了,而那些應當被關閉的基因卻被打開了。使這兩種變化變得尤為危險的是,它們還能通過細胞傳遞給它的所有後代。

  胚胎開始發育時,已經累積了父母雙方DNA的表觀遺傳標記被剝離。當細胞成為胚胎時,它們增添了一套新的表觀遺傳標記,該標記與父母擁有的標記具有相同的模式。

  這個過程事實上非常微妙。如果一個胚胎受到某種類型的壓力,它就可能無法確定正確的表觀遺傳標記。譬如,1944年,荷蘭遭遇了殘酷的饑荒。荷蘭萊頓大學的科學家最近對60名在那段時間裡受孕的人進行了研究。2008年10月,研究人員報告說,這些研究對象至今具有的表觀遺傳標記仍比他們的兄弟姐妹要少。研究人員得出的結論是,在1944年的饑荒中,孕婦無法給她們的孩子提供表觀遺傳標記的原材料。

  至少在某些情況下,這些新的表觀遺傳標記可流傳給後代。科學家們正在討論這種情況發生的頻次。將在今年《生物學季度評論》上發表的一篇論文中,以色列特拉維夫大學的伊娃雅布隆斯基和蓋爾拉茲列舉了101個案例,這些案例表明與表觀遺傳標記改變相關的性狀可以傳承三代。

  華盛頓大學的馬修艾姆威和他的同事發現,將懷孕的大鼠暴露於可殺死真菌的一種化學品中,可破壞雄性胚胎精子中的表觀遺傳標記。由這種胚胎發育成的成年大鼠就會患上精子缺陷症或是其他疾病,譬如癌症。雄性將其已改變的表觀遺傳標記傳給自己的下一代,下一代又將這些標記傳給自己的後代。

  2007年,艾姆威和他的同事甚至記錄到了更為令人驚訝的化學影響。在子宮內曾暴露於化學品環境的雌鼠會避免與那些曾暴露於化學品環境的雄鼠進行交配。科學家們發現,這種偏好將持續至少三代。

  當這些實驗的結果被一一揭開時,這些代代相傳的變化到底有多重要引起了科學家們的分歧。

  不死的假基因

  表觀遺傳標記的迷人不僅在於它們的影響,還在於它們是如何在第一個地方被創立的。譬如,要將一個甲基族的頂端放在DNA上,一簇蛋白質就必須被導引到正確的位置。事實上,它們必須由一個能找到它們的RNA分子將他們導引到那裡。

  這些RNA「導遊」,就像核糖體中的RNA分子一樣,並不適用於傳統的基因概念。這些RNA分子並不引發蛋白質的產生,而是立即開始在細胞內著手自己的工作。在過去的十年裡,科學家們發現了一些從不會成為蛋白質的新型RNA分子。科學家們將之稱為非編碼RNA。2006年,麻薩諸塞大學的克雷格梅洛和史丹福大學的安德魯法爾因發現小RNA分子能通過干擾基因轉錄造成基因靜默而獲得了諾貝爾獎。

  這些發現讓科學家們感到疑惑,我們的細胞到底能製作多少非編碼RNA,Encode的早期研究結果給出的答案是:很多。雖然人類基因體中只有1.2%%能編碼蛋白質,但Encode科學家估計,在人類基因體中能產生RNA轉錄的可占到驚人的93%%。

  Encode成員、澳大利亞昆士蘭大學的約翰馬蒂克相信,很多的這些轉錄正做著科學家們尚未了解的重要工作。他說:「我敢打賭這個比例是絕大多數,但無法確定是80%%還是90%%。當你越過盧比孔河(意即跨越界限)並回過頭來看時,你就會發現蛋白質中心論是相當原始的。」

  這些RNA編碼基因的某些可能會引發罹患某些疾病的風險。作為Encode項目的一部分,科學家們正在確定和癌症等常見疾病相關的DNA中的變異位點。這些變異的三分之一遠離任何蛋白質編碼基因。對非編碼RNA工作機理的了解,將有助於科學家們找到如何使用藥物來對抗疾病遺傳風險的方法。歐洲生物信息研究所Encode項目的負責人之一伊萬波爾內說:「在接下來的十年裡,這將成為一個巨大的研究專題。」

  無論非編碼RNA有多重要,波爾內還是懷疑,Encode項目發現的絕大多數轉錄其實並不能做很多的事情。他認為,這不過是攤在桌上的一種假說而已。

  Encode的另一名成員、加州大學的大衛豪斯勒對波爾內的觀點表示贊同。他說:「細胞將製作出RNA,並簡單地將其一扔了之。」

  豪斯勒以進化論作為其觀點的基礎。如果一個DNA片段對一些重要分子進行了編碼,突變往往就會產生災難性的損害。自然選擇將淘汰大多數的突變。但是,如果一個DNA片段不做那麼多,它就能在不引起任何損害的情況下發生突變。在數百萬年的時間裡,與那些不太重要的DNA片段相比,一個重要的DNA片段幾乎不會收集突變信息。

  人類基因體中,只有大約4%%的非編碼DNA顯示出了經歷過強烈自然選擇的跡象。其中某些可能含有能控制鄰近基因的DNA片段。豪斯勒懷疑,剩下的絕大多數都沒有什麼功用。他說:「大多數的非編碼DNA就是一些多餘的東西。」

  但是,這些沒有用處的多餘物和有用DNA之間的界限很難劃分。突變使得細胞從基因形成蛋白質成為可能。科學家們把這樣的一個無用DNA片段稱作假基因。格斯坦和他的同事估計,人類基因體中存在1萬個到2萬個假基因。它們中的大多數實際上是死的,但也有少數仍能製造出具有重要功能的RNA分子。格斯坦將這些具有功能的假基因戲稱為「不死族」。

  基因體中的外來客

  然而,基因體中的許多多餘物並非來自死亡的基因,而是來自入侵的病毒。病毒反覆地感染人類的遠祖,並將其DNA添加到代代相傳的遺傳物質中。這些病毒一旦侵入人類基因體,它們有時就會製作自身的新副本,這些副本則被粘貼到基因體的其他位置。經過許多代以後,它們發生變異,然後就會失去移動的能力。豪斯勒說:「我們的基因體里充斥著這些小病毒的腐爛屍體,這些病毒以我們的基因體為家已經數百萬年之久了。」

  當這些相當數量的病毒DNA四處跳躍時,在人類基因體中它們就會造成很大的損害。它們能夠干擾基因,使其停止製作重要的蛋白質。數百種遺傳疾病就跟這些跳躍密切相關。非編碼DNA在基因體中的最重要工作之一是阻止這種病毒DNA的快速蔓延。

  當然,這些入侵者中的某些也已進化成有用的形式。某些病毒DNA片段經過進化後能製作出我們細胞使用的RNA基因。其他片段則已進化到我們的蛋白質能附著和打開附近基因的位置。

  在這個入侵病毒、不死的假基因、不斷調整的外顯子和表觀遺傳標記的叢林裡,傳統的基因概念還能存續下去嗎?這是一個開放性的問題,今年3月,普若哈斯卡準備在聖塔菲研究所舉行的會議上提出這個問題。

  在《美國科學家》雜誌上,格斯坦和他的研究生麥可謝林豪斯提出,為了定義一個基因,科學家們必須從RNA副本開始,並回溯到DNA。被用來製作副本的任何外顯子都將構築一個基因。普若哈斯卡認為,一個基因應當是隱藏在遺傳性狀背後的最小單位。它可能不只包括一個外顯子的集合,還包括一起被繼承的位於其上的表觀基因標記。

  這些新的概念正在使基因遠離DNA的物理片段,回到一個更為抽象的定義。金格拉斯說:「這幾乎是回到了這個術語最初表達的意思。」在百年誕辰之際,基因正急著「回家」。(記者馮衛東)

    

責任編輯: 劉詩雨  來源:科技日報 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2009/0128/118118.html

相關新聞