這棵15cm高的“巨無霸”,低調到科學家今年才注意到……

來源: 更新:

說起“巨無霸”,你最先想到的是什麼?

是漢堡中的銷量王者?《變形金剛》中力大無比的機器人?還是世界上體型最大的生物,比如重達180噸的藍鯨和高達115米的北美紅杉?

今天要講的這位,雖然外表平平無奇,卻在近日成爲真核生物界新晉的基因組“巨無霸”,它就是來自梅溪蕨屬(Tmesipteris)的T. oblanceolata(爲方便閱讀,下文簡稱其爲“梅溪蕨”,種加詞oblanceolata指“倒披針形的”)

這一稱號實至名歸,因爲梅溪蕨的基因組大小達到了驚人的160.45 Gb!它同時打破了三項世界紀錄——“最大的蕨類植物基因組”、“最大的植物基因組”和“最大的基因組”。此前,後兩項紀錄一直由基因組大小爲148.89 Gb的日本重樓(Paris japonica)自2010年起保持着。

“160.45 Gb”是個什麼概念呢?

這還得從什麼是基因組,基因組的大小及其如何衡量說起。

新一屆“巨無霸”T. oblanceolata植株 (圖片來源:Fernández et al., 2024)

上一屆“巨無霸”日本重樓植株 (圖片來源:PPBC-吳寶成;Alpsake/Wikimedia Commons)

形容基因組有多“大”?不論斤也不論兩

基因組有兩個層面的含義:在物種水平上,基因組指某一物種所有個體極度相似但略有差異的遺傳信息;而在個體水平上,基因組指存在於某一個生物體內所有細胞中的遺傳物質的總和,包括DNA或RNA(部分病毒)。

在生命的宏偉詩篇中,DNA是那神祕的編織者,用四種基礎的字母——腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)和鳥嘌呤(G)編織出無盡的遺傳密碼。正如多米諾骨牌一般,每一塊骨牌的倒下都引發連鎖反應,這些鹼基的排列組合,決定了生物的多樣性,讓每一個生命體都擁有其獨特的遺傳藍圖。

那麼,我們如何衡量遺傳信息有“多少”呢?

一般來說,衡量一個生物的遺傳信息有三種方式:

(1)以重量計算的C值,單位通常是皮克(10-12克,pg);

(2)以分子量計算,單位爲道爾頓;

(3)以核苷酸鹼基(ATCGU)對的數量表示。

以核苷酸鹼基對的數量來表示是衡量基因組大小最常用的方法。

和計算機存儲容量單位類似,我們將一個鹼基對的“容量”定爲1 bp(base pair),如果將鹼基對連接起來,一千個爲1 Kb,一百萬個爲1 Mb,十億個則爲1 Gb。但與計算機存儲容量不同的是,計算機存儲大小的進率是1024,而基因組大小的進率是1000。

那麼如何測定一個物種的基因組大小呢?目前,我們可以通過流式細胞術、K-mer分析法和基因組從頭測序的方法來估算,這三種方法在評估基因組大小的精確度上依次提高,但相應的,它們的技術難度、準確度和成本也隨之增加。

隨着三代測序技術的迅猛發展,基因組測序的成本已經顯著降低,如今完成一個1 Gb基因組的深度測序、組裝及註釋的價格已經降至10萬元內了。然而,即便成本大幅下降,對於160 Gb的梅溪蕨基因組這樣龐大的項目,其高昂的費用仍然只有少數財力雄厚的“土豪”團隊能夠承擔。

再者,三代測序組裝基因組前一般會用流式細胞術或K-mer法對基因組大小進行“摸底”。於是,在這項研究中,科研人員首先安排上了較爲“經濟實惠”的流式細胞術估算梅溪蕨基因組大小。

流式細胞術的原理是通過製備細胞核懸浮液,對核酸進行熒光染色,並使用已知基因組大小的物種作爲參考,根據兩個物種間相對熒光密度(DNA含量)峯值的橫座標,對基因組大小進行等比例計算。

如下圖所示,梅溪蕨和基因組大小爲148.89 Gb的日本重樓的峯值橫座標的比值爲1.12(226.60/202.28),說明梅溪蕨的基因組大小約爲日本重樓的1.12倍!這項研究同時使用了洋蔥、貝母屬Fritillaria lusitanica和日本重樓作爲內參,最終估算的梅溪蕨基因組大小爲160.45 ±0.81 Gb。

梅溪蕨與日本重樓的流式細胞結果 (圖片來源:Fernández et al., 2024)

大大的基因組,卻有小小的身體?

儘管梅溪蕨擁有“巨型”基因組,但其植株看起來卻相當迷你且不起眼。

梅溪蕨屬是松葉蕨科(Psilotaceae)下的一個小屬,包含15個種,其中12種都具有附生屬性。

本文的主角T. oblanceolata梅溪蕨比較罕見,它在西南太平洋的新喀里多尼亞島及一些鄰近島嶼上被發現,株高最多15 cm。梅溪蕨屬不僅植株迷你,也是科學家眼中很小衆的類羣,到目前爲止,該屬中只報道了兩個物種的基因組大小,即四倍體T. tannensis(73.19 Gb)和八倍體T. obliqua(147.29 Gb),這兩者都擁有巨型基因組。

本研究通訊作者Jaume Pellicer教授在調查附生梅溪蕨的生境 (圖片來源:Oriane Hidalgo)

來自邱園的植物學家Ilia J. Leitch教授是這項研究的參與者之一,她用了一個形象的比喻來描述梅溪蕨的基因組大得有多誇張——如果把其細胞內纏繞摺疊的DNA像抽絲一樣展開,長度可超過100米,相比之下,人類基因組大約爲3.1 Gb,展開後每個細胞中的DNA長度僅爲2米左右!如果按照字母和漢字的大小比例,將兩對鹼基算一個字節,梅溪蕨的基因組可以寫下11萬本《紅樓夢》(73.1萬字/本),相當於一個圖書館的藏書量了!

那麼,基因組大小和生物體大小之間是否有某種關聯?對一個物種來說,基因組越大越好嗎?

其實,著名的“C值悖論”已經回答了第一個問題,該理論提出物種的基因組大小(C值)和它進化的複雜性之間是沒有嚴格的對應關係的,基因組大小和生物體大小就更沒有關係啦。

而且與人們設想的不同,擁有更大的基因組通常並不是一種優勢。這是因爲,基因組越大,合成的DNA就越多,需要的能量和營養物質也越多,同時,在每次細胞分裂時複製基因組的能量需求也越高。

以植物爲例,擁有大量DNA的通常都是那些生長緩慢的多年生植物,它們的光合作用效率較低,並且需要更多的營養物質才能生長,繁殖和產生後代更緩慢,適應環境也可能更緩慢。

Ilia J. Leitch教授認爲,想要管理好如此龐大的遺傳信息,就像“試圖在擁有數百萬本書的圖書館中,找到幾本有關如何在如此龐大的DNA中生存的指導書”一樣荒謬,畢竟基因組中,僅有很小一部分的DNA由編碼蛋白質的基因組成。

那麼,擁有如此龐大基因組的梅溪蕨是如何存活下來的呢?它又是如何管理基因組中複雜的遺傳信息的呢?

我們首先要搞明白梅溪蕨如此龐大的基因組從何而來。

想要讓基因組“瘋狂擴張”,有兩種方法可以實現

植物的基因組大小具有驚人的差異性,目前已知基因組最小的植物是狸藻科的一種食蟲植物——旋刺草(Genlisea aurea),它的基因組大小隻有0.0636 Gb,因爲梅溪蕨的加入,使得植物基因組大小的變化範圍擴展到了驚人的2500倍(160.45/0.0636)。

目前的研究認爲,基因組大小的變化主要由兩類因素驅動。

1. 基因組多倍化

指某物種通過染色體倍增的方式導致多套染色體共存於同一細胞核中,形成穩定遺傳的新物種的現象。這就類似於多倍體同時點了好幾份基因組的“豪華套餐”,例如稻屬中,基因組分別爲400 Mb和600 Mb左右的二倍體斑點野生稻和藥用野生稻雜交併多倍化後,產生了異源四倍體小粒野生稻,其基因組達到1Gb。

2. 重複序列的擴張

基因組中重複出現的DNA序列叫做重複序列,例如轉座子(一類能夠在染色體上自主複製和位移的DNA序列)。由於大多數轉座子不具備基因編碼能力,因此曾被叫做“垃圾序列”。然而,隨着科學的發展和研究的深入,科學家也發現,重複序列不僅是大型植物基因組的重要組成部分,也是基因組進化的重要驅動因素。

以寄生生物爲例,一般來說,它們爲了減少自身負荷和能耗,會盡可能讓基因組精簡,但寄生花卻擁有3.5 Gb的大型基因組,其中就有高達90%的序列由高度重複的轉座子組成。儘管它的基因組看起來十分“巨無霸”,但事實上大部分基因的結構都非常簡單,且基因丟失數量極高,是名副其實的“虛胖型選手”。

雖然梅溪蕨的基因組還未被解析,細胞學數據也暫未被收集到,我們暫不清楚蕨類植物是如何應對如此不必要的巨型基因組帶來的後果的。但是,科學家們猜測,梅溪蕨的基因組“巨無霸”套餐是這樣定製的:多倍體身份or“虛胖”的冗餘序列?它纔不做選擇,全都要了!

3.多倍體身份

相較於被子植物,蕨類植物的細胞中通常擁有較高的染色體數目,這種現象也被稱爲“染色體囤積綜合徵”,梅溪蕨屬的單套染色體組中的染色體基數就達到了x = 52。此外,現有證據發現梅溪蕨屬內不乏四倍體、八倍體等,這簡直buff疊滿了呀!

4.高度的序列

研究者們推測,梅溪蕨屬多個物種的巨型基因組可能與其“附生”的屬性有關,或許與擁有“寄生”屬性的寄生花相似,其基因組中也存在高度冗餘的重複序列。

此外,根據以往大型基因組的研究案例,我們也可以大膽推測:梅溪蕨基因組中或許存在一些高度擴張的基因家族,對其適應環境有着重要作用;梅溪蕨基因組中或許也發生了大量的基因丟失事件,只有少量控制關鍵性狀的基因得以保留,這些基因或許是梅溪蕨成功管理其巨型基因組的關鍵;梅溪蕨現有羣體如此小,是否曾經歷了瓶頸效應,使其遺傳多樣性降低,積累了大量有害突變,這個物種未來是否會面臨生存的危機,是否需要採取保護措施......當然,這一切問題的答案,還是坐等“土豪”團隊解析完基因組後,由進化生物學家來揭曉吧。

還有哪些基因組“巨無霸”?

除了本文的主角,自然界中其實還擁有不少基因組大小超過100 Gb的生物,比如植物中的梅溪蕨屬、日本重樓、延齡草屬、白果槲寄生,動物中的各種肺魚和泥螈。雖然這些生物中,有的能跑能跳能划水,有的紮根土壤吸收日月精華;有的顏值極高,有的其貌不揚;有的“身強力壯”,有的弱不禁風......但它們都有一個共同的名字——基因組“巨無霸”!

已知基因組大小超過100 Gb的生物 (圖片漢化自:Fernández et al., 2024)

會不會有一種生物的基因組比梅溪蕨還要大?一切皆有可能!或許,下次你在山澗野外,在城市公園偶遇到的一株不起眼小草,可能就是一個隱藏的基因組“巨無霸”。

參考文獻:

[1] Fernández et al., A 160 Gbp fork fern genome shatters size record for eukaryotes. iScience, 2024,109889.

[2] Cai et al., Deeply Altered Genome Architecture in the Endoparasitic Flowering Plant Sapria himalayana Griff. (Rafflesiaceae). Current Biology, 2020, 31: 1-10.

[3] Unlocking the Genetic Giant: Tiny Fern Has the Largest Genome of Any Organism on Earth. Kew Science, 2024.

[4] Schupak A. Largest known genome is within this plain plant on the forest floor, study says. CNN, 2024.

[5] Leushkin et al., The miniature genome of a carnivorous plant Genlisea aurea contains a low number of genes and short non-coding sequences. BMC Genomics, 2013, 14: 176.

作者:王新

作者單位:中國科學院植物研究所

審覈:李鵾鵬 中國科學院植物研究所

相關推薦
請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗:Google Chrome、Mozilla Firefox、Microsoft Edge 或 Safari。為避免使用網頁時發生問題,請確保你的網頁瀏覽器已更新至最新版本。
Scroll to Top