近10年來,腸道微生物基因組成為生命科學研究領域的熱點。然而,目前大部分相關研究,仍使用主流二代測序技術進行腸道微生物種功能解析,宏基因組的拼接質量仍然有較大提高空間,且菌株水平的功能差異分析等領域亟待新的突破。
不久前,我國首部生物經濟的五年規劃《“十四五”生物經濟發展規劃》發布。該規劃明確指出,加快發展高通量基因測序技術,推動以單分子測序為標志的新一代測序技術創新。而近期,三代測序技術已引發整個行業的關注,不少企業正積極布局,將其作為二代測序技術的有效補充,在針對二代測序范圍外的復雜基因突變類型進行測序方面尋求新的解決方案。
有鑒于此,中國科學院微生物研究所王軍研究員課題組和中國科學院動物研究所宋默識研究員課題組合作,利用三代納米孔測序技術解析了腸道宏基因組,建立了三代和二代測序數據混合組裝和后續分析流程。該研究提高了宏基因組組裝的質量,以及對結構變異的發現能力,發現了大量包括插入突變和基因倒位在內的結構變異對于菌株水平上基因功能的影響,并對噬菌體等系統進行了深度挖掘,這些都是將三代納米孔測序技術用于腸道微生物研究后取得的新進展。該研究論文近日發表在《自然·通訊》雜志上。
兩代測序技術聯手探索腸道微生物
人類的腸道是細菌、真菌等微生物的家園,這些微生物被統稱為腸道微生物群??茖W家們現在已經收集了人類腸道中4600多種細菌的20萬個基因組和1.7億個蛋白質序列,并建立了數據庫。
盡管科學家長期致力于這一領域的研究,但腸道菌群中的一些微生物種類在很長時間內不為人所知。據估計,人體內含有的微生物數量比人體細胞還多,在人類腸道中已經發現了共計4600余種細菌。有研究表明,這其中超過70%的被檢測到的細菌還未在實驗室中培養,它們在人體內的活性仍然未知。
“在人的腸道中,尤其是在直腸里,有非常豐富的微生物,個體數量超過人體細胞的3—10倍。雖然這些微生物種的基因組較小,但由于種類很多,其基因多樣性比人高10—100倍?!蓖踯姼嬖V記者,腸道微生物群落形成了一個非常復雜的腸道環境,對其進行研究有助于了解腸道的狀態和功能,從而更好地了解人體和疾病,指導胃腸道疾病的診斷和治療。
宋默識表示,腸道微生物在人類代謝食物、抵御感染和應答藥物等過程中起著非常重要的作用。腸道維持著人體的代謝平衡,很多食物會在腸道內最終降解成小分子最終代謝物。如果腸道微生物生態系統失衡,將導致代謝功能失調,造成胃腸道疾病。同時,一些腸道免疫性疾病(如炎癥性腸炎)也與腸道微生物生態系統的免疫調節相關。因此,腸道微生物群一直是科學家們最關注的議題之一。
但受研究方法的限制,相關研究一直進展較慢。
“以前,相關研究只能依靠低通量的微生物群培養手段。但隨著二代測序技術的發展,能夠使我們以較高通量的方法去了解腸道微生物種。近年來,三代測序技術發展迅速,又彌補了二代測序技術的一些不足,兩者相結合,為探索腸道微生物種提供了較好的方法條件。”王軍說。
三代測序是二代測序的有益補充
王軍向記者介紹,以納米孔測序為代表的三代測序技術飛速發展,目前英國ONT測序和美國PacBio測序兩種技術路線,都能夠完成較長的DNA片段測序。
三代測序技術較二代測序技術有何不同?
對此,王軍表示,二代測序技術是目前的主流測序方式,已廣泛應用于疾病和癌癥的研究,具有高通量的特點,但不足之處在于測出來的基因片段較短,對于復雜的基因組區域以及較大的結構變異的檢測有一定的局限性。而三代測序技術則能夠幫助研究者針對感興趣的基因或區域進行高深度測序研究。目前,三代測序技術已被應用于疾病或癌癥領域人類基因遺傳標志物、融合基因、甲基化檢測等的研究中,方法主要有長片段PCR擴增、CRISPR/Cas9靶向捕獲和液相探針捕獲三類。
在研究中,王軍課題組使用了二代測序與三代測序數據組裝拼接的辦法?!耙肴鷾y序能夠彌補二代測序‘序列短’這一不足。三代測序讀出的長序列就像一個‘骨架’,能夠讓研究者知道二代測序讀出來的短片段之間有什么對應關系,該怎樣拼接,從而提高整體基因拼接序列的質量,提高對某個生物染色體的全面認識。”王軍說。
在三代測序方法出現之前,研究者利用二代測序技術拼出大大小小的不同基因片段,但常常無法知道某些片段屬于哪個菌種。王軍表示,雖然存在一些計算方法使研究者可以依據峰段、頻率去推斷基因片段之間的關系,但由于缺乏直接證據,這一研究難題仍無法得到根本解決。
“三代測序技術改變了這一情況。將三代測序技術得出的數據與二代的進行混合拼接,就能夠在很復雜的環境中幾乎接近拼出一個細菌的單個基因組?!蓖踯娬f。
三代測序技術未來還有更大發展空間
近年來,全球實驗室都開始大規模應用三代測序技術。
“每一個新測序技術剛出來的時候一般都很貴,大家都覺得是在‘燒錢’做研究?!蓖踯娤蛴浾呓榻B,盡管三代測序技術為精細探索基因功能提供了新的路徑,但其經濟性仍不高,“三代測序技術的單位測序數據成本比二代要高很多。每次測序非常貴,一次出來的數據量約為二代的1/10,有時甚至還不到二代的3%。數據量少的特性是由三代測序技術的原理決定的?!?
在充斥著電解液的容器中,放置鑲嵌有納米孔蛋白的分子膜。在相關蛋白質和酶的輔助下,DNA分子以較為穩定的速度通過納米孔,當納米孔內被特定的核苷酸占據時,會對孔周圍的電流產生擾動。通過記錄DNA分子通過納米孔過程中產生的電流信號情況,再將這一特異性的電信號序列利用算法軟件翻譯為核苷酸序列,這就是三代測序技術的基本操作原理。
“目前的工藝決定了三代測序技術測出的數據量偏少?!蓖踯娬f,但其與二代測序技術相結合,能為建立更高質量的基因圖譜作出貢獻。
下一步,三代測序技術還有哪些發展空間?
在王軍看來,開發序列信息解讀算法是一個發展方向。如何精確地將新一代基于納米孔的單分子實時電信號測序技術生成的原始電信號翻譯為序列信息,是科學家們關注的重點,近年來也誕生了多種用于精確翻譯電信號的相關工具。
同時,三代測序技術還能在甲基化檢測等特殊領域發揮重要作用。三代測序技術能夠檢測DNA分子自身的物理化學特性,因此生物基因組上的修飾信息也可以在電信號中得到反應。DNA分子上的甲基化修飾具有非常強的細胞特異性和細胞周期特異性,對表觀遺傳學研究有著重要的意義。
“三代測序技術暫時取代不了二代測序技術,但在未來,它將成為測序技術不可缺少的組成部分,在甲基化檢測等獨特領域實現其重要價值?!蓖踯娬f。
來源:科技日報
相關閱讀: