您好,歡迎光臨武漢貝納科技服務有限公司
027-62435310 | service@benagen.com | 中文 | English 咨詢客服
您現在的位置:主頁 > 市場與支持 > 文獻解讀 >

無需組裝,使用Nanopore測序從自然群體中識別完整的病毒基因組

發表雜志:Genome Research
影響因子:11.20  
發表時間:2020.2.19
 
病毒是地球上最豐富的生物體,在宿主生態學、進化和基因水平轉移中起著關鍵作用。由于病毒群體固有的遺傳復雜性,很難從自然微生物組中獲得完整的病毒基因組。本研究開發了一種基于Nanopore測序,無需組裝的檢測方法,可以直接從環境樣品中識別完整的病毒基因組序列。

研究思路




材料與方法

材料:
采集3種不同深度的海水樣品,0.22 μm過濾器對25米深水樣進行預過濾,對117米和250米深樣品使用0.1 μm過濾器進行預過濾,過濾液使用30 kda過濾器進行濃縮。分別提取DNA后,每個樣品分成2份。
測序方案:其中一份分別使用GridION測序,同時使用Illumina測序數據用于糾錯;另一份入10 ng λ噬菌體DNA作為內參使用GridION進行測序。

分析流程:
由于直接末端重復序列(DTRs)是大多數雙鏈DNA尾噬菌體共有的特征,使用這一特征來識別此類基因組序列。Nanopore reads經過過濾,保留含有DTRs序列的reads用于下游分析,以5-mer 分箱之后,使用長reads和短reads對病毒基因組序列進行糾錯。無需組裝的噬菌體基因組識別流程如圖1所示。


圖1 無需組裝從Nanopore reads中識別海洋噬菌體基因組的分析流程



研究結果
 
1 從Nanopore測序reads中識別海洋病毒基因組
首先使用192個已知的海洋噬菌體基因組組成模擬宏病毒組,用來驗證該流程。分析獲得190個clusters(表1),糾錯后獲得基因組草圖,與參考基因組比對,準確率≥99.67%,覆蓋率≥99.86%。該分析流程成功檢測到毒株水平的差異。


表1 3種不同深度海水樣品的測序、分箱和糾錯的基因組統計


接著將該分析流程應用于水下25米、117米和250米深度收集的3個海水樣品。識別了16,000-130,000個含有DTR、假定的全長雙鏈DNA尾噬菌體reads,長度分布在20-90kb。此分析促進了含有復雜重復結構基因組的識別和糾錯。例如,AFVG_250M480基因組中存在4.2kb的復雜重復結構,很容易從cluster reads中識別出40.4kb噬菌體。糾錯后基因組草圖中的病毒DTR長度在32~4829bp之間,這種重復結構很難通過短讀長組裝方法單獨解決。該分析流程還檢測到短讀長宏病毒組組裝的片段化的微多態性水平。
 
補充圖6 糾錯后獲得的病毒基因組草圖的數量和長度分布



在環境樣品中加入10 ng λ噬菌體DNA作為內參,進一步驗證該分析流程的準確性。當獲得11個全長λ Nanopore reads時,獲得的48,517bp基因組與λ噬菌體參考基因組同源性為99.81%。當獲得23個λ reads時,獲得的48,510bp基因組與參考基因組同源性為99.92%。
該流程一共獲得1864個高質量的基因組草圖,水下25米、117米和250米的樣品分別獲得566、93和1205個病毒基因組(AFVG)。
對Illumina和Nanopore測序獲得的病毒基因型進行比較。結果顯示,Nanopore直接測序的序列比Illumina組裝的Contig檢測到的病毒基因組序列更長、更完整。使用短reads糾錯后的AFVG可以提高序列質量,CDS和覆蓋率。
 

2 驗證AFVG的起源和初始特征
使用該流程對AFVG進一步驗證。結果顯示,不同深度樣品的AFVG長度不同。水下25米、117米和250米樣品中AFVG長度分別為28.0-65.2kb(平均39.3kb)、29.8-87.4kb(平均47.3kb)和28.5-73.0kb(平均41.6kb),與之前報道的結果一致。
為了進一步識別AFVG,篩選病毒序列特征、基因含量,以及與病毒數據庫的相似性。結果顯示,所有AFVG(1864個)均被VirSorter識別為病毒,且包含DTR序列;AFVG注釋基因與病毒數據庫中病毒基因有很高的序列相似性(圖3)。大多數AFVG(60%)注釋基因與病毒數據庫中病毒基因的平均氨基酸同源性(AAI)為60%。在250米樣品中,AFVG含有最大比例的新基因(圖3),與之前的報道一致。AFVG還含有較高比例的病毒標記基因,包括編碼末端、尾巴、頭部、衣殼、通道和整合酶蛋白的基因(補充圖11)。

 

圖3 AFVG注釋基因與已知病毒基因的相似性


 
 

補充圖11 3個樣品AFVGs識別的病毒標記基因


 
AFVG的分類組成與已知的同一海洋區域的微生物群落以及浮游微生物宿主一致。大部分與已知感染藍細菌的病毒或常見的異養細菌(如Pelagibacter(SAR11)、Punice isspirillum(SAR116)、假單胞菌和弧菌)的噬菌體相似。



補充圖12 每個樣品中的AFVG分類組成
 

3 DNA包裝機制的推斷
噬菌體DNA包裝機制多種多樣,但“頭部包裝”機制是許多雙鏈DNA噬菌體的共同策略。對AFVG可能的包裝機制進行預測,表明,這是一種嚴格的“頭部包裝”機制,由噬菌體頭部可用體積決定剪切位點,而不存在特定的剪切位點。
末端酶(與噬菌體DNA識別和包裝相關的蛋白質)的系統發育分析結果顯示,具有循環排列DTR的AFVG種類繁多,并且與其他AFVGs和培養的噬菌體參考序列之間存在親緣關系(補充圖14)。1簇與已知在海洋中能感染藍藻的噬藻體Prochlorococcus最相似(76%AAI);另1簇與已知能感染普通細菌屬Puniceispirillum成員的噬菌體相似度最高(88%AAI);其他簇與腸桿菌噬菌體(T3、T5和T7)及其他海洋噬菌體聚在一起。

 

補充圖14 末端酶蛋白的系統發育樹


 
4 從海水中分離出串聯重復序列
在糾錯后的AFVG中,有16條長度為33.1-66.2kb的序列,完全由5.3-13.2kb的串聯重復序列組成。對3個樣本的每條reads識別串聯重復序列。在水下25m、117m和250m樣本中分別識別到串聯重復序列為1546個(長度20-40kb,包含5-7個拷貝數)(圖5a和5b)、897個(長度為20-40kb,包含7個拷貝數)(圖5c和5d)和1947個(長度為35-40kb,包含4-7個拷貝數(圖5e和圖5f)。這些串聯重復序列長度分布與識別的AFVG長度分布一致。

 



圖5 Nanopore reads中的串聯重復長度和拷貝數

 
對這16條串聯重復序列進行注釋,顯示所有重復拷貝均含有整合酶基因,幾個串聯重復中均存在DNA啟動酶(圖6)。整合酶和DNA啟動酶是噬菌體可誘導染色體島(PICI)常見的標志基因。此外,串聯重復序列的拷貝數和reads長度與預測的PICI DNA合成和包裝機制一致。AFPP_117M2是一種無需組裝的假PICI (AFPP)(圖6),起源于海洋中最常見的異養細菌群之一的Pelagibacter。通過podoviridae家族中的Pelagiphages整合到宿主Pelagibacter基因組中,共用Pelagibacter噬菌體包裝機制,與最近的報道一致。該研究首次證明,PICI基因組串聯重復序列可能被包裝在“wild”噬菌體顆粒中,串聯重復的大小反映了噬菌體的基因組大小。


 
圖6 前噬菌體包裝的結構、PICI-like串聯重復序列

 
總結
該研究使用Nanopore測序,從海洋微生物組獲得1864個全長高質量的病毒基因組。通過分析,區分了具有相同的直接末端重復序列的群體與具有末端串聯重復序列的群體,從而為自然界病毒繁殖和基因組包裝提供了新的見解。發現了新的病毒序列,其重復結構、基因含量和串聯重復序列長度表明它們是噬菌體可誘導染色體島,它們被包裝成噬菌體顆粒,其長度與共生噬菌體的基因組大小相匹配。該研究提出的識別病毒策略可以獲得以前無法獲得的病毒和病毒寄主的基因組結構、種群生物學和生態學信息。


 
參考文獻
John B. et al. Assembly-free single-molecule sequencing recovers complete virus genomes from natural microbial communities. Genome Research. 2020,30:437–446.
 









 


Copyright ? 2018 武漢貝納科技服務有限公司 . All Rights Reserved. Designed by 鄂ICP備13016520號-1技術支持:中網維優
中文字幕亚洲欧美日韩2o19,67194好男人香蕉,亚洲 欧洲 日产 国码 v不卡,亚洲欧美日产综合