<font id="jvfph"><ruby id="jvfph"></ruby></font>

    <sub id="jvfph"></sub>

          <output id="jvfph"><strike id="jvfph"><p id="jvfph"></p></strike></output>

              <menuitem id="jvfph"><ruby id="jvfph"></ruby></menuitem>

              <menuitem id="jvfph"></menuitem>

                科研

                首頁 - 全部文章 - 科研 - Nature | 人類遺傳學里程碑!首個人類泛基因組草圖公布,增加1.19億個堿基對,準確度超99%

                Nature | 人類遺傳學里程碑!首個人類泛基因組草圖公布,增加1.19億個堿基對,準確度超99%

                自發布20多年以來,人類參考基因組已成為人類基因組學研究的支柱。但目前使用的GRCh38版本存在210Mb的空白,占初級染色體框架的6.7%,缺失的參考序列會導致測序分析結果偏差,將研究限制在參考序列的范圍內。2022年3月,端粒到端粒(T2T)聯盟完成了人類單倍體基因組的第一個完整序列T2T-CHM13,提供了每個常染色體和X染色體的無縫組裝序列,部分核糖體DNA陣列仍有待完全解析。T2T-CHM13直接改善了當前的基因組分析,發現了更多單核苷酸多態性(SNP),更好地代表了人類基因組樣本的真實拷貝數變異(CNV)。

                雖然T2T-CHM13代表了一項重大成就,但沒有一個基因組可以代表物種的遺傳多樣性。由于參考基因組中缺少多態性結構變異(SV)的替代等位基因,因此在使用短讀長測序數據和前期人類參考基因組的研究中,超過三分之二的SV被遺漏了。為了克服參考偏差,研究人員已經開始向泛基因組參考圖譜的過渡。2019年,美國國家人類基因組研究所(NHGRI)成立HPRC,目標是為代表人類遺傳多樣性的泛基因組創建高質量、具有成本效益的二倍體基因組組裝。在過去的幾年中,泛基因組學方法發展迅速,因此現在提出使用泛基因組學進行普通基因組分析是可行的。

                近日,人類泛基因組參考聯盟(HPRC)在Nature發表了題為“A draft human pangenome reference”的文章。研究團隊對一組個體的基因組進行了測序和組裝,提出了人類泛基因組的第一個版本,首次公布了人類泛基因組草圖。該草圖包含47個不同祖先個體的分相二倍體組裝(phased diploid assemblies),覆蓋了每個基因組中超過99%的預期序列,基因結構和堿基對水平的準確度超過99%。

                新生成的人類泛基因組草圖捕獲了已知的變異和單倍型,并在結構復雜的位點上揭示了新的等位基因。相對于現有的人類參考基因組GRCh38,新草圖增加了1.19億個堿基對的常染色質多態性序列和1115個基因重復序列,發現約9000萬個新增加堿基對來自于結構變異。與基于GRCh38的工作流程相比,使用該泛基因組草圖來分析短讀長測序數據可以減少34%的微小變異發現錯誤,每個單倍型檢測到的結構變異數量增加104%,使得每個樣本中絕大多數結構變異等位基因的分型成為可能。

                文章發表在Nature

                組裝47種不同的人類基因組

                首先,研究人員從代表全球遺傳多樣性的基因組中選擇了47個全相二倍體組合,包括29個樣本,其長讀長測序數據完全由HPRC生成,另外18個樣本由其他測序方法獲得。研究團隊為每個樣本創建了一組一致的深度測序數據類型。所有HPRC樣本的數據包括PacBio、HiFi和ONT長讀長測序、Bionano光學圖和高覆蓋率Hi-C Illumina短讀長測序。為46個HPRC樣本生成了平均39.7×覆蓋深度的HiFi序列,HiFi讀取的N50值平均為19.6kb。

                研究人員首先搜索了大規模的錯誤組裝,尋找基因復制錯誤、相位錯誤和染色體間錯誤連接,手動修復了3個大的復制錯誤和1個大的相位錯誤,并發現了217個假定的染色體間連接,這些連接中只有一個被人工確認為錯誤組裝,其余的連接涉及到染色體的短臂,這可能是錯位、非等位基因轉換或其他生物機制導致的結果。

                為了評估人工修正錯誤后的組裝結果,研究團隊開發了一個自動化的組裝質量控制流程,該流程結合了可評估每個組裝的完整性、連續性、基本質量和相位精度的方法。含有X染色體的單倍體平均總長度為3.04 Gb,是含有X染色體的T2T-CHM13(3.06 Gb)的99.3%。包含一條Y染色體的單倍體平均總長度為2.93 Gb,反映了性染色體之間的大小差異。NG50的平均值與GRCh38的連續NG50值相當。評估結果表明,該組裝流程的高度連續性和準確性。

                圖1. 47個準確和近乎完整的多樣化二倍體人類基因組組裝,來源:Nature

                注釋47個不同的基因組

                研究團隊還開發了一個新的集成映射分析流程,來注釋每個新的單倍體組裝中的基因和轉錄組。在每個HPRC組裝體中,鑒定出99.07%已知的蛋白質編碼基因和99.42%的蛋白質編碼轉錄組。同時,還鑒定出98.16%已知的非編碼基因和98.96%的非編碼轉錄組。將HPRC注釋與組裝可靠性預測相交叉,99.53%的基因和99.79%的轉錄組注釋完全發生在可靠區域內,表明大多數注釋的轉錄組單倍型在結構上是正確的。為了檢測轉錄組堿基的準確性,研究人員在一組標準轉錄物中尋找無義和移碼突變(每個基因一個代表性轉錄物),發現每個組裝中有25個無義突變和72個移碼突變。

                此外,在預測的可靠區域內,相對于GRCh38,每個組裝平均有36個拷貝數增加的基因,并傾向于罕見的低拷貝CNV,71%的CNV基因出現在單個單倍型中。以往使用測序深度的研究發現,罕見的CNV通常發生在被注釋為在SD中富集的區域之外,基因組組裝在序列分辨CNV中證實了這一觀察結果??傮w而言,58個基因在10%或更多的單倍體組合中是CNV,相對于GRCh38,大多數個體擴增了16個基因,其中許多基因具有高度拷貝數多態性,是復雜串聯重復的一部分。

                圖2. 組裝基因組的轉錄組注釋,來源:Nature

                構建泛基因組草圖

                為表征泛基因組中的變異,研究團隊使用圖分解來識別對應于非重疊變異位點的子圖,然后將變異位點分為不同類型的小變異(<50 bp)和SV(≥50 bp)。結果發現,每個泛基因組中每種變異類型的數量相似,在MC圖中有2200萬個小變異,以及MC圖中的67,000個SV。(圖3b)通過在圖中追蹤每個個體組合的路徑來評估其變異,并在Dipcall定義的基因組區域內發現了相似數量的小變異和SV,在MC圖中,每個樣本有534萬個小變異,每個單倍型平均有16,800個SV。此外,研究人員還量化了44個二倍體基因組中每個基因組對泛基因組增量貢獻的常染色體非參比序列的數量。

                為了進一步探索通過組裝和圖形構建捕獲的變異體調用的質量,研究人員將泛基因組解碼的變異體與通過基于參考基因分型方法識別的變異體集進行了比較,發現變體調用性能都很高。此外,泛基因組草圖在捕捉基因組變異方面的表現比基準方法結果要好。

                圖3. 基于泛基因組的分析顯示了不同的變異,來源:Nature

                圖4.可視化復雜的泛基因組位點。來源:Nature

                泛基因組草圖的應用

                研究獲得的泛基因組草圖旨在通過消除使用單一線性參考基因組(如GRCh38或CHM13)所固有的映射偏差,廣泛改善下游分析工作流程。作為最初的測試案例,研究團隊分析了針對泛基因組的映射是否可以提高從短reads中調用小變異的準確性。結果發現,泛基因組方法在尋找小變異方面優于其他方法。

                圖5. 泛基因組提升短讀長數據分析的性能,來源:Nature

                總而言之,該研究公開發布了來自47個不同群體的94個從頭單倍型組裝,這提供了一套全相人類基因組組裝,并在許多組裝質量水平上優于早期數據。此前的參考基因組僅使用短讀長測序,新的參考基因組圖譜同時整合了長讀長測序數據,能夠更清楚地發現結構變化。這些改進是由更好的測序技術和組裝算法協調創新驅動的結果。與2001年發布的人類基因組圖譜相比,新的基因組參考圖譜更具包容性,提供了更完整的人類基因組圖像。

                Nature同期發表的評述文章指出,人類泛基因組參考圖譜是人類遺傳學的一個里程碑,它揭示了人類基因組重復區域之間的序列交換如何促進了種群的變異和進化。同時,泛基因組的使用有可能改變人類基因組學,這最終將使人們更容易發現調節身體和臨床特征的基因變異,并有望最終服務于人類健康。

                文章合作者、圣路易斯華盛頓大學醫學院教授王艇表示:“泛基因組圖譜的影響是深遠的。例如,與人類疾病相關的遺傳變異的識別將更加敏感和更具體,將直接改善疾病的診斷和治療。新的參考基因組也為研究遺傳變異的功能提供了基礎,這項工作可能會深刻地改變人類遺傳學研究。這不是一個項目的結束,而是一個新時代的開始,在生物、生物醫學和臨床科學中將更有意義地融合人類多樣性。新的參考圖譜將繼續增加、擴展和完善,以準確地描繪我們的基因藍圖——這需要全球的努力?!?/p>

                文章的共同通訊作者、哈佛大學醫學院丹娜-法伯癌癥研究所李恒教授,同時在Nature Biotechnology發表了該項目使用的圖形組裝方法,文章題為“Pangenome graph construction from genome alignments with Minigraph-Cactus”,展示了Minigraph-Cactus泛基因組框架。該框架可直接基于全基因組比對創建泛基因組圖譜,并能夠擴展到人類泛基因組參考聯盟的90個人類單倍型。該方法構建了包含所有形式的遺傳變異圖形,同時允許使用當前的制圖和基因分型工具。

                此外,同期發表在Nature的另一篇文章“Increased mutation and gene conversion within human segmental duplications”中,展示了泛基因組草圖片段重復中的單核苷酸變異(SNV)圖譜,表征了數百萬個未繪制的SNV,并發現了不同于獨特DNA的獨特突變譜。與獨特的DNA相比,這些不同的突變特性有助于保持片段重復整體更高的GC含量。

                在另一篇Nature文章“Recombination between heterologous human acrocentric chromosomes”中,研究人員使用新泛基因組草圖數據識別了異源端著絲粒染色體短臂之間的重組模式,為染色體之間的DNA交換機制提供了第一個觀察證據。

                美國國家人類基因組研究所所長Eric Green認為:“新的泛基因組圖譜越來越多地代表了人類的多樣性,使科學家和醫療專業人員能夠更好地了解影響健康和疾病的基因組變異,這對于推進基因組學領域發展至關重要?!?/p>

                但挑戰依然存在,例如,針對泛基因組中高度可變重復區域的序列比對可以通過更精確的組裝或新算法來改進。此外,科學家廣泛采用泛基因組可能也需要時間,因為支持泛基因組分析的新方法正在不斷開發,科學家通常需要接受培訓才能使用它們。

                參考資料:

                1. Liao, WW., Asri, M., Ebler, J.?et al.?A draft human pangenome reference.?Nature?617, 312–324 (2023). https://doi.org/10.1038/s41586-023-05896-x

                2.Hickey, G., Monlong, J., Ebler, J.?et al.?Pangenome graph construction from genome alignments with Minigraph-Cactus.?Nat Biotechnol?(2023).?https://doi.org/10.1038/s41587-023-01793-w

                3.Vollger, M.R., Dishuck, P.C., Harvey, W.T.?et al.?Increased mutation and gene conversion within human segmental duplications.?Nature?617, 325–334 (2023). https://doi.org/10.1038/s41586-023-05895-y

                4.Guarracino, A., Buonaiuto, S., de Lima, L.G.?et al.?Recombination between heterologous human acrocentric chromosomes.?Nature?617, 335–343 (2023). https://doi.org/10.1038/s41586-023-05976-y

                5.https://www.genomeweb.com/genetic-research/pangenome-reference-provides-inclusive-view-human-genome#.ZF3t-It36M8

                (1)

                本文由 SEQ.CN 作者:陳初夏 發表,轉載請注明來源!

                熱評文章

                好涨太粗进去用力快好深视频_试衣间和老师疯狂试爱_巨大巨粗巨长 黑人长吊_妇女满足农民工特级毛片

                  <font id="jvfph"><ruby id="jvfph"></ruby></font>

                  <sub id="jvfph"></sub>

                        <output id="jvfph"><strike id="jvfph"><p id="jvfph"></p></strike></output>

                            <menuitem id="jvfph"><ruby id="jvfph"></ruby></menuitem>

                            <menuitem id="jvfph"></menuitem>