DNA不僅存儲(chǔ)遺傳序列信息,同時(shí)還有表觀修飾信息,這兩者都對(duì)我們理解生物學(xué)至關(guān)重要。通過高通量測(cè)序測(cè)定DNA堿基G、C、T和A序列的方法已經(jīng)比較成熟,近年來(lái)針對(duì)DNA中的表觀遺傳信息的檢測(cè)方法也有了很大的進(jìn)展,比如通過堿基轉(zhuǎn)換的方法區(qū)分未修飾的C與修飾的5-甲基胞嘧啶(5mC)或5-羥甲基胞嘧啶(5hmC)。這些方法包括基于亞硫酸氫鹽的方法,如全基因組亞硫酸氫鹽測(cè)序(WGBS)和無(wú)亞硫酸氫鹽方法,如酶甲基測(cè)序(EM-seq)和TET輔助的吡啶硼烷測(cè)序等。但是目前的DNA測(cè)序方法大多數(shù)只能解決序列信息或表觀修飾信息中的一種,缺乏將兩者同時(shí)測(cè)定的方法,因此最終獲取的DNA信息均布完整。盡管其中一些方法可以通過獨(dú)立操作、并行建庫(kù)等工作流程和測(cè)序來(lái)獲得完整的信息,但是這可能會(huì)增加樣本需求、成本和時(shí)間。此外,合并不同的數(shù)據(jù)庫(kù)也很困難,會(huì)導(dǎo)致額外的測(cè)量誤差和信息覆蓋缺失。
為了解決DNA測(cè)序過程中序列信息和表觀信息的統(tǒng)一性,2023年2月6日,來(lái)自劍橋大學(xué)的Shankar Balasubramanian和來(lái)自劍橋Epigenetix公司的Joanna D. Holbrook合作在Nature Biotechnology上以Article形式發(fā)表了題為Simultaneous sequencing of genetic and epigenetic bases in DNA的文章,提出了一種可以同時(shí)在一個(gè)樣品中檢測(cè)DNA序列信息和表觀修飾信息的方法。
研究人員首先開發(fā)了一種Five-letter seq的方法(如下圖),該方法不僅可以讀取常規(guī)G、C、T和A序列,同時(shí)還能讀取包含修飾胞嘧啶信息(包含5mC和5hmC)。該方法的原理是創(chuàng)造性地使用了雙堿基編碼系統(tǒng),通過兩種堿基的組合解碼一種序列或修飾信息,這個(gè)系統(tǒng)最多可以對(duì)多達(dá)16個(gè)狀態(tài)的DNA進(jìn)行明確的解碼。具體地操作流程如下:樣本DNA首先通過超聲破碎,然后在兩端連接上短的DNA發(fā)夾序列形成啞鈴狀DNA。然后,啞鈴狀DNA被拆分成單鏈,通過DNA聚合酶3'端延伸作用合成互補(bǔ)鏈,此時(shí)互補(bǔ)鏈?zhǔn)菦]有表觀遺傳修飾的,而原始樣本DNA鏈與其互補(bǔ)鏈連接形成新的發(fā)夾結(jié)構(gòu)。然后將測(cè)序接頭連接到發(fā)夾結(jié)構(gòu)DNA的末端。接下來(lái)利用TET甲基胞嘧啶雙加氧酶2將5mC氧化為5hmC或5fC或5caC,然后通過β-糖基轉(zhuǎn)移酶將所有5hmC進(jìn)行糖基化反應(yīng),經(jīng)過這樣處理之后ModCs(5mC和5hmC)被保護(hù)起來(lái)不能進(jìn)行脫氨反應(yīng)。未受保護(hù)的C通過APOBEC3A胞嘧啶脫氨酶(A3A)作用被脫氨轉(zhuǎn)變?yōu)槟蜞奏?,最后?huì)被讀取為T。然后加入U(xiǎn)vrD解旋酶,得到A3A作用的單鏈DNA底物。脫氨作用后雙鏈DNA不再完全互補(bǔ),可以顯著降低雙鏈穩(wěn)定性,因此可以很容易地通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)進(jìn)行擴(kuò)增。最后在DNA鏈兩端加上測(cè)序引物,其中read 1 (P7引物)是原始鏈,read 2 (P5引物)是復(fù)制鏈。讀數(shù)據(jù)是成對(duì)對(duì)齊的,因此read 1與它的互補(bǔ)鏈read 2匹配。通過計(jì)算解析兩個(gè)reads的同源殘基以產(chǎn)生單個(gè)遺傳或表觀遺傳字母。最終得到5種模式的遺傳信息表,剩余的11種非允許配對(duì)(標(biāo)記為N)在解析的讀取和讀取本身時(shí)被保留下來(lái),這樣可以使得最終產(chǎn)生最小的信息損失和高精度的讀取級(jí)別。
Five-letter seq
為了驗(yàn)證Five-letter seq的準(zhǔn)確性,研究人員將這種方法和WGBS和EM-seq比較,發(fā)現(xiàn)Five-letter seq不僅展現(xiàn)了很好的堿基準(zhǔn)確性,同時(shí)也對(duì)DNA表觀修飾具有高精度的檢測(cè)效率。
之后,研究人員還提供了一種Six-letter seq的方法,在Five-letter seq的基礎(chǔ)上,加入甲基復(fù)制(methyl-copy)步驟,利用DNMT5將5mC從原始鏈復(fù)制到互補(bǔ)鏈。最終5hmC受到糖基化保護(hù),不能被復(fù)制。最終Six-letter seq可以得到具有6種種模式的遺傳信息表,且通過測(cè)序驗(yàn)證可以很好地區(qū)分出C、5mC和5hmC(如下圖)。
Six-letter seq
綜上所述,研究人員提出了一個(gè)單堿基分辨率測(cè)序方法,能夠再一個(gè)樣品中同時(shí)完成DNA堿基測(cè)序和兩個(gè)最常見的胞嘧啶修飾測(cè)序。該方法準(zhǔn)確性高,需要起始DNA投入量低,且具有簡(jiǎn)單的操作流程和分析步驟。序列信息和表觀信息的同時(shí)讀取使得存儲(chǔ)在基因組中的遺傳信息了解更完整,在整個(gè)生物醫(yī)學(xué)領(lǐng)域都將會(huì)有新的應(yīng)用價(jià)值。
參考文獻(xiàn)
1. Frommer, M. et al. A genomic sequencing protocol that yields a positive display of 5-methylcytosine residues in individual DNA strands. PNAS 89, 1827–1831 (1992).
2. Vaisvila, R. et al. Enzymatic methyl sequencing detects DNA methylation at single-base resolution from picograms of DNA. Genome Res. 31, 1280-1289 (2021).
3. Liu, Y. et al. Bisulfite-free direct detection of 5-methylcytosine and 5-hydroxymethylcytosine at base resolution. Nat. Biotechnol. 37, 424–429 (2019).
4. Füllgrabe, J. et al. Simultaneous sequencing of genetic and epigenetic bases in DNA. Nat Biotechnol (2023).