染色質(zhì)可及性(Chromatin accessibility)是指核大分子能夠與染色質(zhì)化的DNA進(jìn)行物理接觸的程度,由核小體及其他阻礙接近DNA的染色質(zhì)結(jié)合因子的占據(jù)和拓?fù)浣Y(jié)構(gòu)所決定。核小體是染色質(zhì)的核心結(jié)構(gòu)元件,由一個組蛋白八聚體組成,周圍環(huán)繞著約147 bp的DNA。核小體的組成和翻譯后修飾反映了不同的功能狀態(tài),并通過多種機(jī)制調(diào)節(jié)染色質(zhì)的可及性,如通過空間位阻改變轉(zhuǎn)錄因子(TF)結(jié)合,調(diào)節(jié)核小體對活性染色質(zhì)重塑因子(remodellers)的親和力?;蚪M中核小體的拓?fù)浣Y(jié)構(gòu)是不一致的:雖然在兼性和組成性異染色質(zhì)內(nèi)密集排列,但組蛋白在調(diào)節(jié)位點(diǎn)(包括增強(qiáng)子、絕緣子和轉(zhuǎn)錄的基因體內(nèi))是缺失的。核小體間DNA常與TFs、RNA聚合酶或具有連接組蛋白(linker histones)的結(jié)構(gòu)蛋白結(jié)合,這有助于高級染色質(zhì)的結(jié)構(gòu)并調(diào)控對DNA的接近。核小體占據(jù)和連接組蛋白占據(jù)在基因組范圍內(nèi)呈動態(tài)變化,構(gòu)建了一個從封閉染色質(zhì)到高度動態(tài),可接近或開放染色質(zhì)的可及性連續(xù)體 (圖1)。染色質(zhì)可及性圖譜廣泛反映了調(diào)控的能力,并不是一個靜態(tài)的生物物理狀態(tài),其對染色質(zhì)的結(jié)構(gòu)和功能至關(guān)重要。
圖1 可及性狀態(tài)反映了染色質(zhì)動態(tài)變化過程
可接近的基因組雖然僅占總DNA序列的2~3%,但卻捕獲了90%以上的TFs結(jié)合區(qū)域(ENCODE數(shù)據(jù))。除了少數(shù)在兼性或組成性異染色質(zhì)中富集的TFs外,在ENCODE項目中研究的絕大多數(shù)TFs幾乎特異性地與開放染色質(zhì)結(jié)合。TFs與組蛋白和其他染色質(zhì)結(jié)合蛋白進(jìn)行動態(tài)競爭,調(diào)節(jié)核小體占據(jù)并促進(jìn)局部接近DNA;反過來,特定細(xì)胞類型的可及性圖譜也可以調(diào)控TF結(jié)合。對于多細(xì)胞系統(tǒng),TFs具有廣泛的功能作用,在短時間尺度上提供轉(zhuǎn)錄的動態(tài)調(diào)控,并建立和維持具有共同基因組的細(xì)胞類型的持續(xù)表觀遺傳渠道化(epigenetic canalization)。因此,染色質(zhì)可及性既反映了整合的TF結(jié)合,也反映了遺傳位點(diǎn)的調(diào)控潛力。這一觀點(diǎn)為追蹤決定細(xì)胞狀態(tài)的轉(zhuǎn)錄調(diào)節(jié)因子差異結(jié)合的可及性變化奠定了分析基礎(chǔ)。
染色質(zhì)可及性普遍通過量化染色質(zhì)對酶甲基化或其組成DNA切割的敏感性來檢測(圖2)。原則上,染色質(zhì)可及性的檢測取決于所研究的分子;然而,據(jù)報道可及性又具有顯著的保守性。1973年,Hewish和同事使用DNA內(nèi)切酶來片段化染色質(zhì),表明核小體在整個基因組中具有周期性的超敏反應(yīng)。這種周期性可以通過Southern blot雜交檢測,發(fā)現(xiàn)在基因組保守的DNA酶超敏位點(diǎn)(DHSs)之間存在一個典型的100-200bp相位模式。這和隨后的工作為典型的核小體相位提供了最早的直接證據(jù)。類似的技術(shù)也被用于將黑腹果蠅染色質(zhì)重塑與熱休克位點(diǎn)的同時轉(zhuǎn)錄激活聯(lián)系起來。隨著1985年PCR技術(shù)的引入,各種定量方法(如下所述)已經(jīng)發(fā)展起來,可以使用核酸內(nèi)切酶和連接介導(dǎo)的PCR技術(shù)來檢測位點(diǎn)特異性的染色質(zhì)可及性。
圖2 染色質(zhì)可及性檢測方法原理
DNase-seq
全基因組范圍內(nèi)的開放染色質(zhì)區(qū)域檢測首次在2006年的兩篇研究中發(fā)表,研究通過將DNase I消化后的天然構(gòu)象的染色質(zhì)片段雜交到覆蓋1%人類基因組的平鋪芯片上得到這部分序列信息。后續(xù)改進(jìn)的技術(shù)流程采用短讀長測序來定量基因組范圍內(nèi)DNase敏感的染色質(zhì)相對豐度(DNase I超敏位點(diǎn)測序(DNase- seq)) (圖2a)。Boyle等人使用II型限制性內(nèi)切酶分離并對每個DNA酶切位點(diǎn)進(jìn)行條形碼標(biāo)記(單切,single cut),而Hesselberth等人使用嚴(yán)格的片段選擇來富集DHSs中成對切割事件產(chǎn)生的可測序片段(雙切,double cut) (圖2a)。盡管這些測序方法之間有廣泛的共識,Boyle的實驗方法可以鑒定到更多可接近的位置,而Hesselberth方法則提供了一個簡化的實驗流程,并且其中捕獲的來自廣泛的不可接近染色質(zhì)的片段會更少(更高的信噪比)。總的來說,這些基因組水平的染色質(zhì)可及性檢測顯示,少數(shù)DHSs位于啟動子和轉(zhuǎn)錄起始位點(diǎn)(TSS)的近端區(qū)域,超過80%的可接近性區(qū)域位于遠(yuǎn)端增強(qiáng)子區(qū)。
ATAC-seq
轉(zhuǎn)座酶可接近染色質(zhì)測序(ATAC-seq)使用超活性Tn5轉(zhuǎn)座酶將Illumina測序接頭插入可接近的染色質(zhì)區(qū)域(圖2b)。與雙切DNase-seq操作方法類似,ATAC-seq選擇性地放大可接近染色質(zhì)的近端雙切事件。ATAC-seq可及性檢測與雙切(r > 0.8)和單切(r > 0.75) DNase-seq實驗結(jié)果均高度相關(guān),盡管在做一些更高分辨率的分析時(例如分析TF印記),兩種技術(shù)在測序偏倚性上仍存在差異。由于Tn5介導(dǎo)的接頭連接的高效率,已經(jīng)可以對低至500個數(shù)量的細(xì)胞成功構(gòu)建高度復(fù)雜的ATAC-seq文庫。近期也有報道多種ATAC-seq的改進(jìn)方法,包括Sos等人的一項研究表明,可以利用單個轉(zhuǎn)座事件的體外轉(zhuǎn)錄來構(gòu)建文庫。ATAC-seq之所以被廣泛采用,部分原因是它能夠很好地識別可接近的染色質(zhì),而且簡單、快速實施,并能應(yīng)用于現(xiàn)實條件下有限的臨床和原代組織樣本。值得一提的是,10000-20000個細(xì)胞的ATAC-seq文庫通常在2小時內(nèi)完成,相比較而言,DNase-seq通常需要數(shù)百萬個細(xì)胞的多天操作流程。盡管已知兩種方法的局部序列偏差不同,但ATAC-seq和DNase-seq捕獲了相似的調(diào)控信息。
MNase-seq
鑒于組蛋白在調(diào)節(jié)染色質(zhì)可及性方面的中心作用,核小體占據(jù)和定位技術(shù)——微球菌核酸酶測序(MNase-seq)最近被應(yīng)用于檢測可及性(圖2c)。MNase既可作為核酸內(nèi)切酶來切割核小體間DNA,也可作為外切酶來降解不受蛋白質(zhì)保護(hù)的片段化DNA。MNase-seq與DNase-seq和ATAC-seq之間的一個顯著區(qū)別是后兩者都沒有發(fā)生核小體DNA切割事件。事實上,MNase可能通過其內(nèi)切酶活性來切割核小體DNA;然而,這類切割事件是否真實存在,因為其自身外切酶介導(dǎo)的片段降解而無從得知。由于MNase對核小體DNA的切割效率低于核小體間DNA,因此該酶被廣泛用于分離跨越單個核小體的片段。先前的研究顯示,某些核小體對MNase的敏感度具有劑量依賴特性,Mieczkowski和其同事利用不同濃度的核酸酶進(jìn)行MNase-seq,以檢測整個基因組的差異可及性。這種技術(shù),稱為MNase可及性(MACC),基于MNase-seq文庫中可接近DNA隨核酸酶濃度的增加而減少(可能由于外切酶介導(dǎo)的消化),而受保護(hù)的核小體DNA由于內(nèi)切酶介導(dǎo)的切割發(fā)生率增加而表現(xiàn)為相對豐度增加。MACC信號在預(yù)測活躍調(diào)控區(qū)域(組蛋白H3賴氨酸27乙酰化(H3K27Ac)陽性區(qū)域)高度富集,與TSSs、啟動子和遠(yuǎn)端增強(qiáng)子的DNase超敏數(shù)據(jù)相關(guān)性較好,但在轉(zhuǎn)錄終止位點(diǎn)或基因體內(nèi)相關(guān)性差。這種差異可能是由于不同方法中片段長度的差異富集或使用的酶探針大小的不同造成。
NOMe-seq
核小體占據(jù)和甲基化組測序(NOMe-seq)使用來自M.CviPI的GpC甲基轉(zhuǎn)移酶(MTase),這種酶通過對可接近的DNA進(jìn)行化學(xué)修飾而非切割的方式來檢測染色質(zhì)的可及性(圖2d)。這種新的MTase在GC二核苷酸上產(chǎn)生異常的甲基化,與人類和小鼠基因組中常見的CG二核苷酸上的內(nèi)源性甲基化區(qū)別開來。因此,NOMe-seq在高分辨率下可以同時檢測DNA可及性和甲基化狀態(tài),因為GpC在整個基因組中頻率很高。重要的是,NOMe-seq并不是一種富集方法,因此需要相對大量的測序reads來獲得足夠的深度來確定整個基因組的可及性水平。然而,由于富集偏差的缺失和該技術(shù)的單分子特性,使得其對染色質(zhì)可及性圖譜的檢測比DNase-seq、ATAC-seq或MNase-seq更能提供定量的信息,因為每個基因組位點(diǎn)的相對可及性水平可以直接測定。
單細(xì)胞可及性檢測
單細(xì)胞可及性變化的檢測有望揭示基因組調(diào)控的一個核心問題:染色質(zhì)可及性短時間尺度內(nèi)的波動和發(fā)展變化是如何在整個基因組中協(xié)調(diào)的?基于ATAC-seq、DNase-seq和NOMe-seq文庫制備方案,已經(jīng)開發(fā)了多種方法來檢測單個細(xì)胞中的染色質(zhì)可及性。
組合標(biāo)簽(Combinatorial indexing)為成千上萬的單細(xì)胞ATAC-seq文庫加上條形碼(barcode)提供了一種完美的策略。在這種方法中,用帶有獨(dú)特的條形碼Tn5酶對純化的細(xì)胞核進(jìn)行多重轉(zhuǎn)座反應(yīng),然后在有限稀釋的條件下混樣并分開進(jìn)行多重標(biāo)簽PCR反應(yīng)。這種方法的原理是任意兩個細(xì)胞在轉(zhuǎn)座后,被后續(xù)混樣和分開PCR的操作中標(biāo)記上完全相同的兩重標(biāo)簽的概率很低,因此不需要分離單個細(xì)胞。組合標(biāo)簽已被用于分析黑腹果蠅胚胎發(fā)育的成千上萬個單細(xì)胞的可及性,建立了13種不同組織的小鼠細(xì)胞類型圖譜,并研究正在發(fā)育的小鼠前腦的轉(zhuǎn)錄調(diào)控。
單細(xì)胞ATAC-seq也可以通過在微流控設(shè)備(Fluidigm, C1)或在單個標(biāo)簽的納米孔芯片中來(Takara Bio, ICELL8)實現(xiàn)捕獲單細(xì)胞。微流控捕獲已經(jīng)被用于在早期的造血過程中對成千上萬個單細(xì)胞的可及性進(jìn)行分析,而納米孔芯片有望進(jìn)一步將微流控方法的通量提高一個數(shù)量級。在選擇使用這兩個平臺還是組合標(biāo)簽方法時需要作出權(quán)衡:微流控和納米孔芯片平臺每次實驗處理的細(xì)胞會明顯少于組合標(biāo)簽方法,但由此產(chǎn)生的單細(xì)胞文庫復(fù)雜性至少示后者的兩倍。文庫復(fù)雜度的差異是一個重要的參數(shù),因為即使是對無所不在的開放區(qū)域也只是采樣了少量分散的區(qū)域(平均而言,使用C1平臺的單個細(xì)胞中只觀察到所有開放區(qū)域的10%),我們預(yù)計這兩種方法的文庫復(fù)雜度在近期都將得到改善。單細(xì)胞ATAC-seq最近已經(jīng)在10X Genomics公司和Bio-Rad Laboratories公司的基于液滴的微流控平臺上得到了應(yīng)用。早期的報告表明,這些高通量平臺將提供類似于納米孔捕獲技術(shù)的數(shù)據(jù)質(zhì)量。
轉(zhuǎn)座酶介導(dǎo)的單細(xì)胞染色質(zhì)可及性分析很快出現(xiàn)了DNase-seq和NOMe-seq的單細(xì)胞改進(jìn)版。結(jié)合甲基化、可及性和核小體相位的原理證明以及單細(xì)胞NOMe-seq分析,Pott報道了從單細(xì)胞尺度能鑒定出5.2-9.5%的DHSs 。雖然單細(xì)胞DNase-seq在目前還不容易擴(kuò)展,但它可以在所有開放染色質(zhì)中捕獲、生成具有近100,000個獨(dú)特reads的顯著復(fù)雜性的單細(xì)胞可及性片段文庫。盡管DHSs的reads比例略低于基于ATAC-seq的方法(單細(xì)胞DNase-seq的占23-26%,而單細(xì)胞ATAC-seq的占35-55%),但在DHSs上觀察到的獨(dú)特片段的數(shù)量仍然相對較高。值得注意的是,對于一小部分DHSs,在幾乎所有的單細(xì)胞中都可以從這些區(qū)域中鑒定到可接近的片段;此外,來自單個細(xì)胞的典型DNase-seq文庫包含來自所有DHSs的35-59%的片段(相比之下,來自單個細(xì)胞的ATAC-seq只占10%)??偟膩碚f,這些原理證明方法為構(gòu)建單細(xì)胞表觀遺傳學(xué)技術(shù)手段提供了重要的研究方向。
解析染色質(zhì)可及性特征
最近的單分子和單細(xì)胞可及性檢測表明,細(xì)胞群的可及性檢測代表了不同分子狀態(tài)的總體平均值(圖3)。當(dāng)觀察潛在的、動態(tài)的、不同步的過程時,這種分子異質(zhì)性自然會出現(xiàn)。例如,在轉(zhuǎn)錄位點(diǎn)RNA聚合酶和其他TFs一起取代TSS上游的核小體,并遷移經(jīng)過啟動子下游的定位良好但不穩(wěn)定的核小體(圖3a)。單分子NOMe-seq數(shù)據(jù)的印記分析揭示了這一過程,捕獲了轉(zhuǎn)錄過程進(jìn)行時的每個分子狀態(tài)(圖3b)。盡管考慮到采樣效率,可及性的單細(xì)胞檢測在全基因組范圍內(nèi)預(yù)測的調(diào)控區(qū)域發(fā)現(xiàn)了相似的分子異質(zhì)性(圖3c)。
圖3 細(xì)胞群范圍的染色質(zhì)可及性檢測反映了異質(zhì)性的單分子平均的可及性
DNase-seq和ATAC-seq對大量細(xì)胞群的開放染色質(zhì)的檢測可被視為總體的TF-結(jié)合信號的整合。結(jié)合TFs保護(hù)DNA不被酶消化,其保護(hù)程度與TF對DNA的結(jié)合占據(jù)有關(guān)??紤]到它們相對快速的脫去速率,我們可以預(yù)期,TFs通常比核小體提供更少的保護(hù)。這種精細(xì)的TF相關(guān)的保護(hù)需要使用不同的生物信息學(xué)分析方法,利用基因組范圍內(nèi)TF結(jié)合親和力和酶切特異的序列偏倚性信息去解析TF結(jié)合和染色質(zhì)結(jié)構(gòu)。可及性結(jié)合轉(zhuǎn)錄數(shù)據(jù)進(jìn)一步擴(kuò)展了此分析流程:給定一組不同的細(xì)胞類型之間的可接近區(qū)域,在不同的發(fā)展階段或其他實驗條件下,可以發(fā)現(xiàn)哪些TFs是差異表達(dá)的,并被推斷結(jié)合到差異的可接近的DNA上,而這些TFs可能參與調(diào)控某些表觀遺傳的差異。因此這仍然是一個活躍的領(lǐng)域研究,我們預(yù)計未來幾年的焦點(diǎn)集中在整合可及性與其他表觀遺傳檢測的計算方案。
最近,染色質(zhì)可及性已被用來識別由全基因組關(guān)聯(lián)研究(GWAS)產(chǎn)生的因果遺傳變異。人類基因組中大多數(shù)單核苷酸多態(tài)性(SNPs)發(fā)生在非編碼和基因間的基因組區(qū)域,個體對復(fù)雜性狀的影響很小或是間接的,因此混淆了因果變異的檢測。最近,一些研究利用染色質(zhì)的可及性來更好地理解這些非編碼SNPs及其對性狀的影響。例如,Maurano等人發(fā)現(xiàn)許多因果GWAS變異集中在非編碼的DHSs中,通過使用染色質(zhì)可及性數(shù)據(jù),可以更準(zhǔn)確地關(guān)聯(lián)到它們影響的基因。這些結(jié)果強(qiáng)調(diào)了將染色質(zhì)可及性數(shù)據(jù)與功能和其他表觀遺傳數(shù)據(jù)分析相結(jié)合的價值。
ATAC-seq技術(shù)優(yōu)勢及參數(shù)
天昊生物具有多年基因組、轉(zhuǎn)錄組和表觀組等多組學(xué)檢測與分析的經(jīng)驗,ATAC-seq在眾多領(lǐng)域還未曾大展身手,同時又可以聯(lián)合WGS或WGBS或RNA-seq等進(jìn)行多組學(xué)分析豐富您的研究內(nèi)容。天昊生物可為您提供專業(yè)的科研服務(wù)及個性化的生信挖掘!
歡迎聯(lián)系我們!
郵箱:techsupport@geneskies.com
電話:400-065-6886