尋找蛋白質與核酸交互作用的歷史回顧——ChIP-seqDamID-seqDAP-seq的簡介

撰文:林秩緯

前言

        了解蛋白質與 DNA、RNA 的互動關係以及蛋白質對基因表達的影響一直是生物學的重要議題。隨著時間推展,相關的實驗技術已經突飛猛進,科學家們陸續開發了不同的工具,這些工具成為研究的利器,快速驅動著現代生物學的發展。在這篇文章中,我們將回顧研究蛋白質與核酸互動關係的實驗技術發展,並且了解 ChIP-seq、DamID-seq、DAP-seq 三種技術背後的原理,以及它們各自帶來的重大革新。


基因體時代以前:Filter Binding Assay


     在 Francis Crick 提出中心法則後,在 1960 年代,基因表達的重要機制陸陸續續被科學家解開,這些機制牽涉到很多蛋白質與核酸的交互作用,為了釐清這些交互作用,科學家研發了相對應的技術,其中最廣泛運用的技術就是過濾式結合反應分析(Filter Binding Assay,或稱濾紙結合分析法),這個技術的原理非常直觀:用於實驗的核酸都經過放射性同位素標定,將核酸與蛋白質充分混合反應後,利用抽濾篩選不同大小的分子,較大的蛋白質會留在濾紙上,未結合的核酸則會通過濾紙,若蛋白質成功與目標核酸片段形成核酸-蛋白質複合體,則濾紙上便可以測得同位素的訊號(圖1)。



圖 1:filter binding assay 的原理:使用核酸可以通過但蛋白質無法通過的膜作為濾紙,目標核酸片段都使用同位素標定,將核酸與蛋白質充分混合反應後,若蛋白質成功與目標核酸片段形成核酸-蛋白質複合體,則濾紙上便可以測得同位素的訊號。


        這項技術促成了許多重要的發現,例如密碼子與胺基酸的對應關係 [1]、tRNA 與 Aminoacyl tRNA synthetases 的結合 [2]、乳糖操縱組的發現 [3] 等等。這項技術的優點是便宜、快速、簡單,但同時也有不少缺點,例如:結合力不強的複合體沒辦法抵抗抽濾的負壓、與濾紙親和力低的蛋白質無法被濾紙留住、無法分析複合體的組成一個複合體可能有多種蛋白質參與)等等 [4]。為了改善這些缺點,後續又有研究者開發出凝膠電泳遷移分析Electrophoretic Mobility Shift Assay, EMSA[5][6]、表面電漿子共振Surface Plasmon Resonance, SPR[7] 等等技術,這些技術提高了分析的靈敏度,也提供了分子量的資訊,使得人們可以分析複合體的組成,甚至可以提供 real-time data,但在單一實驗中這些技術能檢測的蛋白質與核酸序列依舊十分有限註一


基因體時代的來臨 

    時間來到 1970 年代,在這個時期核酸定序的技術開始蓬勃發展,吳瑞與 Radhakrishnan Padmanabhan 等人率先以合成法測定核酸序列 [8][9],經過 Frederick Sanger 等人的改良,廣為人知的 Sanger 定序法在 1977 年問世,Sanger 等人也利用這項技術測定了嗜菌體 φX174 的基因體,完成史上第一個基因體的定序 [10][11]。在同時期也有人以分解法測定核酸序列 [12]。定序技術的蓬勃發展,使得人們得以從基因體的尺度處理生物問題,從此揭開基因體時代的序幕。


開啟全基因體搜尋的先河──ChIP-seq

  

    隨著基因體時代的到來,科學家開始試圖了解蛋白質與核酸在基因體上交互作用的位置,並且持續提出新的實驗方法,希望能夠更加接近這些分子在生物體內(in vivo)真實的反應狀態。



 在 EMSA 技術發表的四年後(1985),David Gilmour 和 John Lis 發明了染色質免疫沉澱法(Chromatin Immunoprecipitation, ChIP)[12],並且成功利用這個方法呈現出熱逆境處理前後,果蠅細胞中RNA聚合酶II(RNA polymerase II)與熱休克蛋白(Heat shock protein)基因結合情形的顯著差異(圖2)。同時他們也比較了熱休克蛋白基因和其他基因在熱逆境處理前後與 RNA polymerase II 結合情形的差異(圖3)。在這份研究中,所有 RNA polymerase II 與DNA的結合都是在果蠅細胞中發生,也首開在全基因體上尋找蛋白質與核酸交互作用的先例。


圖2:Gilmour, D.S.和J.T. Lis使用 ChIP 比較 hsp70 coding gene 在熱處理前後與 RNA polymerase II 結合情形的差異。Total 表示未使用免疫沉澱時,熱處理前後從細胞中萃取出的hsp70 DNA總量;Imm.ppt.則表示使用免疫沉澱後,熱處理前後從細胞中萃取出與 RNA polymerase II 結合的 hsp70 DNA總量,可以看到熱處理後與 RNA polymerase II 結合的 hsp70 DNA 明顯增加許多。

圖3:Gilmour, D.S.和J.T. Lis使用 ChIP 比較多個 hsp coding gene 與非 hsp coding gene 在熱處理前後與 RNA polymerase II 結合情形的差異。Total 表示未使用免疫沉澱也未熱處理時,從細胞中萃取出的各種 DNA 總量;NHS Imm.ppt.則表示未熱處理時,使用免疫沉澱後,從細胞中萃取出與RNA polymerase II 結合的各類 DNA 總量;HS Imm.ppt.則表示熱處理且使用免疫沉澱後,從細胞中萃取出與 RNA polymerase II 結合的各類 DNA 總量。

  隨著許多生物的基因體陸續被解出,科學家結合 ChIP、定序技術以及基因體資料,建立出 ChIP-seq,這套方法不僅能找出特定轉錄因子的目標結合序列,還可以找出它們在基因體上的位置。這麼一個劃時代的技術是如何運作的呢?ChIP-seq 的實驗流程大致可以分為五個階段:固定、萃取、免疫沉澱、分離目標 DNA、定序與定位,多方參考後 [4][14][15][16],以下將簡介這五個階段個別的功能圖4


固定(Fixation):

這個階段的目的是把蛋白質與 DNA 連接cross-linking在一起,方便後續能用抗體進行免疫沉澱分析。使蛋白質與 DNA 連接的方法有很多,大致可以分為化學方法與物理方法兩類。化學方法就是加入特定的化學物質,使得蛋白質與 DNA 之間產生鍵結,常用的試劑包括:甲醛Formaldehyde、亞甲基藍Methylene blue、吖啶橙Acridine orange等等;物理方法則是透過紫外線366 nm或者是雷射光照射,使得蛋白質與DNA之間產生鍵結。

萃取(Extraction):

        完成固定後,下一步就要把染色質從細胞中萃取出來。為了分離出細胞核,首先會在細胞培養盤中加入含有蛋白酶抑制劑的緩衝液,再利用離心的方式使細胞裂解並且使細胞核沉降。獲得細胞核之後,根據實驗的需求,會使用不同方法將染色質碎成小片段fragmentation,常見的方法如:超音波震盪sonication、限制酶剪切restriction digestion等等。

免疫沉澱(Immunoprecipitation):

        這是 ChIP 最關鍵的階段,被切碎的染色質會和根據研究需求設計的抗體混和。有些抗體能辨認特定的轉錄因子,用來觀察轉錄因子與基因的互動;有些則能辨認組蛋白上特定的抗原表位Epitope,用來觀察表觀遺傳修飾。這些抗體會連接在磁珠註二,透過離心沉降並且反覆沖洗磁珠,便可以把成功被抗體辨認的染色質片段沉澱出來。


分離目標DNA DNA Isolation

因為在第一個階段中,蛋白質與 DNA 被連接在一起,這個階段的主要目標就是要破壞這個連結reverse the cross-links並萃取 DNA。這裡會使用的試劑比較複雜,暫且略過不提,有興趣的讀者可以自行查閱參考文獻[14][15]


定序與定位Sequencing and Mapping

分離出來的目標 DNA 可以結合定序工具,例如 Microarray、次世代定序,以確認這些目標 DNA 的結合序列Binding motifs和片段長,再利用生物資訊的技術將它們定位到參考基因體上,就可以得知它們在基因體上的位置。


圖4:ChIP -seq 的實驗流程

向原核生物借工具──DamID-seq

  

        儘管 ChIP-seq 的能力已經十分強大,但它還是有許多不足。首先是 ChIP-seq 資料的品質相當仰賴抗體的專一性和靈敏性,必須要有相對應的抗體才能進行研究,高品質的抗體可能難以研發,或者價格高昂;再者,ChIP-seq 會受到實驗當下細胞內表觀遺傳修飾的狀態影響,較少被表達的基因與組蛋白纏繞較緊密,使轉錄因子難以結合或使 DNA 更難被片段化;上述情況都會使其難以被偵測 [16][17]。針對這些不足,科學家又開發出了新的方法。

  
        DNA 甲基化在真核生物與原核生物體內都會發生,腺嘌呤Adenine與胞嘧啶Cytosine都會被甲基化,但是因為真核生物通常缺乏腺嘌呤甲基化酶,腺嘌呤只在原核生物體內才會被大量甲基化註三。在2000年,Bas van Steensel 和 Steven Henikoff 利用這個特徵開發出了 DNA 腺嘌呤甲基轉移酶分析DNA Adenine Methyltransferase Identification, DamID[18]。Dam 是大腸桿菌裡的 DNA 腺嘌呤甲基化酶DNA adenine methyltransferase,會使 GATC 這個特定序列中的腺嘌呤被甲基化。他們使用重組 DNA 技術將 Dam 與果蠅細胞內的 HP1Heterochromatin Protein 1連接在一起並表達為 Dam-HP1 融合蛋白質Dam-HP1 fusion protein,HP1 會與果蠅細胞內的特定的異染色質Heterochromatin區域結合,當 HP1 在果蠅細胞內與這些異染色質區域結合時,Dam 就可以將附近 GATC 序列裡的腺嘌呤甲基化,再透過對甲基敏感的限制酶DpnI restriction enzyme裁切出高度甲基化的區域。經過實驗與分析後,他們發現 Dam-HP1 fusion protein 的確使得特定的異染色質區域周圍的甲基化程度比作為對照的真染色質Euchromatin區域有顯著提升圖5,表示 Dam-HP1 fusion protein 的確可以辨認出特定的位點並加以甲基化。這個方法結合定序與定位技術DamID-seq後,就可以測得 Dam 甲基化的片段長度、序列以及它們在基因體上的位置[19]。DamID-seq 的發明使得人們又多了一種研究 in vivo 蛋白質與核酸交互作用的方法,並且再也不需要花心思準備抗體了。


圖5:Bas van Steensel 和 Steven Henikoff 比較果蠅染色體上異染色質 (前4)與真染色質(後5)的片段被 Dam-HP1 fusion protein 甲基化的情形。(空心長條為轉殖Dam-myc fusion protein 做為控制組時的甲基化程度,實心長條為轉殖 Dam-HP1 fusion protein 後的甲基化程度。)


        技術的發展從來都不會有至善至美的一天,DamID-seq 仍存在一些困境。首先,DamID 並沒有辦法避免細胞內表觀遺傳修飾狀態的影響;其次,此方式需要進行細胞轉染Transfection,這在某些物種上難以實現;再者,過程中需要合成 Dam-fusion protein,但有些蛋白質與 Dam 融合後就無法正常運作;另外,DamID 的序列解析度會受 GATC 這個特定序列在基因體上的分布影響註四;最後,這個分析方式通常需要數小時的反應時間,使得它不適合用於研究較短暫的蛋白質核酸交互作用 [20][21][22]。科學家們不斷著手研究新方法,企圖改善這些問題。


再回到試管中──DAP-seq


  在2016年,Ronan O’ Malley 與 Carol Huang 等人開發出了 DNA 親和純化分析法定序DNA Affinity Purification Sequencing, DAP-seq[23]。這個方法仍然可以保留生物體內特定的 DNA 甲基化修飾,但與 ChIP-seq 不同,這個方法不需要抗體,因此更容易執行。


  要怎麼取代抗體呢?他們利用重組 DNA,在小麥胚芽細胞wheat germ system內製作出帶有磁珠接頭的轉錄因子圖6,將這些特製的轉錄因子與磁珠連接後,就可以直接用轉錄因子捕捉目標 DNA,並進一步純化、分析。他們利用這個方法,配合定序定位工具,獨立找出了阿拉伯芥中 529 個轉錄因子的結合位樣式binding-site pattern,並且與已發表的資料比較透過 ChIP 或其他方法建構,發現兩者的相似度極高圖7,顯示這套新方法跟現存的其他方法一樣有效。


  DAP-seq 可以說是一種權衡,儘管沒辦法讓蛋白質與核酸的交互作用發生在生物體內,但這個方法盡可能的保留 DNA 上的甲基化樣式,並且成功省去固定、免疫沉澱這兩個流程,降低全基因體尋找的門檻,同時也解決了 DamID-seq 的缺點。


圖6:Ronan O’Malley 與 Carol Huang 等人利用重組 DNA,在小麥胚芽細胞(wheat germ system)內製作出帶有圓珠接頭的轉錄因子,用於捕捉目標 DNA。

圖7:Ronan O’Malley 與 Carol Huang 等人發現利用 DAP-seq 找出的結合位樣式與其他已發表的資料相似度極高(以 ABI5 的 binding motif 為例)。

百花齊放的研究技術,驅動現代生物學前進

  

        在這篇文章中,我們從 1960 年代開始,一路走到 2016 年,以ChIP-seq、DamID-seq、DAP-seq 為主角,回顧這五十餘年間研究蛋白質與核酸交互作用相關技術的發展歷程。除了這三項技術,在這段時間還有很多重要的技術陸陸續續被發展出來,例如在活細胞中建立實驗系統的酵母菌單雜交系統Yeast One-Hybrid System, Y1H、原生質體轉活化系統Protoplast Transactivation System, PTA;同時,基因定序技術的革新以及生物資訊技術的發展,也一同促成了現代生物學在基因分子層面的蓬勃發展。這些技術各擅勝場,彼此互補,幫助我們不斷發掘新知,探索生命現象的奧妙。


註釋

註一:改良後的SPR目前已經可以同時量測384組實時資料,並且應用於抗體的篩選。[24]

註二:磁珠外裹著一種免疫吸附劑immunosorbantSalmon sperm DNA-protein A,使抗體接在磁珠表面。

註三:少數的真核生物體內發現有微量甲基化的腺嘌呤。

註四:已有人使用另一種不需特定片段的腺嘌呤甲基化酶EcoGII取代Dam,做出原理類似的MadIDMethyl adenine identification)。[25]


參考文獻


[1]    Nirenberg, M., & Leder, P. (1964). RNA Codewords and Protein Synthesis: The Effect of Trinucleotides upon the Binding of sRNA to Ribosomes. Science145(3639), 1399-1407.

[2]    Yarus, M., & Berg, P. (1967). Recognition of tRNA by aminoacyl tRNA synthetases. Journal of molecular biology28(3), 479-490.

[3]    Riggs, A. D., Bourgeois, S., Newby, R. F., & Cohn, M. (1968). DNA binding of the lac repressor. Journal of molecular biology34(2), 365-368.

[4]    Ferraz, R. A. C., Lopes, A. L. G., da Silva, J. A. F., Moreira, D. F. V., Ferreira, M. J. N., & de Almeida Coimbra, S. V. (2021). DNA–protein interaction studies: a historical and comparative analysisPlant Methods17(1), 1-21.

[5]    Fried, M., & Crothers, D. M. (1981). Equilibria and kinetics of lac repressor-operator interactions by polyacrylamide gel electrophoresis. Nucleic acids research9(23), 6505-6525.

[6]    Garner, M. M., & Revzin, A. (1981). A gel electrophoresis method for quantifying the binding of proteins to specific DNA regions: application to components of the Escherichia coli lactose operon regulatory system. Nucleic acids research9(13), 3047-3060.

[7]    Bondeson, K., Frostellkarlsson, A., Fagerstam, L., & Magnusson, G. (1993). Lactose repressor-operator DNA interactions: kinetic analysis by a surface plasmon resonance biosensor. Analytical biochemistry214(1), 245-251.

[8]    Jay, E., Bambara, R., Padmanabhan, R., & Wu, R. (1974). DNA sequence analysis: a general, simple and rapid method for sequencing large oligodeoxyribonucleotide fragments by mapping. Nucleic Acids Research1(3), 331-354.

[9]    Padmanabhan, R., Padmanabhan, Raji, & Wu, R. (1972). Nucleotide sequence analysis of DNA: IX. Use of oligonucleotides of defined sequence as primers in DNA sequence analysis. Biochemical and biophysical research communications48(5), 1295-1302.

[10]    Sanger, F., Air, G. M., Barrell, B. G., Brown, N. L., Coulson, A. R., Fiddes, J. C., ... & Smith, M. (1977). Nucleotide sequence of bacteriophage φX174 DNA. nature265(5596), 687-695.

[11]    Sanger, F., Nicklen, S., & Coulson, A. R. (1977). DNA sequencing with chain-terminating inhibitors. Proceedings of the national academy of sciences74(12), 5463-5467.

[12]    Maxam, A. M., & Gilbert, W. (1977). A new method for sequencing DNA. Proceedings of the National Academy of Sciences74(2), 560-564.

[13]    Gilmour, D. S., & Lis, J. T. (1985). In vivo interactions of RNA polymerase II with genes of Drosophila melanogaster. Molecular and cellular biology5(8), 2009-2018.

[14]    Das, P. M., Ramachandran, K., VanWert, J., & Singal, R. (2004). Chromatin immunoprecipitation assay. Biotechniques37(6), 961-969.

[15]    Nelson, J. D., Denisenko, O., & Bomsztyk, K. (2006). Protocol for the fast chromatin immunoprecipitation (ChIP) method. Nature protocols1(1), 179-185.

[16]    Park, P. J. (2009). ChIP–seq: advantages and challenges of a maturing technologyNature reviews genetics10(10), 669-680.

[17]    Kidder, B. L., Hu, G., & Zhao, K. (2011). ChIP-Seq: technical considerations for obtaining high-quality data. Nature immunology12(10), 918-922.

[18]    Steensel, B. V., & Henikoff, S. (2000). Identification of in vivo DNA targets of chromatin proteins using tethered dam methyltransferase. Nature biotechnology18(4), 424-428.

[19]    Wu, F., Olson, B. G., & Yao, J. (2016). DamID-seq: genome-wide mapping of protein-DNA interactions by high throughput sequencing of adenine-methylated DNA fragments. JoVE (Journal of Visualized Experiments), (107), e53620.

[20]    Aughey, G. N., & Southall, T. D. (2016). Dam it's good! DamID profiling of protein‐DNA interactions. Wiley Interdisciplinary Reviews: Developmental Biology5(1), 25-37.

[21]    Aughey, G. N., Cheetham, S. W., & Southall, T. D. (2019). DamID as a versatile tool for understanding gene regulation. Development146(6), dev173666.

[22]    Helwa, R., & Hoheisel, J. D. (2010). Analysis of DNA–protein interactions: from nitrocellulose filter binding assays to microarray studiesAnalytical and bioanalytical chemistry398(6), 2551-2561.

[23]    O’Malley, R. C., Huang, S. S. C., Song, L., Lewsey, M. G., Bartlett, A., Nery, J. R., ... & Ecker, J. R. (2016). Cistrome and epicistrome features shape the regulatory DNA landscape. Cell, 165(5), 1280-1292. Padmanabhan, R., Padmanabhan, Raji, & Wu, R. (19

[24]    Abdiche, Y.N. (2019, March 19). Accelerating biotherapeutic discovery with high throughput SPR. BioTechniques.

[25]    Sobecki, M., Souaid, C., Boulay, J., Guerineau, V., Noordermeer, D., & Crabbe, L. (2018). MadID, a versatile approach to map protein-DNA interactions, highlights telomere-nuclear envelope contact sites in human cells. Cell reports25(10), 2891-2903.


張貼留言

Post a Comment (0)

較新的 較舊