撰文:林秩緯
前言
了解蛋白質與 DNA、RNA 的互動關係以及蛋白質對基因表達的影響一直是生物學的重要議題。隨著時間推展,相關的實驗技術已經突飛猛進,科學家們陸續開發了不同的工具,這些工具成為研究的利器,快速驅動著現代生物學的發展。在這篇文章中,我們將回顧研究蛋白質與核酸互動關係的實驗技術發展,並且了解 ChIP-seq、DamID-seq、DAP-seq 三種技術背後的原理,以及它們各自帶來的重大革新。
基因體時代以前:Filter Binding Assay
在 Francis Crick 提出中心法則後,在 1960 年代,基因表達的重要機制陸陸續續被科學家解開,這些機制牽涉到很多蛋白質與核酸的交互作用,為了釐清這些交互作用,科學家研發了相對應的技術,其中最廣泛運用的技術就是過濾式結合反應分析(Filter Binding Assay,或稱濾紙結合分析法),這個技術的原理非常直觀:用於實驗的核酸都經過放射性同位素標定,將核酸與蛋白質充分混合反應後,利用抽濾篩選不同大小的分子,較大的蛋白質會留在濾紙上,未結合的核酸則會通過濾紙,若蛋白質成功與目標核酸片段形成核酸-蛋白質複合體,則濾紙上便可以測得同位素的訊號(圖1)。
這項技術促成了許多重要的發現,例如密碼子與胺基酸的對應關係 [1]、tRNA 與 Aminoacyl tRNA synthetases 的結合 [2]、乳糖操縱組的發現 [3] 等等。這項技術的優點是便宜、快速、簡單,但同時也有不少缺點,例如:結合力不強的複合體沒辦法抵抗抽濾的負壓、與濾紙親和力低的蛋白質無法被濾紙留住、無法分析複合體的組成(一個複合體可能有多種蛋白質參與)等等 [4]。為了改善這些缺點,後續又有研究者開發出凝膠電泳遷移分析(Electrophoretic Mobility Shift Assay, EMSA)[5][6]、表面電漿子共振(Surface Plasmon Resonance, SPR)[7] 等等技術,這些技術提高了分析的靈敏度,也提供了分子量的資訊,使得人們可以分析複合體的組成,甚至可以提供 real-time data,但在單一實驗中這些技術能檢測的蛋白質與核酸序列依舊十分有限(註一)。
基因體時代的來臨
時間來到 1970 年代,在這個時期核酸定序的技術開始蓬勃發展,吳瑞與 Radhakrishnan Padmanabhan 等人率先以合成法測定核酸序列 [8][9],經過 Frederick Sanger 等人的改良,廣為人知的 Sanger 定序法在 1977 年問世,Sanger 等人也利用這項技術測定了嗜菌體 φX174 的基因體,完成史上第一個基因體的定序 [10][11]。在同時期也有人以分解法測定核酸序列 [12]。定序技術的蓬勃發展,使得人們得以從基因體的尺度處理生物問題,從此揭開基因體時代的序幕。
開啟全基因體搜尋的先河──ChIP-seq
隨著基因體時代的到來,科學家開始試圖了解蛋白質與核酸在基因體上交互作用的位置,並且持續提出新的實驗方法,希望能夠更加接近這些分子在生物體內(in vivo)真實的反應狀態。
在 EMSA 技術發表的四年後(1985),David Gilmour 和 John Lis 發明了染色質免疫沉澱法(Chromatin Immunoprecipitation, ChIP)[12],並且成功利用這個方法呈現出熱逆境處理前後,果蠅細胞中RNA聚合酶II(RNA polymerase II)與熱休克蛋白(Heat shock protein)基因結合情形的顯著差異(圖2)。同時他們也比較了熱休克蛋白基因和其他基因在熱逆境處理前後與 RNA polymerase II 結合情形的差異(圖3)。在這份研究中,所有 RNA polymerase II 與DNA的結合都是在果蠅細胞中發生,也首開在全基因體上尋找蛋白質與核酸交互作用的先例。
隨著許多生物的基因體陸續被解出,科學家結合 ChIP、定序技術以及基因體資料,建立出 ChIP-seq,這套方法不僅能找出特定轉錄因子的目標結合序列,還可以找出它們在基因體上的位置。這麼一個劃時代的技術是如何運作的呢?ChIP-seq 的實驗流程大致可以分為五個階段:固定、萃取、免疫沉澱、分離目標 DNA、定序與定位,多方參考後 [4][14][15][16],以下將簡介這五個階段個別的功能(圖4)。
固定(Fixation):
這個階段的目的是把蛋白質與 DNA 連接(cross-linking)在一起,方便後續能用抗體進行免疫沉澱分析。使蛋白質與 DNA 連接的方法有很多,大致可以分為化學方法與物理方法兩類。化學方法就是加入特定的化學物質,使得蛋白質與 DNA 之間產生鍵結,常用的試劑包括:甲醛(Formaldehyde)、亞甲基藍(Methylene blue)、吖啶橙(Acridine orange)等等;物理方法則是透過紫外線(366 nm)或者是雷射光照射,使得蛋白質與DNA之間產生鍵結。
萃取(Extraction):
完成固定後,下一步就要把染色質從細胞中萃取出來。為了分離出細胞核,首先會在細胞培養盤中加入含有蛋白酶抑制劑的緩衝液,再利用離心的方式使細胞裂解並且使細胞核沉降。獲得細胞核之後,根據實驗的需求,會使用不同方法將染色質碎成小片段(fragmentation),常見的方法如:超音波震盪(sonication)、限制酶剪切(restriction digestion)等等。
免疫沉澱(Immunoprecipitation):
這是 ChIP 最關鍵的階段,被切碎的染色質會和根據研究需求設計的抗體混和。有些抗體能辨認特定的轉錄因子,用來觀察轉錄因子與基因的互動;有些則能辨認組蛋白上特定的抗原表位(Epitope),用來觀察表觀遺傳修飾。這些抗體會連接在磁珠上(註二),透過離心沉降並且反覆沖洗磁珠,便可以把成功被抗體辨認的染色質片段沉澱出來。
分離目標DNA (DNA Isolation):
因為在第一個階段中,蛋白質與 DNA 被連接在一起,這個階段的主要目標就是要破壞這個連結(reverse the cross-links)並萃取 DNA。這裡會使用的試劑比較複雜,暫且略過不提,有興趣的讀者可以自行查閱參考文獻[14][15]。
定序與定位(Sequencing and Mapping):
分離出來的目標 DNA 可以結合定序工具,例如 Microarray、次世代定序,以確認這些目標 DNA 的結合序列(Binding motifs)和片段長,再利用生物資訊的技術將它們定位到參考基因體上,就可以得知它們在基因體上的位置。
向原核生物借工具──DamID-seq
儘管 ChIP-seq 的能力已經十分強大,但它還是有許多不足。首先是 ChIP-seq 資料的品質相當仰賴抗體的專一性和靈敏性,必須要有相對應的抗體才能進行研究,高品質的抗體可能難以研發,或者價格高昂;再者,ChIP-seq 會受到實驗當下細胞內表觀遺傳修飾的狀態影響,較少被表達的基因與組蛋白纏繞較緊密,使轉錄因子難以結合或使 DNA 更難被片段化;上述情況都會使其難以被偵測 [16][17]。針對這些不足,科學家又開發出了新的方法。
DNA 甲基化在真核生物與原核生物體內都會發生,腺嘌呤(Adenine)與胞嘧啶(Cytosine)都會被甲基化,但是因為真核生物通常缺乏腺嘌呤甲基化酶,腺嘌呤只在原核生物體內才會被大量甲基化(註三)。在2000年,Bas van Steensel 和 Steven Henikoff 利用這個特徵開發出了 DNA 腺嘌呤甲基轉移酶分析(DNA Adenine Methyltransferase Identification, DamID)[18]。Dam 是大腸桿菌裡的 DNA 腺嘌呤甲基化酶(DNA adenine methyltransferase),會使 GATC 這個特定序列中的腺嘌呤被甲基化。他們使用重組 DNA 技術將 Dam 與果蠅細胞內的 HP1(Heterochromatin Protein 1)連接在一起並表達為 Dam-HP1 融合蛋白質(Dam-HP1 fusion protein),HP1 會與果蠅細胞內的特定的異染色質(Heterochromatin)區域結合,當 HP1 在果蠅細胞內與這些異染色質區域結合時,Dam 就可以將附近 GATC 序列裡的腺嘌呤甲基化,再透過對甲基敏感的限制酶(DpnI restriction enzyme)裁切出高度甲基化的區域。經過實驗與分析後,他們發現 Dam-HP1 fusion protein 的確使得特定的異染色質區域周圍的甲基化程度比作為對照的真染色質(Euchromatin)區域有顯著提升(圖5),表示 Dam-HP1 fusion protein 的確可以辨認出特定的位點並加以甲基化。這個方法結合定序與定位技術(DamID-seq)後,就可以測得 Dam 甲基化的片段長度、序列以及它們在基因體上的位置[19]。DamID-seq 的發明使得人們又多了一種研究 in vivo 蛋白質與核酸交互作用的方法,並且再也不需要花心思準備抗體了。
技術的發展從來都不會有至善至美的一天,DamID-seq 仍存在一些困境。首先,DamID 並沒有辦法避免細胞內表觀遺傳修飾狀態的影響;其次,此方式需要進行細胞轉染(Transfection),這在某些物種上難以實現;再者,過程中需要合成 Dam-fusion protein,但有些蛋白質與 Dam 融合後就無法正常運作;另外,DamID 的序列解析度會受 GATC 這個特定序列在基因體上的分布影響(註四);最後,這個分析方式通常需要數小時的反應時間,使得它不適合用於研究較短暫的蛋白質核酸交互作用 [20][21][22]。科學家們不斷著手研究新方法,企圖改善這些問題。
再回到試管中──DAP-seq
在2016年,Ronan O’ Malley 與 Carol Huang 等人開發出了 DNA 親和純化分析法定序(DNA Affinity Purification Sequencing, DAP-seq)[23]。這個方法仍然可以保留生物體內特定的 DNA 甲基化修飾,但與 ChIP-seq 不同,這個方法不需要抗體,因此更容易執行。
要怎麼取代抗體呢?他們利用重組 DNA,在小麥胚芽細胞(wheat germ system)內製作出帶有磁珠接頭的轉錄因子(圖6),將這些特製的轉錄因子與磁珠連接後,就可以直接用轉錄因子捕捉目標 DNA,並進一步純化、分析。他們利用這個方法,配合定序定位工具,獨立找出了阿拉伯芥中 529 個轉錄因子的結合位樣式(binding-site pattern),並且與已發表的資料比較(透過 ChIP 或其他方法建構),發現兩者的相似度極高(圖7),顯示這套新方法跟現存的其他方法一樣有效。
DAP-seq 可以說是一種權衡,儘管沒辦法讓蛋白質與核酸的交互作用發生在生物體內,但這個方法盡可能的保留 DNA 上的甲基化樣式,並且成功省去固定、免疫沉澱這兩個流程,降低全基因體尋找的門檻,同時也解決了 DamID-seq 的缺點。
百花齊放的研究技術,驅動現代生物學前進
在這篇文章中,我們從 1960 年代開始,一路走到 2016 年,以ChIP-seq、DamID-seq、DAP-seq 為主角,回顧這五十餘年間研究蛋白質與核酸交互作用相關技術的發展歷程。除了這三項技術,在這段時間還有很多重要的技術陸陸續續被發展出來,例如在活細胞中建立實驗系統的酵母菌單雜交系統(Yeast One-Hybrid System, Y1H)、原生質體轉活化系統(Protoplast Transactivation System, PTA);同時,基因定序技術的革新以及生物資訊技術的發展,也一同促成了現代生物學在基因分子層面的蓬勃發展。這些技術各擅勝場,彼此互補,幫助我們不斷發掘新知,探索生命現象的奧妙。
註釋
註一:改良後的SPR目前已經可以同時量測384組實時資料,並且應用於抗體的篩選。[24]
註二:磁珠外裹著一種免疫吸附劑(immunosorbant)Salmon sperm DNA-protein A,使抗體接在磁珠表面。
註三:少數的真核生物體內發現有微量甲基化的腺嘌呤。
註四:已有人使用另一種不需特定片段的腺嘌呤甲基化酶(EcoGII)取代Dam,做出原理類似的MadID(Methyl adenine identification)。[25]
參考文獻
[1] Nirenberg, M., & Leder, P. (1964). RNA Codewords and Protein Synthesis: The Effect of Trinucleotides upon the Binding of sRNA to Ribosomes. Science, 145(3639), 1399-1407.
[2] Yarus, M., & Berg, P. (1967). Recognition of tRNA by aminoacyl tRNA synthetases. Journal of molecular biology, 28(3), 479-490.
[3] Riggs, A. D., Bourgeois, S., Newby, R. F., & Cohn, M. (1968). DNA binding of the lac repressor. Journal of molecular biology, 34(2), 365-368.
[4] Ferraz, R. A. C., Lopes, A. L. G., da Silva, J. A. F., Moreira, D. F. V., Ferreira, M. J. N., & de Almeida Coimbra, S. V. (2021). DNA–protein interaction studies: a historical and comparative analysis. Plant Methods, 17(1), 1-21.
[5] Fried, M., & Crothers, D. M. (1981). Equilibria and kinetics of lac repressor-operator interactions by polyacrylamide gel electrophoresis. Nucleic acids research, 9(23), 6505-6525.
[6] Garner, M. M., & Revzin, A. (1981). A gel electrophoresis method for quantifying the binding of proteins to specific DNA regions: application to components of the Escherichia coli lactose operon regulatory system. Nucleic acids research, 9(13), 3047-3060.
[7] Bondeson, K., Frostellkarlsson, A., Fagerstam, L., & Magnusson, G. (1993). Lactose repressor-operator DNA interactions: kinetic analysis by a surface plasmon resonance biosensor. Analytical biochemistry, 214(1), 245-251.
[8] Jay, E., Bambara, R., Padmanabhan, R., & Wu, R. (1974). DNA sequence analysis: a general, simple and rapid method for sequencing large oligodeoxyribonucleotide fragments by mapping. Nucleic Acids Research, 1(3), 331-354.
[9] Padmanabhan, R., Padmanabhan, Raji, & Wu, R. (1972). Nucleotide sequence analysis of DNA: IX. Use of oligonucleotides of defined sequence as primers in DNA sequence analysis. Biochemical and biophysical research communications, 48(5), 1295-1302.
[10] Sanger, F., Air, G. M., Barrell, B. G., Brown, N. L., Coulson, A. R., Fiddes, J. C., ... & Smith, M. (1977). Nucleotide sequence of bacteriophage φX174 DNA. nature, 265(5596), 687-695.
[11] Sanger, F., Nicklen, S., & Coulson, A. R. (1977). DNA sequencing with chain-terminating inhibitors. Proceedings of the national academy of sciences, 74(12), 5463-5467.
[12] Maxam, A. M., & Gilbert, W. (1977). A new method for sequencing DNA. Proceedings of the National Academy of Sciences, 74(2), 560-564.
[13] Gilmour, D. S., & Lis, J. T. (1985). In vivo interactions of RNA polymerase II with genes of Drosophila melanogaster. Molecular and cellular biology, 5(8), 2009-2018.
[14] Das, P. M., Ramachandran, K., VanWert, J., & Singal, R. (2004). Chromatin immunoprecipitation assay. Biotechniques, 37(6), 961-969.
[15] Nelson, J. D., Denisenko, O., & Bomsztyk, K. (2006). Protocol for the fast chromatin immunoprecipitation (ChIP) method. Nature protocols, 1(1), 179-185.
[16] Park, P. J. (2009). ChIP–seq: advantages and challenges of a maturing technology. Nature reviews genetics, 10(10), 669-680.
[17] Kidder, B. L., Hu, G., & Zhao, K. (2011). ChIP-Seq: technical considerations for obtaining high-quality data. Nature immunology, 12(10), 918-922.
[18] Steensel, B. V., & Henikoff, S. (2000). Identification of in vivo DNA targets of chromatin proteins using tethered dam methyltransferase. Nature biotechnology, 18(4), 424-428.
[19] Wu, F., Olson, B. G., & Yao, J. (2016). DamID-seq: genome-wide mapping of protein-DNA interactions by high throughput sequencing of adenine-methylated DNA fragments. JoVE (Journal of Visualized Experiments), (107), e53620.
[20] Aughey, G. N., & Southall, T. D. (2016). Dam it's good! DamID profiling of protein‐DNA interactions. Wiley Interdisciplinary Reviews: Developmental Biology, 5(1), 25-37.
[21] Aughey, G. N., Cheetham, S. W., & Southall, T. D. (2019). DamID as a versatile tool for understanding gene regulation. Development, 146(6), dev173666.
[22] Helwa, R., & Hoheisel, J. D. (2010). Analysis of DNA–protein interactions: from nitrocellulose filter binding assays to microarray studies. Analytical and bioanalytical chemistry, 398(6), 2551-2561.
[23] O’Malley, R. C., Huang, S. S. C., Song, L., Lewsey, M. G., Bartlett, A., Nery, J. R., ... & Ecker, J. R. (2016). Cistrome and epicistrome features shape the regulatory DNA landscape. Cell, 165(5), 1280-1292. Padmanabhan, R., Padmanabhan, Raji, & Wu, R. (19
[24] Abdiche, Y.N. (2019, March 19). Accelerating biotherapeutic discovery with high throughput SPR. BioTechniques.
[25] Sobecki, M., Souaid, C., Boulay, J., Guerineau, V., Noordermeer, D., & Crabbe, L. (2018). MadID, a versatile approach to map protein-DNA interactions, highlights telomere-nuclear envelope contact sites in human cells. Cell reports, 25(10), 2891-2903.
張貼留言