高通量測序技術技術的應用及前景
高通量測序技術是對傳統測序一次的改變, 一次對幾十萬到幾百萬條DNA分子進行序列測定, 因此在有些文獻中稱其為下一代測序技術(next generation sequencing)足見其劃時代的改變, 同時高通量測序使得對一個物種的轉錄組和基因組進行細致全貌的分析成為可能, 所以又被稱為深度測序(deep sequencing). 高通量測序平臺的代表是羅氏公司(Roche)的454測序儀(Roch GS FLX sequencer), Illumina公司的Solexa基因組分析儀(Illumina Genome Analyzer)和ABI的SOLiD測序儀(ABI SOLiD se-quencer). 2008年4月Helico BioScience公司的Timothy等人在Science上報道了他們開發的真正的單分子測序技術, 并利用該技術對一個M13病毒基因組進行重測序. 這項技術之所以被稱為真正的單分子測序, 是因為它跨過了上述3種高通量測序依賴的基于PCR擴增的信號放大過程, 真正達到了讀取單個熒光分子的能力, 向1000美元測定一個人類基因組的目標邁出了一大步.
這些平臺共同的特點是的測序通量, 相對于傳統測序的96道毛細管測序, 高通量測序一次實驗可以讀取40萬到400萬條序列. 讀取長度根據平臺不同從25堿基到450堿基, 不同的測序平臺在一次實驗中, 可以讀取1G到14G不等的堿基數, 這樣龐大的測序能力是傳統測序儀所不能比擬的.
高通量測序的應用
高通量測序可以幫助研究者跨過文庫構建這一實驗步驟, 避免了亞克隆過程中引入的偏差. 依靠后期強大的生物信息學分析能力, 對照一個參比基因組(reference genome)高通量測序技術可以非常輕松完成基因組重測序(re-sequence), 2007年van Or-souw等人[56]結合改進的AFLP技術和454測序技術對玉米基因組進行了重測序, 該重測序實驗發現的超過75%的SNP位點能夠用 SNPWave 技術驗證, 提供了一條對復雜基因組特別是含有高度重復序列的植物基因組進行多態性分析的技術路線. 2008年Hillier對線蟲CB4858品系進行Solexa重測序, 尋找線蟲基因組中的SNP位點和單位點的缺失或擴增. 但是也應該看到, 由于高通量測序讀取長度的限制, 使其在對未知基因組進行從頭測序(de novo sequencing)的應用受到限制, 這部分工作仍然需要傳統測序(讀取長度達到850堿基)的協助. 但是這并不影響高通量測序技術在全基因組mRNA表達譜, microRNA表達譜, ChIP-chip以及DNA甲基化等方面的應用.
2008年Mortazavi等人對小鼠的大腦、肝臟和骨骼肌進行了RNA深度測序, 這項工作展示了深度測序在轉錄組研究上的兩大進展, 表達計數和序列分析. 對測得的每條序列進行計數獲得每個特定轉錄本的表達量, 是一種數碼化的表達譜檢測, 能檢測到豐度非常低的轉錄本. 分析測得的序列, 有大于90%的數據顯示落在已知的外顯子中, 而那些在已知序列之外的信息通過數據分析展示的是從未被報道過的RNA剪切形式, 3′末端非翻譯區, 變動的啟動子區域以及潛在的小RNA前體, 發現至少有3500個基因擁有不止一種剪切形式. 而這些信息無論使用芯片技術還是SAGE文庫測序都是無法被發現的. 同年Sugarbaker利用mRNA深度測序對惡性胸膜瘤和對照樣品進行比較, 發現了腫瘤中存在的15個不同的點突變.
高通量測序另一個被廣泛應用的領域是小分子RNA或非編碼RNA(ncRNA)研究. 測序方法能輕易的解決芯片技術在檢測小分子時遇到的技術難題(短序列, 高度同源), 而且小分子RNA的短序列正好配合了高通量測序的長度, 使得數據“不浪費”, 同時測序方法還能在實驗中發現新的小分子RNA. 在衣藻、斑馬魚、果蠅、線蟲、人和黑猩猩中都已經成功地找到了新的小分子RNA. 在線蟲中獲得了40萬個序列, 通過分析發現了18個新的小RNA分子和一類的小分子RNA, 通過對人胚胎干細胞發育前后的分析, 獲得了334個小RNA的表達譜帶, 包括新發現的104個小RNA.
在DNA-蛋白質相互作用的研究上, 染色質免疫沉淀-深度測序(ChIP-seq)實驗也展示了其非常大的潛力. 染色質免疫沉淀以后的DNA直接進行測序, 對比ref seq可以直接獲得蛋白與DNA結合的位點信息, 相比ChIP-chip, ChIP-seq可以檢測更小的結合區段、未知的結合位點、結合位點內的突變情況和蛋白親合力較低的區段. 2007年Johnson等人用ChIP-seq 對轉錄因子NRSF在DNA上的結合位點進行了全基因組的篩查, 獲得了1946個結合位點, 小能分辨的結合位點為50個堿基, 這些高質量的ChIP-seq結果提供了研究新的DNA-蛋白相互作用的內容, 其中包括了胰島發育調控網絡中的重要轉錄因子. 同年Robertson等人用同樣的方法檢測轉錄因子和基因組DNA的結合情況. 這兩項研究同時驗證了以往用ChIP-chip實驗檢測到的結合位點, 同時發現新的結合位點, Robertson等人發現, ChIP-seq的分辨率可達40堿基. 2008年Chen等人在Cell上發表論文, 用ChIP-seq檢測了Nanog, Oct4, STAT3, Smad1, Sox2等13個序列特異性的轉錄因子與基因組DNA的結合情況, 這些轉錄因子都是LIF和BMP途徑的重要調控分子. 這些轉錄因子在ES細胞里結合位點為我們揭示了ES細胞內決定ES細胞發育方向的調控網絡.
5基因芯片和高通量測序技術的應用前景
高通量測序技術雖然建立的時間不長, 但是在基因組的各個研究領域都顯示出其非凡的魅力, 而且日益顯示出其對基因芯片“取而代之”的咄咄態勢. 那么, 基因芯片向何處去呢?
基因芯片技術經過近15年的發展已經形成了一個系統的平臺, 從樣品制備、芯片制作、芯片雜交、數據掃描到后期的數據管理, 儲存以及深度數據挖掘都有了標準化的流程、堅實的理論和實驗的支持, 成為一個非常穩定可信的實驗技術, 為廣大的研究者所運用, 同時也積累了龐大的公共數據庫. 深度測序要建立這樣的一個體系同樣需要若干年的完善. 芯片雜交結果直觀, 分析快速, 適合對生物學樣品進行已知信息的檢測, 同時芯片數據分析有成熟完整的理論, 為后期數據分析提供強大的支持.
基因芯片的缺點, 就在于它是一個“封閉系統”, 它只能檢測人們已知序列的特征(或有限的變異). 而深度測序的強項, 就在于它是一個“開放系統”, 它的發現能力和尋找新的信息的能力, 從本質上高于芯片技術. 研究者可以充分享受這兩個平臺的比較優勢,在獲取新信息的基礎上, 利用芯片的強項, 即對已知信息的高通量、低成本(相對)的檢測能力, 對樣品進行快速檢測, 短時間內獲得有有效的數據.
作為兩個高通量的基因組學研究技術, 在應用的某些方面存在重疊和競爭, 但是在更多方面是優勢互補, 兩種方法聯合使用, 將解決以前的單種技術難以解決的問題. 如Euskirchen等人同時用ChIP- chip和ChIP-seq對STAT1的結合位點進行了檢測, 結果非常有趣, 兩種技術對于強陽性的區段具有非常好的相關性, 而對于一些弱的結合位點, ChIP-chip和ChIP-seq都會丟失部分信息, 而一種方法丟失的信息又恰好能被另一種方法所檢出, 完整的數據是來自兩部分的整合. 同樣的情況也發生在mRNA表達譜檢測上, 一種技術能彌補另一種技術遺漏的部分. 因此對一個生物學問題的回答需要不同實驗技術的協同配合. 例如目前新興的Target sequencing 或者叫做序列捕獲, Sequence Capture, 技術, 就是結合了芯片和深度測序, 利用芯片探針捕獲待測片段, 再用深度測序技術分析核酸序列, 利用高密度芯片和454測序儀曾成功的捕獲了6726個500堿基長度的外顯子和200 kb到5 Mb的DNA區段, 測序結果顯示大多數的捕獲DNA是符合設計要求的目的片段, 該實驗驗證了序列捕獲的特異性和可行性, 芯片的序列捕獲技術將來有可能在對基因組區段測序的研究中取代多重PCR過程. 芯片這種高通量技術顯示出其在樣品選擇和富集方面的優勢和潛力.
隨著科學技術的, 能不斷地給一項技術帶來新的增長點, 基因芯片和深度測序是點雜交技術和測序的高通量革命, 兩大分子生物學經典實驗技術都發展到了高通量的時代, 正如他們以前對生命科學研究所做出的貢獻一樣, 今后這兩大技術必將繼續協同配合推動生命科學研究進入新的紀元.