的測序儀—包括ABI的Ion Torrent PGM和Illumina的Miseq—使得普通的實驗室也有能力進行下一代測序。而Pacific Biosciences因為解讀了肆虐海地的病原體Vibrio cholerae的基因組而備受矚目。[1]同時,在臨床上人類基因組以近乎枯燥的規律而被闡明。正如Erika Check Hayden在《Nature》雜志上所報告,人類基因組測序中心的Richard Gibbs估計“在今年(2011年)有5,000人的基因組完成測序,明年預計為30,000人。”
“今年,基因組測序從名人測序轉向了臨床研究,”專攻基因組學的英國博士后Daniel MacArthur說道。去年,搖滾歌手Ozzy Osbourne對他的基因組進行了測序。今年(2011年),Gibbs和同事們報告稱,由一對14歲的患有多巴反應性肌張力障礙的異卵雙胞胎全基因組測序結果鑒定出了這種疾病的分子病因, 從而改進了治療策略。[3]一位患有無從解釋的腸道疾病的小孩讓報道其感人故事的《密爾瓦基新聞衛報》(Milwaukee Journal Sentinel)獲得了普利策獎。這名小孩患有的醫學罕見的遺傳畸變,該疾病后通過外顯子測序得到了解答,這是一場花費了75,000美元。在Walter Isaacson撰寫的蘋果創始人Steve Jobs傳記中,我們知道Jobs在自己被診斷患有胰腺癌后,他對自己的癌癥基因組進行了“部分測序”,試圖找出一種進行“靶向治療”的方法。[5]
通量提高,成本降低
Isaacson 寫道,Jobs的測序花費了大約100,000美金。自那之后,測序價格陡降了兩個數量級。在(2011年)二月份,Kevin Davies在《Bio-IT World》報道中稱全基因組測序服務商Complete Genomics Inc.(以下簡稱CGI)的測序價格為每人9,500美元,8個基因組起測。[6]據CGI的CEO Clifford Reid稱,該公司現在的報價是每個基因組4,000美元,一個月可完成750個基因組,到2012年初可實現每月1,000個。
以一個月完成750多個基因組的速度計算,CGI一年可以完成大約10,000個人類基因組測序。不過,Reid說得益于更多攝像機和DNA芯片的更利用,CGI將要配備的一種新儀器將使公司的產能提高到每年100,000個基因組。而超越性的下一代升級—有了更好的光學技術及更高密度的樣品空間的支持—將使上面說的數字提高到另一個數量級,到2015年實現每年測出1百萬個基因組,Reid說道。
更長的序列讀長可以做到線性拼接
同時,CGI公司正在開發一種新的技術LFR(long-fragment reads 長片段序列),通過此技術可以使公司依靠生物信息學工具將測得的序列通過拼接,達到100,000個堿基長度的片段。Reid說,以此長度序列,公司可以解決遺傳學上的“潛藏問題”,即將不同的DNA鏈進行區分。
當然,人類是雙倍體,攜帶了兩套染色體。目前的問題是,如果一個個體在一個基因上出現兩個突變,那這兩個突變是位于其中一個染色體拷貝上,還是兩個拷貝上各有一個錯誤? “醫生當然必須知道這些信息以便做出正確的診斷,”Reid說。他解釋說,現有的技術無法做到,因為這些技術使基因組發生了重新裝配,使得無法將一個特定的突變定位到某個特定染色體。在這類系統中,“相位”(phase)信息—就是說基因組片段之間物理上互相連接的位置信息—丟失了。
CGI使用的是基于化學連接技術的短序列測序技術,每次大約測70個堿基。不過通過將片段標上標簽,依片段的不同分子來源而進行標記,LFR技術則可以規避該問題。Reid補充說,LFR的另一個好處是能將公司的測序精度從10-5提高到10-7,或者說從每個二倍體基因組上60,000個錯誤降低到600個。
據公司的一位發言人透露,CGI在2011年底進行LFR服務試點,正式啟動定于2012年。“我預計,這會是一筆大生意,”CGI科學顧問委員會成員、哈佛醫學院遺傳學家George Church如是說。
個人化NGS系統
Illumina公司
在NGS領域,其他一些新技術的發展,使一些不是從事人類全基因組研究的人員獲益匪淺。例如,Illumina推出的MiSeq,這是一種新的測序設備,可在不必要使用該公司的HiSeq測序儀的時候使用。
“很多的應用只需要測到數百萬或者數十億個堿基,”Illumina公司的信息產品市場副總監Jordan Stockton說,例如那些對細菌基因組的測序,或特定人類等位基因的靶向重測。
MiSeq采用了與HiSeq相同的邊合成邊測序的方法,這就意味著研究人員可以在MiSeq與HiSeq之間實現無縫切換,而無需再去學習的操作手冊。售價125,000美元的MiSeq平臺可在一次運行中產生小于2G的數據量,雙端讀長可以達到150bp,the Broad Institute顯示MiSeq單端測序可以達到300bp,MacArthur說,這也就是說雙端測序就可能達到500bp,因為中間會包含一些重疊區,“這讓人印象非常深刻,”(HiSeq目前大能實現125bp的雙端讀長,主要是因為兩種設備在循環次數上存在差異。)
據Stockton的說法,Illumina近還宣稱開發了三種新的用于NGS的工具。一種是TrueSeq Amplicon Kit,可同時針對96個樣品實現每個樣品384個目標的測序。第二種是簡化的文庫制備試劑盒,可以將“一天或兩天”的操作簡化至90分鐘。后一種是BaseSpace,該公司推出的云端生物信息學系統。
Stockton說,BaseSpace由5個工作流組成:細菌全基因組測序、靶向測序、宏基因組學、小RNA表達譜以及文庫質量控制(為那些想在測序前進行文庫質量驗證的人)。不過“這種云技術的真正美妙之處就是,它非常易于為使用者增加新的功能”,他說道。事實上,Illumina計劃推出BaseSpace的“應用商店”,這樣用戶可以將新的算法加入到自己的數據分析流程中。
Life Technologies公司
Life Technologies公司去年(2010年)憑借其每臺50,000美元的Ion Torrent PGM進入低價臺式個人測序儀市場。該設備本質上是將半導體芯片轉換成了超高密度pH計。推出之時,PGM采用稱為“314”的芯片,在兩個小時內可產生1,000萬個堿基,每個讀長為100個堿基,花費500美元。后來改用“316”芯片,產能提高了10倍。目前試用用戶可用到的“318”芯片又提高了輸出能力,一次運行可產生10億堿基的數據。
Life Technologies的半導體測序芯片
ABI公司副總裁Mark Gardner解釋說,一次運行產生10億堿基數據得益于兩個方面,一是芯片上傳感器數量增加,314上傳感器數為140萬,現在是1130萬,可產生至少500萬個讀長;二是讀長增大,現在增長到了200堿基。Gardner說,到2012年某個時候,讀長將增加到400堿基,意味著318芯片理論上每次運行可以產出20億堿基的數據,而價格仍是500美元。他說:“在美國人類遺傳學協會年會上,我們展示了525個堿基對的讀長。”
Gardner說,Life Technologies的5500系列遺傳分析系統也預計在2012年進行升級。彼時,該系統將可運行Wildfire chemistry,將在實驗臺上進行的模板制備(包括費時費錢的乳劑PCR步驟)工作轉到了儀器中進行。這降低了樣品制備的費用,提高了讀取密度及一致性,Gardner說。通過使點樣更為緊湊并從頭尾雙向同時進行讀取,Wildfire將成像特征數量提到了5倍。Gardner說這就足夠“在一次運行中完成10個基因組。”(目前5500x1系列遺傳分析系統每個運行產生大約2個人類基因組的數據量。)
454 Life Sciences
Roche Life Sciences的454 Life Sciences也升級了它的測序平臺。454 GS FLX+結合該公司的新的GS FLX Titanium Sequencing Kit XL+升級到GS FLX,將其讀長提高到了每個運行1000個堿基。“利用該系統可以獲取高質量、高通量、與Sanger測序法相似長度的測序結果。”市場Mike Catalano說道,并且補充說到每運行一次可以產生700M的數據。454還為靶向測序提供了引物試劑盒,包括人類HLA區域擴增及白血病相關基因分析試劑盒(2012年推出)。
第三代測序
過去的一年還見證了稱為第三代測序技術的成果。其中的一件就是Pacific Bioscience的PacBio PR的正式推出。該平臺采用單分子熒光測序技術,在解決海底霍亂流行及德國 E. coli 爆發中發揮了重大作用。
據Pacific Biosciences的CTO Stephen Turner稱,PacBio RS的讀長平均為2,500-3,000堿基,某些還長達22,000堿基,這使得該設備盡管與競爭技術相比每讀長的精度要低(85%-89%的精度),但特別適于解決基因組結構問題。
Tuiner說,PacBio初是專注于一些小的常規應用,包括細菌的從頭測序、病原體測序、病毒測序及目標基因測序。不過,該技術*性地實現了一些新應用,包括基于如5-甲基胞嘧啶及5-羥甲基胞嘧啶對用于讀取序列的聚合酶動力學影響而直接鑒定此類DNA修飾。
“這些化學修飾就像是高速路上的減速帶,當聚合酶對其進行驅動時,使得DNA的延伸變慢,或者有時候會變快,這取決于特定環境。那些模式產生特異信號從而可以檢測到它們。”Turner說。
納米孔技術
Oxford Nanopore公司正在開發兩種納米孔測序方法(“鏈條法”及“核酸外切酶法”,并已就后者同Illumina達成了商業化協議),公司拒絕評論其項目的進展狀態,但一些在線信息顯示此系統由一系列的可以相互通訊的測序節點形成一個網絡結構,每個節點配置一個耗材倉庫。每個GridION節點可獨立運行,或通過網絡與其他節點通訊達到更大的測序效果,該架構可實現多功能工作流。
不過,該公司在2011年10月20號公開的職位招聘列表包含一個“試用合作,DNA測序”職位,職責包括“管理與的基因組研究機構中的重點客戶進行的技術開發合作”,Oxford在不久的將來可能會褪去其神秘外紗并啟動試用程序。
另一個專注于納米孔的公司Genia也邁出了它們商業化的*步。據該公司CEO Stefan Roever稱,Genia正在開發一種使用生物孔和集成電路(相同的技術正驅動著計算機工業發展)的納米系統。Roever解釋說,該系統“運用的電子學,并將其應用到信號處理過程中非常棘手的問題,”也就是說,對單個DNA堿基通過納米孔時產生的微弱的電子順序信號進行捕捉。
Roever說,Genia的系統的核心是活性芯片,能夠對各個孔進行獨立讀取和控制。[8]芯片“通電”之后,研究人員可以對納米孔陣列進行動態組裝,向納米孔中添加DNA樣并實施測序,同時可以依需要將這些DNA分子排出納米孔。盡管實驗表明其可以區分四種堿基并控制DNA的運動,但該技術目前還處在研發中,Roever說道。“我們希望2012年*季度能夠推出帶有幾百個傳感器的這種芯片的α版本。”
這種芯片如何與Oxford及其他的測序界大牛過招還需拭目以待。不過當下還有一位大牛沒有參與到競爭中來,那就是第三代單分子測序公司Helicos BioSciences。據GenomeWeb Daily News報道,Helicos在11月14號宣稱2011年第三季度的收入增長,“但要小心因為缺乏現金注入而不得不在年底關門大吉。