日漸成熟的高通量測(cè)序技術(shù)
測(cè)序在生命科學(xué)研究中一直發(fā)揮著重要作用。以Sanger法(雙脫氧核苷酸末端終止法)為代表的第一代測(cè)序技術(shù)幫助人們完成了從噬菌體基因組到人類基因組圖譜等大量測(cè)序工作,但由于其存在成本高、速度慢、通量低等不足,并不是后基因組時(shí)代最理想的測(cè)序方法。
進(jìn)入21世紀(jì)后,以Roche 454、Illumina Solexa和ABI SOLiD為代表的第二代測(cè)序技術(shù)誕生了,并迅速掀起了你追我趕的技術(shù)比拼高潮。2010年,Illunima和ABI先后發(fā)布新款測(cè)序儀,改進(jìn)了原有機(jī)型,測(cè)序通量不斷提升,測(cè)序成本不斷降低,現(xiàn)在已經(jīng)進(jìn)入了數(shù)千美元測(cè)一個(gè)人全基因組的時(shí)代。
第二代測(cè)序技術(shù)進(jìn)展
1. Roche 454測(cè)序技術(shù)
454公司可謂第二代測(cè)序技術(shù)的奠基者。2005年底,454公司推出了革命性的基于焦磷酸測(cè)序法的高通量基因組測(cè)序系統(tǒng)--Genome Sequencer 20 System。這一技術(shù)的建立開創(chuàng)了邊合成邊測(cè)序(sequencing by synthesis)的先河,被nature雜志以里程碑事件報(bào)道。之后,454公司被羅氏診斷公司以1.55億美元收購。一年后,他們又推出了性能更優(yōu)的第二代基因組測(cè)序系統(tǒng)--Genome Sequencer FLX System(GS FLX)。2008年10月,Roche 454在不改變機(jī)器的情況下,推出了全新的測(cè)序試劑--GS FLX Titanium,全面提升了測(cè)序的準(zhǔn)確性、讀長(zhǎng)和測(cè)序通量。
目前,Roche 454 GS FLX Titanium每次運(yùn)行能產(chǎn)生100萬條序列,平均讀長(zhǎng)能達(dá)到400nt,且第400個(gè)堿基的準(zhǔn)確率能達(dá)到99%。一次運(yùn)行所需時(shí)間為10小時(shí),能獲得4-6億個(gè)堿基的序列信息。
2. Illumina Solexa測(cè)序技術(shù)
Illumina公司的第二代測(cè)序儀最早由Solexa公司研發(fā),利用其專利核心技術(shù)"DNA簇"和"可逆性末端終結(jié)(reversible terminator)",實(shí)現(xiàn)自動(dòng)化樣本制備和大規(guī)模并行測(cè)序。Illumina公司于2007年初花費(fèi)6億美金巨資收購了Solexa。2010年初,Illumina將其第二代測(cè)序儀Genome Analyzer IIx升級(jí)到HiSeq 2000。
HiSeq 2000含有兩張F(tuán)low cell,可同時(shí)運(yùn)行或者只運(yùn)行其中一張。讀長(zhǎng)為100nt,同時(shí)支持Fragment、Pair-end和Mate-Paired文庫。每次運(yùn)行最多可產(chǎn)生200 GB的數(shù)據(jù)量(讀長(zhǎng)為2x100nt)。
3. ABI SOLiD測(cè)序技術(shù)
過去20年,美國(guó)應(yīng)用生物系統(tǒng)公司(ABI)在一代測(cè)序方面一直占據(jù)著壟斷地位。第二代測(cè)序技術(shù)出現(xiàn)以來,ABI公司不甘落后,迅速趕上,于2007年底推出了SOLiD 第二代測(cè)序平臺(tái)。2010年末又發(fā)布了最新產(chǎn)品--SOLiD 5500xl測(cè)序平臺(tái)。從SOLiD到如今的SOLiD 5500xl,短短三年時(shí)間,連升五級(jí),發(fā)展速度驚人。
SOLiD全稱為Supported Oligo Ligation Detetion,它的獨(dú)特之處在于它以四色熒光標(biāo)記寡核苷酸的連續(xù)連接反應(yīng)為基礎(chǔ),而沒有采用傳統(tǒng)的邊合成邊測(cè)序技術(shù)。連接反應(yīng)沒有DNA聚合酶合成過程中常有的錯(cuò)配問題,而SOLiD特有的"雙色球編碼技術(shù)"又提供了一個(gè)糾錯(cuò)機(jī)制,這樣設(shè)計(jì)上的優(yōu)勢(shì)使得SOLiD在系統(tǒng)準(zhǔn)確性上大大領(lǐng)先于其它平臺(tái)。
目前最新款SOLiD 5500xl含有兩張微流體芯片(microfluidic FlowChip),每張芯片含有6條相互獨(dú)立的運(yùn)行通道(run lane)。每條lane都能運(yùn)行相對(duì)獨(dú)立的測(cè)序反應(yīng),這樣的設(shè)計(jì)使得SOLiD 5500xl測(cè)序平臺(tái)極具靈活性。最大測(cè)序讀長(zhǎng)為75nt,同樣支持Fragment、Pair-end和Mate-Paired文庫。單次運(yùn)行能得到的最大數(shù)據(jù)量為300Gb(使用最新設(shè)計(jì)的nanobeads)。測(cè)序的系統(tǒng)準(zhǔn)確性能達(dá)到99.99%。
第二代測(cè)序技術(shù)的應(yīng)用
技術(shù)推進(jìn)科學(xué)研究的發(fā)展。隨著第二代測(cè)序技術(shù)的迅猛發(fā)展,科學(xué)界也開始越來越多地應(yīng)用第二代測(cè)序技術(shù)來解決生物學(xué)問題。比如在基因組水平上對(duì)還沒有參考序列的物種進(jìn)行重頭測(cè)序(de novo sequencing),獲得該物種的參考序列,為后續(xù)研究和分子育種奠定基礎(chǔ);對(duì)有參考序列的物種,進(jìn)行全基因組重測(cè)序(resequencing),在全基因組水平上掃描并檢測(cè)突變位點(diǎn),發(fā)現(xiàn)個(gè)體差異的分子基礎(chǔ)。在轉(zhuǎn)錄組水平上進(jìn)行全轉(zhuǎn)錄組測(cè)序(whole transcriptome resequencing),從而開展可變剪接、編碼序列單核苷酸多態(tài)性(cSNP)等研究;或者進(jìn)行小分子RNA測(cè)序(small RNA sequencing),通過分離特定大小的RNA分子進(jìn)行測(cè)序,從而發(fā)現(xiàn)新的microRNA分子。在轉(zhuǎn)錄組水平上,與染色質(zhì)免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技術(shù)相結(jié)合,從而檢測(cè)出與特定轉(zhuǎn)錄因子結(jié)合的DNA區(qū)域和基因組上的甲基化位點(diǎn)。
這邊需要特別指出的是第二代測(cè)序結(jié)合微陣列技術(shù)而衍生出來的應(yīng)用--目標(biāo)序列捕獲測(cè)序技術(shù)(Targeted Resequencing)。這項(xiàng)技術(shù)首先利用微陣列技術(shù)合成大量寡核苷酸探針,這些寡核苷酸探針能夠與基因組上的特定區(qū)域互補(bǔ)結(jié)合,從而富集到特定區(qū)段,然后用第二代測(cè)序技術(shù)對(duì)這些區(qū)段進(jìn)行測(cè)序。目前提供序列捕獲的廠家有Agilent和Nimblegen ,應(yīng)用最多的是人全外顯子組捕獲測(cè)序。科學(xué)家們目前認(rèn)為外顯子組測(cè)序比全基因組重測(cè)序更有優(yōu)勢(shì),不僅僅是費(fèi)用較低,更是因?yàn)橥怙@子組測(cè)序的數(shù)據(jù)分析計(jì)算量較小,與生物學(xué)表型結(jié)合更為直接。
目前,外顯子組測(cè)序開始廣泛應(yīng)用于尋找疾病的候選基因上。內(nèi)梅亨大學(xué)的研究人員使用這種方法鑒定出Schinzel-Giedion 綜合征中的致病突變,Schinzel-Giedion綜合征是一種導(dǎo)致嚴(yán)重的智力缺陷、腫瘤高發(fā)以及多種先天性畸形的罕見病。他們使用Agilent SureSelect序列捕獲和SOLiD對(duì)四位患者的外顯子組進(jìn)行測(cè)序,平均覆蓋度為43倍,讀長(zhǎng)為50 nt,每個(gè)個(gè)體產(chǎn)生了2.7-3 GB可作圖的序列數(shù)據(jù)。他們聚焦于全部四位患者都攜帶變異體的12個(gè)基因,最終將候選基因縮小至1個(gè)。而貝勒醫(yī)學(xué)院基因組測(cè)序中心也計(jì)劃對(duì)15種以上疾病進(jìn)行研究,包括腦癌、肝癌、胰腺癌、結(jié)腸癌、卵巢癌、膀胱癌、心臟病、糖尿病、自閉癥以及其他遺傳疾病,以更好地理解致病突變以及突變對(duì)疾病的影響。前不久剛剛結(jié)束的Science雜志年度十大科學(xué)突破評(píng)選中,外顯子組測(cè)序名列其中。
以上我們盤點(diǎn)了2010年第二代測(cè)序技術(shù)的最新進(jìn)展和相關(guān)應(yīng)用。但是除了第二代測(cè)序之外,還有另外一種以單分子實(shí)時(shí)測(cè)序和納米孔為標(biāo)志的第三代測(cè)序技術(shù)也正在如火如荼的發(fā)展中,只是還沒有正式發(fā)布。所以目前科學(xué)界所說的高通量測(cè)序還指的是第二代測(cè)序。
