2017年,黃巖誼課題組將通信理論中的糾錯碼引入到測序技術(shù)中,通過三條正交的簡并序列來檢測并校正測序錯誤。這項“糾錯碼測序技術(shù)”兼具較長的讀長和極高的準確度。近日,該課題組又在《國家科學(xué)評論》(National Science Review, NSR)發(fā)表文章,通過計算機模擬構(gòu)建的“虛擬測序儀”,揭示了糾錯碼測序技術(shù)中“失相”問題的模式、特征,并在此基礎(chǔ)上建立了一個失相校正算法,為更加高效、準確的測序技術(shù)提供了一種實用解決方案。
高通量測序中的“失相”問題
近二十年來,新一代高通量測序技術(shù)快速發(fā)展,極大地改變了生命科學(xué)和醫(yī)學(xué)研究,并迅速進入醫(yī)學(xué)診斷等領(lǐng)域,服務(wù)于健康產(chǎn)業(yè)。
當(dāng)前主流的高通量測序技術(shù)大多采用“邊合成邊測序”的方式,且會將每一條待測DNA分子擴增成多條DNA組成的簇,從而放大可檢測信號。理想情況下,一簇DNA中的每個分子在測序過程中都是同步的,所以周期性反應(yīng)所獲得的測序信號就直接反映出待測DNA的序列信息。 然而,在真實的測序體系中,各個分子間從來都不是完美同步的。由于反應(yīng)不完全或者反應(yīng)體系中雜質(zhì)引起的副反應(yīng),一簇DNA中的各個分子會逐漸失去同步性,反映到測序過程中,就會使測序信號變得紊亂,而無法直接反映DNA的序列信息。這一現(xiàn)象稱為“失相”,即分子間信號“相位”的失諧。失相問題極大地限制了高通量測序的讀長和準確性。
每一種基于類似原理的測序方法,都存在這樣的現(xiàn)象。而在使用不同化學(xué)反應(yīng)的不同測序方法中,失相現(xiàn)象的特征也不盡相同。如要創(chuàng)建新的測序技術(shù),對其失相現(xiàn)象的充分理解是一個必須解決的主要問題。
“糾錯碼測序”中的失相模式
為了提高測序技術(shù)的準確性,北京大學(xué)黃巖誼課題組于2017年將通信理論中的糾錯碼引入到測序技術(shù)中,通過三條正交的簡并序列來檢測并校正測序錯誤。這一項糾錯碼測序技術(shù)兼具較長的讀長和極高準確度的潛力。糾錯碼測序中也有失相問題。近期,黃巖誼課題組通過計算機模擬,構(gòu)造了一個“虛擬測序儀”,來研究糾錯碼測序方法中失相問題的模式、規(guī)律,并探索解決方案。研究者發(fā)現(xiàn),“單堿基滑動”是糾錯碼測序獨有的失相模式。在糾錯碼測序中,雜質(zhì)引起的副反應(yīng)會使DNA分子發(fā)生額外的延伸反應(yīng),稱之為初級超前反應(yīng)。若初級超前反應(yīng)僅延伸一個堿基,則該DNA分子會立刻被過量的底物進一步延伸,稱之為次級超前反應(yīng);而若初級超前延伸了不止一個堿基,則上述次級超前反應(yīng)不會發(fā)生。即,次級超前反應(yīng)發(fā)生的條件可以被歸納為單堿基滑動。
利用“虛擬測序儀”,研究者探索了DNA分子在不同反應(yīng)條件下的延伸規(guī)律,找到了影響單堿基滑動的關(guān)鍵因素。依據(jù)單堿基滑動這一失相模式,作者還建立了一個失相校正算法,并證明該算法可用于校正至少500輪的測序反應(yīng)(對應(yīng)1000 bp的測序讀長)。 最后,作者還將失相校正算法推廣到了具有更高準確度的雙色糾錯碼測序上,并在實際測序中進行了驗證。“單堿基滑動”這一新型失相規(guī)律的發(fā)現(xiàn)和歸納,不僅僅對“糾錯碼測序方法”提供了更加深刻的理解,同時對于如何更加快速高效地實現(xiàn)對測序化學(xué)反應(yīng)信號的解讀和推算,提供了一個實用的解決方案。
責(zé)任編輯:lq
-
算法
+關(guān)注
關(guān)注
23文章
4587瀏覽量
92503 -
DNA
+關(guān)注
關(guān)注
0文章
242瀏覽量
30975 -
測序儀
+關(guān)注
關(guān)注
0文章
18瀏覽量
7062
原文標題:黃巖誼課題組:利用虛擬測序儀,揭示“糾錯碼測序”中的失相模式 | NSR
文章出處:【微信號:zhishexueshuquan,微信公眾號:知社學(xué)術(shù)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論