科技日報記者 張夢然
據(jù)英國《自然·通訊》雜志10日發(fā)表的一項最新成果,美國北卡羅來納州立大學(xué)研究人員將DNA數(shù)據(jù)存儲方面的長期挑戰(zhàn)轉(zhuǎn)化為一種實用工具——為用戶提供存儲數(shù)據(jù)文件的“預(yù)覽”,例如圖像文件的縮略圖版本。這使得整個DNA存儲系統(tǒng)數(shù)據(jù)效率大為提高,同時更具兼容性。
全球的數(shù)據(jù)量不斷增加,傳統(tǒng)的存儲架構(gòu),如硬盤和磁帶,越來越難以跟上數(shù)據(jù)存儲的需要。隨著這些裝置逐漸達(dá)到存儲極限,DNA被當(dāng)作一種長期存儲方案提出來,這是一項非常有吸引力的技術(shù),因為只需要一個小片段就可以存儲大量數(shù)據(jù),信息可以長時間保持,又非常節(jié)能。
但是科學(xué)家們一直還無法實現(xiàn)對DNA文件中數(shù)據(jù)的“預(yù)覽”——如果你想知道文件是什么,那你必須“打開”整個文件。
據(jù)研究人員介紹,為了識別和提取指定文件,大多數(shù)系統(tǒng)使用聚合酶鏈反應(yīng)(PCR)。具體來說,使用與相應(yīng)引物結(jié)合序列匹配的小型DNA引物來識別包含所需文件的DNA鏈。然后系統(tǒng)使用PCR制作大量相關(guān)DNA鏈的副本,再對整個樣本進(jìn)行測序。該過程會復(fù)制大量目標(biāo)DNA鏈,但目標(biāo)鏈的信號比樣本的其余部分更強(qiáng),從而可以識別目標(biāo)DNA序列并讀取文件。然而,DNA數(shù)據(jù)存儲研究人員面臨的一個巨大挑戰(zhàn)就是,如果兩個或多個文件具有相似的文件名,PCR將無意中復(fù)制多個數(shù)據(jù)文件的片段。因此,用戶必須為文件指定非常不同的名稱,以避免產(chǎn)生數(shù)據(jù)混亂。
此次,北卡羅來納州立大學(xué)研究團(tuán)隊開發(fā)的這種技術(shù),利用相似的文件名可以打開整個文件或該文件的特定子集。這是通過在命名文件和文件的給定子集時使用特定的命名約定來實現(xiàn)的,研究人員可以PCR過程的幾個參數(shù),溫度、樣本中DNA的濃度以及樣本中試劑的類型和濃度,來選擇是“打開”整個文件還是只“打開”其“預(yù)覽”版本。
這一新技術(shù)的優(yōu)勢體現(xiàn)在效率和費用兩大方面,該論文的第一作者、研究人員凱爾·托梅克表示,“如果你不確定哪個文件包含你想要的數(shù)據(jù),也不必對所有潛在文件中的所有DNA進(jìn)行測序,相反,還可以對DNA文件的更小部分進(jìn)行測序以作為預(yù)覽”。
研究團(tuán)隊成員表示,這一技術(shù)已展示了與其他文件類型廣泛兼容的能力,目前他們正在尋找行業(yè)合作伙伴來幫助探索該技術(shù)的商業(yè)可行性。
【責(zé)任編輯:張瑨瑄】免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé),在此我們謹(jǐn)向原作者和原媒體致以崇高敬意。如果您認(rèn)為本站文章侵犯了您的版權(quán),請與我們聯(lián)系,我們將第一時間刪除。