唐代詩人白居易曾感嘆:“夜來南風(fēng)起,小麥覆隴黃”,只言片語便描繪出農(nóng)耕社會(huì)里麥?zhǔn)鞎r(shí)節(jié)的盛夏光景。古時(shí),農(nóng)人以深耕細(xì)作守護(hù)著口糧與生計(jì),朝夕交替間,人類的悠遠(yuǎn)文明便在這份原野的守護(hù)中徐徐展開。
時(shí)過境遷,在數(shù)字時(shí)代的今天,也有這么一群深扎熱土的“田間守護(hù)者”。
來自北京大學(xué)現(xiàn)代農(nóng)業(yè)研究院(以下簡稱“北大農(nóng)研院”)的小麥抗病遺傳育種團(tuán)隊(duì),便憑借對植物基因組的多年研究,從小麥及其近緣種屬中發(fā)掘、定位、克隆、轉(zhuǎn)育到多個(gè)優(yōu)異的抗銹病基因,如Sr13和Yr15等,足以大幅提升主栽小麥品種的韌性,已幫助全球不同國家培育新物種超過100個(gè)。
事實(shí)上,小麥作為當(dāng)今依舊最重要的糧食作物,在種植栽培上所面臨最大的病害便是小麥銹病。其危害強(qiáng)、范圍廣,輕則致麥粒不飽滿,重則致麥株枯死,若不根治,將長期威脅我國小麥的產(chǎn)能與質(zhì)量。
這背后,是北大農(nóng)研院對植物基因技術(shù)孜孜不倦的突破,是麥浪涌動(dòng)間對土地的另一種數(shù)字守候。
糧安天下,種鑄基石
黃土地間的數(shù)字涌動(dòng)
在遺傳學(xué)中,每種生物都蘊(yùn)含了特定的一組基因,稱之為基因組,其蘊(yùn)藏著這一生物的起源、進(jìn)化、發(fā)育、生理等重要信息。通過控制蛋白質(zhì)或控制酶的合成,這些基因?qū)⒅苯踊蜷g接地控制生物的性狀,譬如玉米植株的高矮、產(chǎn)量的高低、是否抗倒伏等等。
如今,全球糧食依舊呈現(xiàn)緊缺與分配不均的現(xiàn)狀,如何快速提升水稻、小麥、玉米等農(nóng)作物的產(chǎn)量和質(zhì)量?溫度、光照、水分、土壤的復(fù)雜影響下,如何提高作物對干旱、霜凍等嚴(yán)峻環(huán)境的抗逆性和適應(yīng)性?全球每年多達(dá)40%的農(nóng)作物產(chǎn)量因病蟲害而損失,如何發(fā)現(xiàn)更具抗病蟲害能力的作物品種,提高抵御力?
基因組測序與分析技術(shù),便是回答這一系列問題的答案。
自1990年學(xué)界啟動(dòng)“人類基因組計(jì)劃”以來,一系列作物基因組計(jì)劃也相繼啟動(dòng),如水稻基因組計(jì)劃、玉米基因組計(jì)劃、小麥基因組計(jì)劃,致力解開作物基因組的謎團(tuán)。通過研究不同植物品種在基因圖譜上的表現(xiàn)規(guī)律與特殊功能的關(guān)聯(lián),再進(jìn)行編排、重組,為作物遺傳改良和新品種培育提供極佳的思路和方法。
然而,對作物基因組的研究分析過程又是極其復(fù)雜的,這包括了基因序列比對、基因表達(dá)分析、基因功能注釋、基因網(wǎng)絡(luò)構(gòu)建等,涉及海量數(shù)據(jù)的處理和讀寫。
例如,一株小麥的基因組數(shù)據(jù)就有17GB之大、重復(fù)序列含量高達(dá)85%、過程數(shù)據(jù)將膨脹5倍之多,致使基因組破譯難度巨大,組裝一個(gè)大型作物基因組可能需要短時(shí)間內(nèi)并行處理數(shù)百萬個(gè)序列片段數(shù)據(jù),注釋則需要對數(shù)千個(gè)基因進(jìn)行功能預(yù)測和分類。
換句話說,要想推開植物基因奧秘的大門,就要先通過一輪對存儲(chǔ)底座的試煉。
“小麥跟人一樣也會(huì)生病,我們要做的就是為小麥植入‘抗病’程序。”作為農(nóng)業(yè)創(chuàng)新的先行者,北京大學(xué)現(xiàn)代農(nóng)業(yè)研究院已經(jīng)走在與小麥銹病作斗爭的路上很多年?;蚪M數(shù)據(jù)的高效處理和存納離不開一個(gè)得力的助手——超算平臺(tái),為各項(xiàng)研究提供高性能計(jì)算、組學(xué)分析和科研數(shù)據(jù)存儲(chǔ)服務(wù)。
這其中,離不開華為OceanStor Pacific分布式存儲(chǔ)的鼎力相助?;谌A為OceanStor Pacific分布式存儲(chǔ)這一強(qiáng)大的數(shù)據(jù)基礎(chǔ)設(shè)施底座,雙方攜手構(gòu)筑基因數(shù)據(jù)分析平臺(tái),滿足研究院各類植物基因生信分析任務(wù),為智慧農(nóng)業(yè)研究、農(nóng)業(yè)生產(chǎn)大數(shù)據(jù)、農(nóng)業(yè)資源大數(shù)據(jù)等方面提供強(qiáng)有力的支撐。
守護(hù)金飯碗、菜籃子和油桶子
海量數(shù)據(jù)的安心之選
在風(fēng)吹日曬的山野耕種中,農(nóng)人需要在犁地、播種、施肥、鋤草、灌溉等一系列環(huán)節(jié)對作物進(jìn)行悉心呵護(hù);而在漫長冗雜的植物基因科研中,數(shù)據(jù)存儲(chǔ)也需要對海量數(shù)據(jù)發(fā)揮同樣的作用。
植物基因組測序、注釋、編輯和模型計(jì)算是典型的大規(guī)模數(shù)據(jù)密集型場景,北大農(nóng)研院的基因數(shù)據(jù)分析平臺(tái)便必須承載整個(gè)流程的全部數(shù)據(jù),包括收集而來的原始基因組數(shù)據(jù)、經(jīng)過清洗或打碎后的大量片段文件、基因比對與變異分析過程的中間信息、以及長期歸檔以供未來二次分析的溫冷數(shù)據(jù)。
一系列數(shù)據(jù)的流轉(zhuǎn)和調(diào)度,都需要強(qiáng)大的數(shù)據(jù)存儲(chǔ)作為擎托。北大農(nóng)研院對此提出了清晰的訴求:
- 其一,作物基因組研究中涉及到大量的基因組測序、表達(dá)譜測定、SNP分析等數(shù)據(jù)產(chǎn)生,需要充足容量、巨大吞吐量的數(shù)據(jù)底座支撐;
- 其二,由于基因測序的整個(gè)過程會(huì)有持續(xù)化的碎片文件讀寫,絕不允許被中斷,這就要求支撐測序應(yīng)用的存儲(chǔ)系統(tǒng)具備極致的穩(wěn)定性和可靠性,確保數(shù)據(jù)不會(huì)丟失或損壞;
-
其三,在冷凍電鏡和基因數(shù)據(jù)分析工作中,對存儲(chǔ)系統(tǒng)的整體性能、小文件處理能力提出更高要求。
在華為的助力下,北大農(nóng)研院面臨的一系列挑戰(zhàn)迎刃而解。
首先,存得下。在容納海量基因數(shù)據(jù)方面,北大農(nóng)研院通過借助華為OceanStor Pacific分布式存儲(chǔ)構(gòu)筑了超大容量資源池,為研究院眾多基因組、轉(zhuǎn)錄組、表觀組及代謝組、蛋白組和智慧農(nóng)業(yè)研究提供充分支持。源于OceanStor Pacific的超高密硬件設(shè)計(jì),在高效散熱與空間利用上的創(chuàng)新突破,單框可容納高達(dá)120塊盤,容量密度領(lǐng)先業(yè)界至少30%。
其次,用得穩(wěn)。OceanStor Pacific以軟硬結(jié)合構(gòu)筑多級可靠性保障。從硬件上,其采用全FRU(Field Replaceable Unit) 設(shè)計(jì),可滿足7×24小時(shí)不停機(jī)維護(hù)。從軟件上,其采用跨節(jié)點(diǎn)大比例動(dòng)態(tài)EC算法,可滿足4節(jié)點(diǎn)同時(shí)故障業(yè)務(wù)不中斷。經(jīng)POC實(shí)測,整體集群具備穩(wěn)定、高可靠能力,保障了不同作業(yè)負(fù)載下的持續(xù)運(yùn)行。
第三,跑得快。OceanStor Pacific單存儲(chǔ)節(jié)點(diǎn)讀帶寬實(shí)測達(dá)到6GB/s,近乎翻倍的性能滿足北大農(nóng)研院更高的高通量表型組圖像處理需求,最大化提升計(jì)算資源效率。同時(shí),OceanStor Pacific采用新一代OceanFS并行文件系統(tǒng),一套存儲(chǔ)滿足基因測序異構(gòu)計(jì)算高帶寬和高IOPS要求,并結(jié)合DPC分布式并行客戶端,消除單流與單客戶端的性能瓶頸,支撐I/O級負(fù)載均衡的全場景加速。
存力加持
洞見每粒種子的巨大潛能
事實(shí)上,小麥抗病育種僅僅是北大農(nóng)研院在探索農(nóng)業(yè)與科技融合的冰山一角,我們還看到了其基因工程多姿多彩的產(chǎn)物。
例如,首個(gè)西瓜T2T無缺口參考基因組成功組裝、注釋并發(fā)表,成為業(yè)界里程碑意義的研究成果;大豆玉米帶狀復(fù)合種植潔田模式,在玉米不減產(chǎn)的前提下,一畝地能多收300多斤大豆;創(chuàng)建了一套高效精準(zhǔn)的基因編輯工具,可使黃瓜遺傳轉(zhuǎn)化率提高25倍以上……
地能盡其利,則民食足;物能盡其用,則材力豐。在基因技術(shù)、數(shù)字技術(shù)點(diǎn)亮大地之前,存儲(chǔ)底座必須更堅(jiān)實(shí)、更強(qiáng)大一點(diǎn)。
從土壤深處到民生大計(jì),華為分布式存儲(chǔ)為基因工程產(chǎn)業(yè)搭建起一級級“存得下”、“用得穩(wěn)”、“跑得快”的數(shù)字臺(tái)階。當(dāng)我們踏著華為分布式存儲(chǔ)的臺(tái)階,一個(gè)又一個(gè)生物育種技術(shù)的創(chuàng)新成果便近在眼前,熠熠生輝。
今天,很多人類的科學(xué)問題、產(chǎn)業(yè)轉(zhuǎn)化問題,最終都變成了數(shù)據(jù)的問題。而人類今天所面對的數(shù)據(jù)密集型場景,也遠(yuǎn)不止基因測序這一個(gè)。華為OceanStor Pacific分布式存儲(chǔ)將持續(xù)創(chuàng)新,點(diǎn)燃千行百業(yè)數(shù)字化的躍升引擎,釋放海量數(shù)據(jù)的非凡潛力。
點(diǎn)擊閱讀原文,了解更多華為數(shù)據(jù)存儲(chǔ)資訊!
原文標(biāo)題:一粒種子如何撬動(dòng)世界?
文章出處:【微信公眾號:華為】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
華為
+關(guān)注
關(guān)注
215文章
34258瀏覽量
250992
原文標(biāo)題:一粒種子如何撬動(dòng)世界?
文章出處:【微信號:huaweicorp,微信公眾號:華為】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論