誰(shuí)能想到,一條不起眼的耳垂折痕,可能與冠心病發(fā)病的概率相關(guān),因?yàn)樗鼈冴P(guān)聯(lián)著同一個(gè)基因。
在人類表型組研究中,醫(yī)生可以通過(guò)觀察外觀表型,來(lái)判斷患者罹患冠心病的風(fēng)險(xiǎn)??梢哉f(shuō),人類表型組研究是“后基因時(shí)代”的戰(zhàn)略制高點(diǎn),如果這條線被研究透徹,從微觀到宏觀的各個(gè)維度表型之間的關(guān)系都能一覽無(wú)遺,屆時(shí),或許人類健康之謎就能被徹底解決。
近日,復(fù)旦大學(xué)攜手曙光共同建設(shè)的國(guó)際人類表型組學(xué)研究平臺(tái)(以下簡(jiǎn)稱:研究平臺(tái)),通過(guò)對(duì)人類表型組在物理、化學(xué)和生物層面進(jìn)行跨尺度多維度研究,滿足人類表型組數(shù)據(jù)的存儲(chǔ)、共享和應(yīng)用,形成服務(wù)全國(guó)的生物醫(yī)學(xué)大數(shù)據(jù)研究與應(yīng)用設(shè)施。
表型數(shù)據(jù)與信息技術(shù) 共筑“生命健康密碼”
人類表型組的研究需要信息技術(shù)提供強(qiáng)有力的計(jì)算工具,借助先進(jìn)的IT技術(shù)解決方案,完成海量實(shí)驗(yàn)數(shù)據(jù)的存儲(chǔ)、讀取與挖掘處理。同時(shí),信息技術(shù)還有助于加強(qiáng)表型數(shù)據(jù)庫(kù)的數(shù)據(jù)管理、信息傳遞、檢索和資源共享等。
作為跨尺度多維度人類表型組研究平臺(tái),這里設(shè)有人體成像與測(cè)量、睡眠與生物電、人體能量代謝艙等多個(gè)測(cè)量實(shí)驗(yàn)室,可檢測(cè)約2萬(wàn)個(gè)表型詞條,比如分子蛋白質(zhì)組、分子代謝組、細(xì)胞表型、語(yǔ)音表型等等。這些人類表型組相關(guān)數(shù)據(jù)將用于探索基因、人體特征與疾病健康之間的關(guān)系,為疾病預(yù)防與干預(yù)提供關(guān)鍵線索與指引,解讀人類生命密碼所需的關(guān)鍵信息。
同時(shí),研究平臺(tái)以海量表型數(shù)據(jù)資源的高等級(jí)安全保存為核心,實(shí)現(xiàn)數(shù)據(jù)資源的匯聚、管理、共享和挖掘,形成我國(guó)人群健康表型組標(biāo)準(zhǔn)化技術(shù)體系,構(gòu)建中國(guó)健康人群表型圖譜及數(shù)據(jù)庫(kù)。
高效存儲(chǔ)共享與應(yīng)用 提高組學(xué)科研質(zhì)量
人類表型組項(xiàng)目涉及的主要應(yīng)用為基因測(cè)序、序列拼接軟件如SOAP2,BWA,BWASW 、Bowtie/Bowtie 2SHARCGS等,在計(jì)算時(shí)會(huì)產(chǎn)生海量的中間數(shù)據(jù)。存儲(chǔ)系統(tǒng)性能的好壞對(duì)計(jì)算效率將產(chǎn)生很大影響。因此,在人類表型組項(xiàng)目中,一方面要保證存儲(chǔ)系統(tǒng)的高讀寫性能;另一方面,要減少序列拼接程序運(yùn)行時(shí)對(duì)存儲(chǔ)系統(tǒng)的影響。
針對(duì)生物基因領(lǐng)域測(cè)序產(chǎn)生海量小文件的情況,曙光分布式存儲(chǔ)系統(tǒng)ParaStor通過(guò)Scale-Out橫向擴(kuò)展、IB+RDMA高速互聯(lián)、內(nèi)核態(tài)POSIX協(xié)議、智能SSD Cache及小文件聚合等技術(shù),消除傳統(tǒng)的Scale-up縱向擴(kuò)展存儲(chǔ)架構(gòu)的性能局限性,有效解決生物基因應(yīng)用中對(duì)海量大文件存儲(chǔ)場(chǎng)景高聚合帶寬、小文件存儲(chǔ)場(chǎng)景高IOPS的存儲(chǔ)需求。
ParaStor可通過(guò)性能與容量的線性增長(zhǎng),滿足對(duì)存儲(chǔ)系統(tǒng)數(shù)據(jù)處理能力和擴(kuò)展性的要求。此外,針對(duì)業(yè)務(wù)系統(tǒng)對(duì)可靠性、穩(wěn)定性的需求,ParaStor分布式存儲(chǔ)系統(tǒng)通過(guò)多種技術(shù)手段,從物理底層到邏輯層全方位保證存儲(chǔ)系統(tǒng)高可靠性和高可用性。豐富的協(xié)議接口,多類型數(shù)據(jù)融合存儲(chǔ),可以保證多業(yè)務(wù)共享。
在復(fù)旦大學(xué)國(guó)際人類表型組學(xué)研究平臺(tái)項(xiàng)目中,ParaStor大幅度提高海量人類表型組數(shù)據(jù)的存儲(chǔ)、共享和應(yīng)用效率,在提升我國(guó)組學(xué)數(shù)據(jù)質(zhì)量意識(shí)、引領(lǐng)國(guó)際標(biāo)準(zhǔn)研發(fā)、推動(dòng)我國(guó)生物醫(yī)學(xué)領(lǐng)域原創(chuàng)研究的過(guò)程中起到了重要的作用。
原文標(biāo)題:曙光攜手復(fù)旦大學(xué),共筑國(guó)際“表型組研究平臺(tái)”!
文章出處:【微信公眾號(hào):中科曙光】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:pj
-
數(shù)據(jù)庫(kù)
+關(guān)注
關(guān)注
7文章
3752瀏覽量
64236 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8856瀏覽量
137222 -
中科曙光
+關(guān)注
關(guān)注
5文章
296瀏覽量
17743
原文標(biāo)題:曙光攜手復(fù)旦大學(xué),共筑國(guó)際“表型組研究平臺(tái)”!
文章出處:【微信號(hào):sugoncn,微信公眾號(hào):中科曙光】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論