0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于煉丹神器深度學(xué)習(xí)下的生命科學(xué)冷凍電鏡單細(xì)胞基因分析的解決方案

GPU視覺識別 ? 來源:GPU視覺識別 ? 作者:GPU視覺識別 ? 2022-10-20 11:11 ? 次閱讀

當(dāng)前隨著冷凍電鏡、蛋白質(zhì)組學(xué)、深度學(xué)習(xí)、基因測序、卷積神經(jīng)網(wǎng)絡(luò)、高性能計算、單細(xì)胞基因、數(shù)據(jù)挖掘、數(shù)據(jù)分析、靶點發(fā)現(xiàn)、晶體預(yù)測、AlphaFold等技術(shù)的快速發(fā)展,生命科學(xué)開始被逐漸被人們所重視。

生命科學(xué)行業(yè)涉及研究微生物、動植物等一切生物的科學(xué)領(lǐng)域,也包括生命倫理學(xué)等相關(guān)領(lǐng)域的考量。生命科學(xué)的研究對提高人類生活質(zhì)量有很大幫助。從全球范圍來看,21世紀(jì)以來,全球生命科學(xué)發(fā)展進入快車道,特別是人類基因組計劃的實施、干細(xì)胞研究的深入、克隆技術(shù)的不斷發(fā)展等因素將生命科學(xué)的發(fā)展推向了新的高度,同時相應(yīng)領(lǐng)域的研發(fā)投入也在不斷增加。作為強烈依賴科技信息技術(shù)的典型代表,生命科學(xué)行業(yè)的藥物研發(fā)和基因測序分析領(lǐng)域面臨著計算資源短缺、研發(fā)周期長等問題。

poYBAGNQvHKAQVOXAAdAanSOzQQ199.png

生命科學(xué)領(lǐng)域面臨的挑戰(zhàn)

清華大學(xué)生命科學(xué)學(xué)院生物計算平臺主管楊濤認(rèn)為:冷凍電鏡目前在科研方向的挑戰(zhàn)分別是:數(shù)據(jù)管理的挑戰(zhàn),科研進度的挑戰(zhàn)和實驗風(fēng)險的挑戰(zhàn)。

一、數(shù)據(jù)管理

源于超量數(shù)據(jù),在最大化壓縮的前提下,每天大約會產(chǎn)生4TB的數(shù)據(jù)量。為了使計算設(shè)備的效率最大化,需要365天不間斷工作。一年的數(shù)據(jù)總量非常驚人,給數(shù)據(jù)管理帶來巨大的挑戰(zhàn)。

二、科研管理

冷凍電鏡技術(shù)已經(jīng)備受認(rèn)可,各科研機構(gòu)都在調(diào)動資源搶占高地,所以存在時間效率的問題,哪怕比別人慢半天,都會失去首發(fā)的價值。

三、實驗風(fēng)險

這是一個非常長時間的實驗流水線,任何中間環(huán)節(jié)都存在風(fēng)險。一旦不能及時解決風(fēng)險,整個系統(tǒng)的產(chǎn)出就會大打折扣。

pYYBAGNQvHKACXDnAAI5liPGK1U626.png

客戶需求

某學(xué)院單細(xì)胞基因組研究技術(shù)中心(簡稱“該中心”)旨在建立標(biāo)準(zhǔn)化、自動化的工程技術(shù),提高單細(xì)胞結(jié)構(gòu)分析水平,高精度確定從蛋白質(zhì)分子到全細(xì)胞的三維結(jié)構(gòu),并在此基礎(chǔ)上揭示蛋白質(zhì)及其復(fù)合體功能,大規(guī)模制備蛋白/抗體,建成具有國際一流水平和綜合示范功能的蛋白質(zhì)科學(xué)研究核心基地。

就生命科學(xué)研究項目而言,每個項目涉及的數(shù)據(jù)量小在上百TB。對于時間周期長、領(lǐng)域廣的項目,未來數(shù)據(jù)需求可能在PB級。此外,該中心需要考慮支持多種生命科學(xué)研究項目,而其中,不同應(yīng)用對高性能平臺計算環(huán)境有不同的要求,如基因測序需要高I/O性能和內(nèi)存大消耗,而分子動力學(xué)研究除了I/O性能外,還需要較高的網(wǎng)絡(luò)和并發(fā)處理能力。所有這些都對該中心構(gòu)建高性能平臺提出了挑戰(zhàn):

一、數(shù)據(jù)量增長10多倍,計算能力也要“跟上”

研究團隊采用的冷凍電鏡技術(shù)在近兩年取得了革命性的進展,具體來說就是相機技術(shù)實現(xiàn)了飛躍,采集數(shù)據(jù)的能力提高了10多倍,甚至上百倍,從而使得研究蛋白質(zhì)結(jié)構(gòu)的源數(shù)據(jù)呈幾何級數(shù)增長,這就需要中心在后期全面提升數(shù)據(jù)處理和計算能力。

二、亟需簡化管理保障服務(wù)品質(zhì)

隨著生命科學(xué)研究項目越來越多,如何根據(jù)不同項目和研究人員個性化需求分配資源,及時回收資源,實現(xiàn)跨整個高性能資源池的集中統(tǒng)一管理,簡化維護管理,減輕運維人員負(fù)擔(dān),是科研高性能計算平臺普遍面臨問題。

三、TCO居高不下

生命科學(xué)研究迅速成為國家戰(zhàn)略發(fā)展方向,導(dǎo)致研究項目和跨學(xué)科研究需求快速增加。傳統(tǒng)的分層計算存儲資源利用率低,導(dǎo)致新增費用快速增加。此外,能耗也成為阻礙高性能計算中心擴展的不可逾越的“高墻”。

四、網(wǎng)絡(luò)性能不能拖后腿

作為保證高性能集群正常運行的關(guān)鍵,高性能網(wǎng)絡(luò)承擔(dān)著重要的連接任務(wù)。隨著單節(jié)點計算和存儲性能的不斷提升,高性能用戶需要萬兆,四萬兆,十萬兆,InfiniBand網(wǎng)絡(luò)選擇以滿足不同的高性能計算需求。

解決方案特點

藍海大腦基于融合架構(gòu)助力某學(xué)院單細(xì)胞基因組研究技術(shù)中心搭建了一個分布式高性能平臺,擁有250個物理計算節(jié)點,5000個計算核心,總存儲容量1.92PB,理論計算能力208Tflops。通過Lustre技術(shù)實現(xiàn)了跨20個融合架構(gòu)的集中統(tǒng)一管理。

一、4.1TFLOPS/U的計算密度,4倍性能提升

可針對不同項目量身定制配置。其中,高密度計算節(jié)點支持14核英特爾?至強TM E5-2600v3處理器,在2U中擁有224個計算核心的密度,單U空間的計算性能密度達到業(yè)界領(lǐng)先的4.1TFLOPS,同時支持64個DIMM高密度內(nèi)存,確保高性能和低延遲的性能要求。此外,還支持InfiniBand接口,非常適合要求超低延遲的工作負(fù)載。在強大計算能力的保證下,計算效率提升3-4倍,過去4-5天才能完成的計算任務(wù),一天就能完成。

二、簡化高性能資源池監(jiān)控管理

根據(jù)項目要求定制不同的系統(tǒng)配置,同時通過機箱管理控制器(CMC),可以集中監(jiān)控和管理20個FX系統(tǒng)。此外,無代理生命周期管理和一對多遠(yuǎn)程管理功能可確保BIOS和固件程序更新不會影響業(yè)務(wù)穩(wěn)定性,并提高系統(tǒng)中計算節(jié)點生命周期管理的效率。而且在擴展服務(wù)器時,IT人員可以通過下發(fā)配置文件,使系統(tǒng)自動更新BIOS和固件程序,避免了重復(fù)輸入配置參數(shù)的繁瑣過程,減少了人工輸入錯誤導(dǎo)致的系統(tǒng)故障,簡化了管理運維,降低了管理費用。

三、TCO降低約20%

自動化、高密度、低能耗的集成部署、集中統(tǒng)一管理,可以使中心的TCO降低20%左右。其中,藍海大腦將通過主板連接服務(wù)器、存儲和1G0b網(wǎng)絡(luò),通過模塊化設(shè)計形成融合一體機,同時提供散熱、供電、網(wǎng)絡(luò)、管理和PCIe擴展的共享插槽,降低數(shù)據(jù)中心的占地和能耗,幫助中心獲得良好的性價比。

四、高速網(wǎng)絡(luò)保障平臺I/O性能

藍海大腦為中心提供四萬兆高性能網(wǎng)絡(luò),在保持成本優(yōu)勢的基礎(chǔ)上,為用戶提供穩(wěn)定的網(wǎng)絡(luò)性能,保證高性能、低延遲要求。

五、打破原有的服務(wù)器散熱方式,采用液冷散熱

藍海大腦液冷服務(wù)器系統(tǒng)突破傳統(tǒng)風(fēng)冷散熱模式,采用風(fēng)冷和液冷混合散熱模式——服務(wù)器內(nèi)主要熱源 CPU 利用液冷冷板進行冷卻,其余熱源仍采用風(fēng)冷方式進行冷卻。通過這種混合制冷方式,可大幅提升服務(wù)器散熱效率,同時,降低主要熱源 CPU 散熱所耗電能,并增強服務(wù)器可靠性。經(jīng)檢測,采用液冷服務(wù)器配套基礎(chǔ)設(shè)施解決方案的數(shù)據(jù)中心年均 PUE 值可降低至 1.2 以下。

poYBAGNQvHOACZlhAAZltQ8jCCY461.png

客戶收益

一、藍海大腦HPC高性能計算與AI平臺已成為高性能、多功能、專業(yè)的前沿計算平臺,尤其在AI深度學(xué)習(xí)方面,為校內(nèi)外生物學(xué)研究提供高效的計算支持。同時為計算生物學(xué)、深度學(xué)習(xí)、基因測序等多個研究組提供計算服務(wù)。包括測序儀的離線處理、序列搜尋比對分析、分子動力學(xué)模擬、計算機輔助藥物設(shè)計和分子對接、生物網(wǎng)絡(luò)的計算。

二、全力支持基于深度學(xué)習(xí)的分子圖編碼和基于深度學(xué)習(xí)的中藥方劑系統(tǒng)的研發(fā)。研發(fā)人員可以利用HPC高性能計算和AI平臺開發(fā)基于三維分子圖譜的深度學(xué)習(xí)編碼,進行基于深度學(xué)習(xí)的中醫(yī)診斷處方。多任務(wù)分子預(yù)測模型由卷積神經(jīng)網(wǎng)絡(luò)或遞歸神經(jīng)網(wǎng)絡(luò)構(gòu)成。交叉驗證用于調(diào)整和驗證參數(shù),外部數(shù)據(jù)用于測試和評估模型。同時,從預(yù)測模型中挖掘關(guān)鍵信息。同時通過卷積神經(jīng)網(wǎng)絡(luò)或遞歸神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)大量的方劑配伍信息,然后用主藥生成語義自動關(guān)聯(lián)分析得到的輔藥,從而生成新的方劑。藍海大腦HPC高性能計算和AI平臺提供了高效并行的計算資源,大大加快了模型的訓(xùn)練速度,從而在有效的時間內(nèi)完成最終的任務(wù)。

三、支持基于化學(xué)片段的從頭計算藥物設(shè)計,對疾病的治療和生物學(xué)功能的理解有重要的促進作用。傳統(tǒng)的藥物篩選過程耗時長,成本高,導(dǎo)致整個藥物設(shè)計和發(fā)現(xiàn)過程效率低下。為了加快藥物設(shè)計和發(fā)現(xiàn)的進程,研究人員利用這一平臺逐步發(fā)展了分子從頭設(shè)計的方法,并取得了良好的效果。研究人員通過蒙特卡洛樹搜索和神經(jīng)網(wǎng)絡(luò)模型的結(jié)合,實現(xiàn)了巨大化學(xué)空間的搜索和最優(yōu)結(jié)構(gòu)的采樣,快速完成了完整的從頭計算藥物設(shè)計過程,并探索了蛋白質(zhì)口袋表征和評分功能。

四、利用深度學(xué)習(xí)框架構(gòu)建深度學(xué)習(xí)模型,加強學(xué)習(xí)模型的訓(xùn)練,實現(xiàn)深度學(xué)習(xí)的評分函數(shù)模型的訓(xùn)練和測試,并對模型進行訓(xùn)練。對于模型生成的分子,通過聚類分析分子的合成、毒性和理化性質(zhì),選擇合適的分子。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8979

    瀏覽量

    85100
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5471

    瀏覽量

    120903
收藏 人收藏

    評論

    相關(guān)推薦

    施耐德電氣助力生命科學(xué)行業(yè)高質(zhì)量發(fā)展

    隨著全球市場迎來新的發(fā)展趨勢,生命科學(xué)行業(yè)在蓬勃發(fā)展的同時,也面臨著研發(fā)生產(chǎn)成本高、供應(yīng)鏈復(fù)雜、政策法規(guī)日趨嚴(yán)苛等挑戰(zhàn)與諸多不確定性。
    的頭像 發(fā)表于 10-31 15:43 ?176次閱讀

    細(xì)胞的“聚光燈”——前沿活細(xì)胞成像的案例分享

    進行推測,但已經(jīng)失“活”的細(xì)胞已經(jīng)無法反應(yīng)新陳代謝、信號傳導(dǎo)等生命活動,無法反應(yīng)活細(xì)胞的真實情況。因此活細(xì)胞顯微術(shù)越來越受到生命科學(xué)研究學(xué)者
    的頭像 發(fā)表于 10-24 08:04 ?187次閱讀
    活<b class='flag-5'>細(xì)胞</b>的“聚光燈”——前沿活<b class='flag-5'>細(xì)胞</b>成像的案例分享

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    閱讀這一章后,我深感人工智能與生命科學(xué)的結(jié)合正引領(lǐng)著一場前所未有的科學(xué)革命,以下是我個人的讀后感: 1. 技術(shù)革新與生命科學(xué)進步 這一章詳細(xì)闡述了人工智能如何通過其強大的數(shù)據(jù)處理和分析
    發(fā)表于 10-14 09:21

    激光引擎改善生命科學(xué)應(yīng)用

    傳輸系統(tǒng)相結(jié)合,簡化了熒光顯微鏡專家和流式細(xì)胞儀 OEM 的對準(zhǔn)和集成任務(wù)。 如今,生命科學(xué)領(lǐng)域成功應(yīng)用的大多數(shù)光子學(xué)技術(shù)都基于某種形式的熒光檢測。這些技術(shù)包括研究人員用于活細(xì)胞成像的共聚焦顯微鏡、為臨床血
    的頭像 發(fā)表于 09-05 06:20 ?227次閱讀
    激光引擎改善<b class='flag-5'>生命科學(xué)</b>應(yīng)用

    一種用于微液滴中單細(xì)胞無標(biāo)記分析的液滴篩選(LSDS)方法

    基于液滴的單細(xì)胞分析是一種非常強大的工具,可用于以單細(xì)胞分辨率研究表型和基因組異質(zhì)性,從而解決各種生物問題。
    的頭像 發(fā)表于 03-26 11:17 ?480次閱讀
    一種用于微液滴中<b class='flag-5'>單細(xì)胞</b>無標(biāo)記<b class='flag-5'>分析</b>的液滴篩選(LSDS)方法

    合肥高新區(qū)與雪湖科技簽署生命科學(xué)超算總部項目,聚焦生物科技和新材料領(lǐng)域

    此次計劃,雪湖科技擬斥資3億元,在合肥高新區(qū)打造生命科學(xué)超算總部。該建設(shè)旨在構(gòu)建專門用于生物醫(yī)藥和新材料研發(fā)的高性能計算集群。
    的頭像 發(fā)表于 03-06 15:34 ?540次閱讀

    冷鏈物流溫度監(jiān)測解決方案,確保從生產(chǎn)端到患者端的制藥供應(yīng)鏈合規(guī)性和產(chǎn)品穩(wěn)定性

    全球制藥、醫(yī)療保健、生命科學(xué)和生物制品物流市場先進療法(細(xì)胞基因)和生物制劑的生產(chǎn)線非常龐大。由于高度個性化,這些醫(yī)療方法大多需要高質(zhì)量的超低溫儲存和運輸。這些療法的冷凍或運輸過程中
    的頭像 發(fā)表于 02-23 08:04 ?459次閱讀
    冷鏈物流溫度監(jiān)測<b class='flag-5'>解決方案</b>,確保從生產(chǎn)端到患者端的制藥供應(yīng)鏈合規(guī)性和產(chǎn)品穩(wěn)定性

    淺析推動生命科學(xué)發(fā)展的光泵半導(dǎo)體激光(OPSL)技術(shù)(三)

    OPSL在流式細(xì)胞儀及DNA測序領(lǐng)域的應(yīng)用及新進發(fā)展。 OPSL 擁有波長可靈活擴展、功率可調(diào)、體積小巧、高度可靠以及高光電轉(zhuǎn)換效率等特點,在許多生命科學(xué)應(yīng)用中大獲成功。此外,OPSL還具有噪聲低、光束質(zhì)量優(yōu)異、直接數(shù)字調(diào)制的特點以及光纖耦合選項,其緊湊型結(jié)構(gòu)、智能化即插
    的頭像 發(fā)表于 02-01 06:33 ?457次閱讀
    淺析推動<b class='flag-5'>生命科學(xué)</b>發(fā)展的光泵半導(dǎo)體激光(OPSL)技術(shù)(三)

    多波長激光引擎 - 生命科學(xué)儀器的未來

    流式細(xì)胞儀等生命科學(xué)儀器制造商越來越多地從分離的單臺激光器轉(zhuǎn)向激光引擎,后者是一種可定制的緊湊型集成組件,以特定應(yīng)用形式提供成形聚焦光束。 激光器會產(chǎn)生一束光,要么是脈沖光,要么是連續(xù)波光。 幾乎
    的頭像 發(fā)表于 01-31 06:31 ?261次閱讀

    淺析推動生命科學(xué)發(fā)展的光泵半導(dǎo)體激光(OPSL)技術(shù)(一)

    具備高性能、高可靠性、低使用成本等優(yōu)勢。 ▼ 應(yīng)用背景要求 數(shù)十年來,可見光和紫外光連續(xù)激光器已在醫(yī)學(xué)診斷、生物成像和其他生命科學(xué)應(yīng)用領(lǐng)域的各種儀器中得到廣泛應(yīng)用。典型的應(yīng)用實例包括流式細(xì)胞儀、共聚焦顯微鏡、高通量基因測序、病毒
    的頭像 發(fā)表于 01-30 06:30 ?416次閱讀
    淺析推動<b class='flag-5'>生命科學(xué)</b>發(fā)展的光泵半導(dǎo)體激光(OPSL)技術(shù)(一)

    新技術(shù)在生物樣本冷凍中的應(yīng)用案例分析

    、生物分子等提供了重要的實驗手段。   新技術(shù)在生物樣液氮罐本冷凍中的應(yīng)用案例分析表明,這些創(chuàng)新方法為生物學(xué)研究提供了更高效、可靠和經(jīng)濟的樣本處理解決方案。低溫離心、冷凍探頭技術(shù)和
    發(fā)表于 12-26 13:30

    FactoryTalk PharmaSuite 適用于生命科學(xué)行業(yè)的制造執(zhí)行系統(tǒng)解決方案

    。 羅克韋爾自動化的? FactoryTalk PharmaSuite ? 是專為生命科學(xué)行業(yè)開發(fā)的 MES 解決方案,為 藥品生產(chǎn)的全生命周期 提供基于角色的優(yōu)化,讓用戶更快上手,并為 合規(guī)高效的生產(chǎn) 帶來保證,幫助 實現(xiàn)卓越
    的頭像 發(fā)表于 12-25 08:25 ?503次閱讀
    FactoryTalk PharmaSuite 適用于<b class='flag-5'>生命科學(xué)</b>行業(yè)的制造執(zhí)行系統(tǒng)<b class='flag-5'>解決方案</b>

    蔡司掃描電鏡與X射線顯微鏡檢測介紹

    蔡司代理三本精密儀器小編介紹SEM掃描電鏡與X射線顯微鏡是生命科學(xué)研究中的重要儀器,憑借其納米級分辨率,SEM掃描電鏡與X射線顯微鏡極大地提升了我們對生物超微結(jié)構(gòu)的認(rèn)識,-些亞細(xì)胞結(jié)構(gòu)
    的頭像 發(fā)表于 12-15 14:11 ?481次閱讀
    蔡司掃描<b class='flag-5'>電鏡</b>與X射線顯微鏡檢測介紹

    生成式AI正在如何改變醫(yī)療保健和生命科學(xué)?

    由于疫情的肆虐,近年來人們對醫(yī)療保健和生命科學(xué)領(lǐng)域的關(guān)注,也提升到了一個前所未有的高度。
    的頭像 發(fā)表于 12-09 10:52 ?1221次閱讀

    植入式超柔性微電極陣列實現(xiàn)大規(guī)模單細(xì)胞水平的神經(jīng)信號采集

    靈長類皮層長期埋植的超柔性微電極及配套植入方案,在實驗猴的視皮層和運動皮層進行了長期埋植及單細(xì)胞水平神經(jīng)信號記錄,并進行了運動腦機接口等功能驗證。該研究首次實現(xiàn)了使用超柔性微電極在非人靈長類中進行長期大規(guī)模單細(xì)胞水平的神經(jīng)信號采
    的頭像 發(fā)表于 11-23 17:00 ?689次閱讀
    植入式超柔性微電極陣列實現(xiàn)大規(guī)模<b class='flag-5'>單細(xì)胞</b>水平的神經(jīng)信號采集