由麻省理工學院助理教授Philip Harris和核科學實驗室博士后Dylan Rankin等國際科學家團隊測試的新機器學習技術(shù)可以在眨眼間發(fā)現(xiàn)大型強子對撞機(LHC)海量數(shù)據(jù)中的特定粒子特征。
MIT助理教授Philip Harris和核科學實驗室博士后Dylan Rankin等國際科學家團隊正在測試一種新的機器學習技術(shù),該技術(shù)可以在眨眼間在大型強子對撞機(LHC)浩瀚如海的數(shù)據(jù)中發(fā)現(xiàn)特定粒子特征。
新系統(tǒng)既復(fù)雜又迅速,可以在數(shù)據(jù)集不斷變大變復(fù)雜的情況下,讓我們得以一窺機器學習將在粒子物理學的未來發(fā)現(xiàn)中,會發(fā)揮怎樣舉足輕重的作用。
機器學習成為攻堅利器
大型強子對撞機每秒造成大約4000萬次碰撞。篩選如此大量數(shù)據(jù),需要強大的計算機,來識別其中需要科學家去關(guān)注的碰撞,無論是暗物質(zhì)還是希格斯粒子。
現(xiàn)在,費米實驗室(Fermilab),歐洲核子研究中心(CERN),麻省理工學院,華盛頓大學和其他地方的科學家們已經(jīng)測試了一種新的機器學習系統(tǒng),與現(xiàn)有方法相比,該系統(tǒng)可將處理速度提高30到175倍!
傳統(tǒng)方法目前每秒只能處理不到一個圖像。相比之下,新的機器學習系統(tǒng)每秒最多可以查看600張圖像。在訓練期間,系統(tǒng)學會挑選出一種特定類型的后碰撞粒子模式。
哈里斯說:“我們所識別的碰撞模式,頂夸克是大型強子對撞機上探測的基本粒子之一。能夠分析盡可能多的數(shù)據(jù)非常重要,每一條數(shù)據(jù)都帶有關(guān)于粒子如何相互作用的有趣信息?!?/p>
等目前的LHC升級完成后,數(shù)據(jù)將以前所未有的方式涌入;到2026年,17英里的粒子加速器預(yù)計將產(chǎn)生20倍于目前的數(shù)據(jù),同時圖像也將以比現(xiàn)在更高的分辨率拍攝。總而言之,科學家和工程師估計大型強子對撞機所需的計算能力是目前的10倍以上。
哈里斯繼續(xù)說道:“未來的挑戰(zhàn)迫在眉睫,隨著計算變得更加準確,以及探測出更加精確的效果,它變得越來越難?!?/p>
該項目的研究人員對他們的新系統(tǒng)進行了訓練,以識別頂夸克的圖像,這是最龐大的基本粒子類型,比質(zhì)子重180倍。
“通過我們提供的機器學習架構(gòu),就能夠獲得高質(zhì)量的科學質(zhì)量結(jié)果,與世界上最好的頂夸克識別算法相媲美,”哈里斯解釋說。“高速實施核心算法使我們能夠靈活地在最需要的關(guān)鍵時刻增強LHC計算?!?/p>
EB級的數(shù)據(jù)集也能輕松處理
憑借大型數(shù)據(jù)集和高數(shù)據(jù)采集速率,高性能和高吞吐量計算資源是實驗粒子物理計劃的基本要素。這些實驗在探測器技術(shù)的復(fù)雜性和粒子束的強度方面不斷增加。
因此,粒子物理數(shù)據(jù)集的大小正在增加,就像處理數(shù)據(jù)的算法的復(fù)雜性一樣。例如,大型強子對撞機(HL-LHC)的高亮度階段,將提供比當前LHC運行多15倍的數(shù)據(jù)。
HL-LHC將以40 MHz的速率碰撞質(zhì)子束,碰撞環(huán)境中每次碰撞的粒子數(shù)將是原來的5倍。
Compact Muon Solenoid(CMS)實驗將針對HL-LHC進行升級,讀取通道的數(shù)量將增加10倍。通過一系列在線過濾器,CMS旨在以5 kHz的速率存儲HL-LHC碰撞事件。
這樣的數(shù)據(jù)速率導(dǎo)致數(shù)據(jù)集的規(guī)模為EB級。未來的中微子實驗,如深層地下中微子實驗(DUNE)和宇宙學實驗、平方公里陣列(SKA),預(yù)計將產(chǎn)生百億億字節(jié)的數(shù)據(jù)集。
大規(guī)模粒子物理實驗面臨著高吞吐量計算資源的挑戰(zhàn)。在具有增強的并行化的專用硬件上新的異構(gòu)計算范例,例如現(xiàn)場可編程門陣列(FPGA),能夠提供具有極大潛在增益的解決方案。
機器學習算法在粒子物理中用于模擬,重建和分析中,不斷增長的應(yīng)用,自然地部署在這樣的平臺上。
實驗證明,機器學習推理的加速即Web服務(wù),代表了粒子物理實驗的異構(gòu)計算解決方案,只需要對當前計算模型的最小修改。
作為示例,我們重新訓練ResNet50卷積神經(jīng)網(wǎng)絡(luò),以展示LHC頂級夸克噴射標記的最先進性能,并應(yīng)用ResNet50模型和中微子事件分類的遷移學習。
使用Microsoft的Project Brainwave來加速ResNet50圖像分類模型,我們使用Brainwave作為云(邊緣或本地)服務(wù)的實驗物理軟件框架實現(xiàn)了60(10)毫秒的平均推斷時間,顯示了一個因素導(dǎo)致模型推斷延遲比傳統(tǒng)CPU推斷提高了30-175倍。
作為粒子物理計算模型的邊緣或云服務(wù),協(xié)處理器加速器可以具有更高的占空比,并且可能更具成本效益。
-
FPGA
+關(guān)注
關(guān)注
1625文章
21639瀏覽量
601358 -
圖像
+關(guān)注
關(guān)注
2文章
1081瀏覽量
40383 -
機器學習
+關(guān)注
關(guān)注
66文章
8357瀏覽量
132335
原文標題:MIT提出FPGA加速機器學習推理,提速175倍輕松處理EB數(shù)據(jù)集
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論