每年ISSCC的慣例是特邀演講環(huán)節(jié)(Plenary Session),該環(huán)節(jié)會邀請一批學(xué)術(shù)界和工業(yè)界的權(quán)威人士在ISSCC的第一天給所有聽眾做四個特邀演講,而這四個演講的主題通常是整個半導(dǎo)體行業(yè)最關(guān)注的主題。今年的特邀演講幾乎都是圍繞著人工智能以及相關(guān)技術(shù)展開,可見人工智能已經(jīng)成為了半導(dǎo)體行業(yè)公認(rèn)的下一代行業(yè)發(fā)展引擎。
第一個特邀演講來自于人工智能三巨頭之一并牽頭Facebook AI研究的Yann LeCun,他的本職工作是數(shù)學(xué)家,但是因為在人工智能,尤其是深度學(xué)習(xí)領(lǐng)域在數(shù)十年間做出了卓越的貢獻而被公認(rèn)為領(lǐng)袖人物。有趣的是,LeCun對于硬件也很感興趣,事實上在深度學(xué)習(xí)還沒有正式成為主流的2011年,LeCun就帶領(lǐng)研究團隊開發(fā)了一款深度學(xué)習(xí)加速芯片NeuFlow,因此邀請LeCun來ISSCC可謂是合情合理。在主題演講中,LeCun一方面回顧了深度學(xué)習(xí)的歷史,另一方面肯定了深度學(xué)習(xí)這一路走來和芯片的關(guān)系重大,尤其是沒有GPU提供高通量訓(xùn)練的能力可以說就不會有今天深度學(xué)習(xí)的輝煌。
展望未來,LeCun認(rèn)為深度學(xué)習(xí)將繼續(xù)和芯片關(guān)系密切,隨著AI加速芯片的普及,人工智能將能部署到更多場合;另一方面,隨著人工智能算法的演進,也會需要新一代的AI芯片,例如能高效處理動態(tài)網(wǎng)絡(luò)、圖網(wǎng)絡(luò)、稀疏網(wǎng)絡(luò)等新架構(gòu)的芯片,這一方面給芯片領(lǐng)域帶來的挑戰(zhàn),但是更多的則是帶來了更多機遇。
在LeCun之后的第二位特邀演講嘉賓是來自于韓國高等科學(xué)技術(shù)學(xué)院(KAIST)的Hoi-Jun Yoo教授。Yoo教授是機器學(xué)習(xí)和人工智能芯片領(lǐng)域的權(quán)威學(xué)者。早在21世紀(jì)第一個十年,當(dāng)機器學(xué)習(xí)和人工智能還未成為主流的時候,Yoo教授的研究組就已經(jīng)在深耕機器學(xué)習(xí)和人工智能芯片了,而在人工智能獲得認(rèn)可之后,Yoo教授的研究組憑借早年的積累成為了ISSCC的??停磕暝贗SSCC上都能發(fā)表數(shù)篇相關(guān)論文,而在今年更是被邀請成為特邀演講嘉賓。
Yoo教授的演講主要是關(guān)于AI芯片的,在回顧了之前自己研究組在可配置AI芯片、在線學(xué)習(xí)加速芯片、增強學(xué)習(xí)加速芯片領(lǐng)域的先驅(qū)性工作后,Yoo認(rèn)為下一步的AI芯片研究熱點可能會走向類腦計算的方向,因為在傳統(tǒng)馮諾伊曼架構(gòu)遇到明顯瓶頸之后,類腦計算帶來的高效率可能是下一步AI芯片效率進一步提升的關(guān)鍵。目前Yoo教授正在北京清華大學(xué)做訪問學(xué)者,讓我們期待他與清華大學(xué)的頂尖中國學(xué)者之間的合作能擦出更多火花。
在Yoo之后,來自埃因霍溫科技大學(xué)(TU/e)的Meint Smit為聽眾帶來了關(guān)于光器件與硅芯片集成的演講。眾所周知,數(shù)據(jù)中心是人工智能時代的重要基礎(chǔ)設(shè)施,而數(shù)據(jù)中心中的高速光互連則是數(shù)據(jù)中心的主心骨。在過去,光器件往往使用分立元件,這就大大增加了光互連的成本,增加了部署難度,同時也部分降低了性能,最關(guān)鍵的是使用分立器件無法享受到半導(dǎo)體行業(yè)的摩爾定律高速發(fā)展。我們最期待的是能將光器件和基于硅材料的半導(dǎo)體芯片直接集成在一起,從而一舉解決分立器件的幾大問題。
硅光子雖然獲得了不少成功,但是相比InP工藝,其性能較為有限,因此這次Smit的演講中主要介紹的是使用wafer級別的集成工藝將InP光器件和CMOS芯片集成到一起,并實現(xiàn)光-電協(xié)同設(shè)計,從而實現(xiàn)最優(yōu)性能,并且為光電行業(yè)的發(fā)展帶來新的活力。
最后,Intel為我們帶來了關(guān)于5G技術(shù)的展望。Intel在處理器之外,亟需找到下一個突破點,而在錯失上一波移動設(shè)備浪潮之后,Intel把賭注下在了智能化社會上面,而智能化社會則包括了人工智能、IoT等關(guān)鍵概念,其中5G將是智能化社會的重要組成部分,也是Intel的發(fā)力方向之一。
隨著5G的到來,海量設(shè)備將通過mMTC接入5G網(wǎng)絡(luò),對于可靠性和延遲要求很高的行業(yè)應(yīng)用(工業(yè)機器人,自動駕駛等)預(yù)計將使用URLLC接入5G,而消費類應(yīng)用則可望通過eMBB來獲得更高的帶寬以提升使用體驗。在這里,我們發(fā)現(xiàn)5G和之前1G-4G的關(guān)鍵不同在于,1G-4G的核心用戶是移動電話、短信、移動上網(wǎng)等消費類應(yīng)用,而5G規(guī)劃中則是行業(yè)應(yīng)用占了主要地位。針對這三類5G的應(yīng)用,Intel相應(yīng)介紹了其研發(fā)動向,包括針對mMTC的超低功耗喚醒接收機,功耗可低至95uW;針對URLLC的高可靠性低延遲射頻SoC,針對sub-6GHz頻帶,其物理層延遲可低至1ms;針對eMBB則有使用毫米波頻段的MIMO陣列芯片,可以提供超高速無線通信。
當(dāng)然,Intel最終的夢想還是希望能打通通信和處理器兩大市場,最終實現(xiàn)5G+AI的新范式。
AI芯片:進一步提升能效比
今年AI芯片相關(guān)的論文占據(jù)ISSCC總論文數(shù)接近10%,其熱度可見一斑。在今年ISSCC相關(guān)的AI芯片論文中,主要還是面向終端計算,以提升計算效率為主,主流計算效率已經(jīng)從2016年的0.1TOPS/W,2017年的1TOPS/W進化到了今年的10TOPS/W(清華劉勇攀教授甚至發(fā)表了140.3TOPS/W的AI芯片),而計算效率的提升則主要是靠稀疏化處理、混合信號計算以及內(nèi)存內(nèi)計算等方法來實現(xiàn)。
有趣的是,由于ISSCC的主要關(guān)注點是電路,因此發(fā)表的論文往往是電路優(yōu)化關(guān)系較大的終端計算AI芯片;而使用在云端的強算力AI芯片往往和處理器架構(gòu)關(guān)系較大,因此往往發(fā)表在ISCA、MICRO、HPCA等計算機架構(gòu)領(lǐng)域的會議上。
在今年的AI芯片中,三星發(fā)表的使用在移動設(shè)備中的NPU值得關(guān)注。該NPU在架構(gòu)上相比之前傳統(tǒng)NPU的最大區(qū)別在于對于稀疏網(wǎng)絡(luò)的支持,可以實現(xiàn)數(shù)倍的性能提升。此外,該NPU使用了8nm工藝,核心電壓可以低至0.5V,支持根據(jù)計算負(fù)載動態(tài)調(diào)整電源電壓以實現(xiàn)最優(yōu)能效比。在75%稀疏度的情況下峰值性能可達(dá)6.9TOPS,而在處理非稀疏網(wǎng)絡(luò)時也能實現(xiàn)1.9TOPS的峰值性能。應(yīng)該說,作為來自工業(yè)界的設(shè)計,三星這款芯片在新技術(shù)的應(yīng)用上屬于中規(guī)中矩,其主要優(yōu)勢仍然是來自于工程上的高度優(yōu)化,因此可以實現(xiàn)高達(dá)11TOPS/W的能效比。
同時,我們也看到,作為手機應(yīng)用NPU,其峰值性能提升速度遠(yuǎn)小于其能效比提升速度,這從另一個角度似乎也說明手機端的AI應(yīng)用目前的需求對于AI芯片性能提升的推動力尚不夠強,手機AI的真正爆款應(yīng)用還沒有真正出現(xiàn)。
另一個值得關(guān)注的方向是與新內(nèi)存器件結(jié)合的人工智能芯片。由于內(nèi)存性能提升速度低于晶體管性能提升速度,因此在目前主流處理器基于的馮諾伊曼架構(gòu)中,內(nèi)存已經(jīng)成為了整體性能的重要瓶頸。為了改善這個問題,新的內(nèi)存器件,包括內(nèi)存內(nèi)計算,就成了學(xué)術(shù)界探索的重要方向。而在近幾年,隨著人工智能主題的火熱,以及人工智能計算會牽涉到頻繁的內(nèi)存訪問,因此如何為了人工智能計算優(yōu)化內(nèi)存器件以及整體芯片架構(gòu)就成了關(guān)注的熱點。在本屆ISSCC上,計算-內(nèi)存協(xié)同優(yōu)化相關(guān)的論文共有七篇之多,其中即包括美國密歇根大學(xué)、中國東南大學(xué)等研究機構(gòu)分別提出的帶有計算功能的SRAM MACRO,也包括***國立清華大學(xué)、美國斯坦福大學(xué)等提出的基于ReRAM器件的內(nèi)存內(nèi)計算。
在這些計算-內(nèi)存協(xié)同優(yōu)化的論文中,值得關(guān)注的是清華大學(xué)劉勇攀教授研究組提出的STICKER-T芯片,該芯片結(jié)合了多方面的優(yōu)化。首先,在算法上,STICKER-T支持CirCNN架構(gòu),該算法架構(gòu)對于深度學(xué)習(xí)中的權(quán)重矩陣拆分為多個自矩陣,并且通過訓(xùn)練使得每個子矩陣都是循環(huán)矩陣,這樣一來傳統(tǒng)的矩陣相乘計算即可轉(zhuǎn)化為FFT+元素相乘+IFFT,從而極大地節(jié)省了計算量,同時對于分類精度的損失也在可控范圍內(nèi)。
此外,STICKER-T使用了轉(zhuǎn)置SRAM (T-SRAM),T-SRAM可以實現(xiàn)按行寫入而按列讀出,從而大大改善了內(nèi)存訪問效率。在結(jié)合算法、電路和器件三方面的優(yōu)化后,STICKER-T可以實現(xiàn)130TOPS/W的高能效比。STICKER-T的優(yōu)越性能也告訴我們,如果能從上至下將多個層面的創(chuàng)新結(jié)合在一起,將釋放出非常大的能量,實現(xiàn)極大的性能提升。
醫(yī)療與健康:另一個藍(lán)海市場
除了AI之外,另一個本屆ISSCC關(guān)注的熱點是醫(yī)療健康相關(guān)的芯片,在ISSCC 2019共有三個相關(guān)議程(Diagnostics, Technologies for Human Interaction & Health以及Physiological Monitoring)。
在相關(guān)的論文中,我們看到研究者們的努力集中在分子級別診斷以及特定生理信號監(jiān)控兩方面。分子級別診斷主要是指通過設(shè)計專用傳感器和芯片,能夠快速讀出血液等生物樣本中是否含有特定成分,從而能快速實現(xiàn)診斷,以及幫助一些疾病的早期篩查。舉例來說,目前診斷細(xì)菌感染往往需要用病人的樣本做細(xì)菌培養(yǎng),這樣的診斷需要花數(shù)天甚至更多的時間,從而為積極治療帶來了阻礙。而使用生物芯片則可以直接通過判斷血液樣本中是否含有特定細(xì)菌的DNA片段來完成快速診斷,從而將診斷時間縮短到了一小時之內(nèi)。
這類生物芯片往往需要一些特別的生化傳感器并且對于信號讀取電路的靈敏度有很高的要求,因此如何將這些生化傳感器集成在CMOS芯片中并且設(shè)計相應(yīng)的讀取電路就成了最大的挑戰(zhàn)。在今年的ISSCC,我們看到了來自于美國InSilixa、韓國延世大學(xué)、美國UCSD等研究機構(gòu)帶來的論文,分別描述了用于常規(guī)DNA/分子檢測、VEGF標(biāo)記物檢測和磁性免疫檢測的電路芯片,能大大縮短診斷的時間并降低成本和儀器體積。
另一個健康相關(guān)芯片的重要應(yīng)用領(lǐng)域是生理信號檢測,例如心電信號ECG、生物阻抗信號BioZ和腦電信號EEG。ECG和BioZ檢測主要應(yīng)用于可穿戴設(shè)備以實現(xiàn)心臟以及呼吸信號的連續(xù)監(jiān)控,從而對于心血管和呼吸疾病的管理與監(jiān)控。在這個領(lǐng)域,我們看到了來自歐洲IMEC、韓國KAIST和中國上海交通大學(xué)的相關(guān)研究成果,能以非常低的功耗(<1mW)實現(xiàn)高靈敏度的信號檢測和讀出,從而為可穿戴設(shè)備的健康檢測功能帶來新的進步。
另一方面,EEG則可以實現(xiàn)腦部信號的實時監(jiān)控,并結(jié)合腦部電刺激對于癲癇等疾病實現(xiàn)閉環(huán)控制,我們看到了來自于美國哥倫比亞大學(xué)、UCSD和加拿大多倫多大學(xué)的相關(guān)論文。EEG除了做健康相關(guān)監(jiān)控之外,可望還能實現(xiàn)未來的腦機接口,這也將是一個新機會。
結(jié)語
隨著ISSCC 2019落下帷幕,我們看到了過去一年半導(dǎo)體芯片研究的最新進展。今年ISSCC關(guān)注的兩大熱點分別是AI和醫(yī)療健康,這兩大熱點也分別代表了先進生產(chǎn)力方向以及人類對于美好生活的追求。歸根到底,芯片還是要以人為本。讓我們在新的一年繼續(xù)努力,也希望能在新的一年中看到半導(dǎo)體芯片行業(yè)更多新成果誕生。
-
半導(dǎo)體
+關(guān)注
關(guān)注
334文章
26910瀏覽量
214655 -
人工智能
+關(guān)注
關(guān)注
1791文章
46698瀏覽量
237185 -
高效率
+關(guān)注
關(guān)注
0文章
31瀏覽量
10425
發(fā)布評論請先 登錄
相關(guān)推薦
評論