谷歌 AI芯片
2018年7月Google在其云端服務年會Google Cloud Next上正式發(fā)表其邊緣(Edge)技術,與另兩家國際公有云服務大廠Amazon/AWS、Microsoft Azure相比,Google對于邊緣技術已屬較晚表態(tài)、較晚布局者,但其技術主張卻與前兩業(yè)者有所不同。
Google AI布局逐漸走向邊緣
除了同樣提倡基礎的物聯(lián)網(wǎng)閘道器(IoT Gateway)軟件Edge IoT Core、人工智能/機器學習(AI/ML)軟件Edge ML外,還針對人工智能/機器學習推出專屬的加速運算芯片,稱為Google Edge TPU,成為此次盛會一大焦點。
在Google發(fā)表Edge TPU前已發(fā)表過Cloud TPU芯片,首次發(fā)表是在Google另一個更全面、更盛大的例行年會Google I/O 2016上。Cloud TPU顧名思義用于云端機房,而TPU是TensorFlow Processing Unit的縮寫,言下之意是針對TensorFlow而設計的硬件加速運算器,TensorFlow則是Google于2015年11月提出的人工智能框架,是目前諸多人工智能框架中的一大主流,其他知名的框架如Caffe/Caffe 2、Apache MXnet等。
目前人工智能框架百花齊放,其他常見的亦有Keras、PyTorch、CNTK、DL4J、Theano、Torch7、Paddle、DSSTNE、tiny-dnn、Chainer、neon、ONNX、BigDL、DyNet、brainstorm、CoreML等。若以簡單譬喻而言,人工智能的開發(fā)撰寫如同文書撰寫,人工智能框架就如同記事本、Word等文書處理器,功效在于協(xié)助與便利開發(fā)撰寫。
Google自行開發(fā)設計的Cloud TPU僅用于自家云端機房,且已對多種Google官方云端服務帶來加速效果,例如Google街景圖服務的文字處理、Google相簿的照片分析、乃至Google搜尋引擎服務等。Google Cloud TPU也改版快速,2016年首次發(fā)表后2017年推出第二代,2018年推出第三代芯片
不過,Google之后對Cloud TPU的技術態(tài)度似有變化。2018年2月宣布可申請租用TPU運算力,如同Google Cloud Platform(GCP)的公有云服務般,依據(jù)運算芯片的使用時間計費,每小時6.5美元(至2018年9月已降至4.5美元) ,與GCP的CPU租用服務相比相當昂貴,GCP的CPU租用服務,以***彰化濱海工業(yè)區(qū)的機房(不同位置的機房費率不同)而言,標準型計價約在0.055至5.28美元間,且8種計費費率中有5種低于1美元/小時。
TPU租用費亦同樣高于GPU租用,GCP的NVIDIA GPU租用費率約在0.49至2.48美元間,視規(guī)格等級而異(Tesla K80/P100/V100)。Google Cloud TPU雖可租用,但Google是否愿意單獨銷售Cloud TPU給系統(tǒng)商,讓系統(tǒng)商制造及銷售TPU運算系統(tǒng),仍待進一步觀察。
在Google推出云端用的Cloud TPU后,讓人未預料的是Google也針對邊緣提出專屬的TPU芯片,然在此前仍有些征兆,即2017年11月Google提出輕量版的TensorFlow Lite(某種程度取代此前的TensorFlow Mobile),使電力有限的行動裝置也能支援TensorFlow,2018年推出的Edge TPU芯片即是以執(zhí)行TensorFlow Lite為主,而非原宗的TensorFlow。
Google Edge裝置內(nèi)的作業(yè)系統(tǒng)為Linux或Android Things,而后執(zhí)行Google Edge IoT Core基礎功能軟件、Google Edge ML人工智能軟件,并可選用配置Google Edge TPU。
Google Edge軟硬件架構概觀
圖3左側為物聯(lián)網(wǎng)感測器,右側為Google云端系統(tǒng)及服務。另外Edge TPU也支援Android Neural Networks 神經(jīng)網(wǎng)路應用程式接口(API),簡稱NNAPI。NNAPI于在2017年12月Android 8.1釋出時一同提出,NNAPI可視為TensorFlow Lite、Caffe2等框架的基礎層。由此可知Edge TPU所支援呼應并加速的軟件,于2017年便已先行到位。
NNAPI可透過硬件抽象層與驅(qū)動程式,運用GPU、特定處理器或數(shù)位訊號處理器(DSP)等,使人工智能運算加速。資料來源:Google官網(wǎng)與Cloud TPU不同的是,Edge TPU估將由Google銷售給系統(tǒng)商,再由系統(tǒng)商配置于前端裝置內(nèi),包含感測器節(jié)點、裝置或閘道器內(nèi),Edge TPU不是自用或租用而是銷售。
Edge TPU技術輪廓
雖然Google對Cloud TPU、Edge TPU的技術資訊揭露均不多,但仍有若干資訊可推測其背后意向與考量。
首先是Google很明白Edge定位的系統(tǒng)運算力有限,所以Edge TPU的運算任務僅在于執(zhí)行已訓練完成的人工智能模型,即推測運算、推算工作(Inference,今日多譯成“推論”),真正要大量耗費運算力的模型訓練(Training),依然由充沛運算力的系統(tǒng)事先進行,如工作站、服務器、云端等,透過CPU/GPU/TPU進行訓練。
其次,Edge TPU強調(diào)可同時執(zhí)行處理多組每秒30張高清晰度畫質(zhì)的人工智能判別運算,顯示Edge TPU將用于視訊影像類的人工智能應用,且為即時判別(30FPS)。
更進一步的說明,Edge TPU只負責人工智能的加速判別、加速推算,僅為加速器、輔助處理器的角色。因此,必須與系統(tǒng)的主控芯片溝通聯(lián)系,這方面Edge TPU提供了兩種介接的方式,一是PCI Express接口,另一是USB接口。兩種接口均適合嵌入式設計,然PCI Express傳輸率較高,可避免傳輸瓶頸,而USB接口較可能定位在后裝型運用,即前端裝置已經(jīng)存在,但仍可透過USB連接Edge TPU,帶來加速效果。
也由于須與Edge裝置整合,因此Edge TPU設計之初已盡可能減少功耗,雖然Google官方并未正式揭露,但已表態(tài)將與Google合作的***工控系統(tǒng)商也表示,其典型功耗(Thermal Design Power, TDP)僅在1.8瓦,很明顯只要現(xiàn)成芯片封裝即可散熱,幾乎可不加散熱片,更不需要馬達風扇,便可讓Edge TPU正常運作。
至于Edge TPU支援的運算格式則為int8、int16,即8位元整數(shù)、16位元整數(shù)的人工智能模型推算,但無法進行更高位元數(shù)的整數(shù),或者是浮點數(shù)的運算,如16位元浮點數(shù)(FP16)。
Google一發(fā)表Edge TPU即有合作伙伴與應用的揭露,如南韓樂金(LG)將用于產(chǎn)線制造上;另外紐西蘭、澳洲、英國的Smart Parking公司(顧名思義是與智慧停車相關的方案商)也表態(tài)采用,Smart Parking不單采用Edge TPU,其后端系統(tǒng)也大量采用GCP服務;還有Xee公司將Edge TPU用于汽車駕駛輔助上,對影像與雷達資料進行研判,而后給予駕駛潛在危險警告,如路況變差、輪胎過度磨損等。目前所知Google將Edge TPU訴求于三個目標,即制造、零售、汽車。
Movidius與Edge TPU的瑜亮情結
在Google尚未推出Edge TPU芯片前,其實Google已有使用前端的人工智能加速芯片,2011年Google購并Motorola Mobility,而后于2014年將Motorola Mobility售給Lenovo,但Google仍保留下2個原屬于Motorola Mobility的研究專案,而未移轉(zhuǎn)給Lenovo,一是模組化手機專案Ara,另一是擴增實境技術專案Tango(此專案于2018年3月結束,改由ARCore技術接手)。
Google在2014年對外揭露Tango研究,此專案所發(fā)展的平板、手機等行動裝置,即配置了Movidius公司的VPU芯片,VPU即Vision Processing Unit之意,更具體而言是視訊類型的人工智能運算、推算加速芯片。
Movidius自身發(fā)展第一代VPU,而后在與Google合作Tango計畫時則為第二代VPU,稱為Myriad 2(芯片編號MA2150/MA2450,差別在于MA2150最高連接1Gbit記憶體,MA2450可至4Gbit)。不僅Google采用,包含多軸無人機大廠大疆亦用于無人機上。之后2016年英特爾(Intel)購并Movidius,接手后發(fā)展出第三代VPU,稱為Myriad X(芯片編號MA2085/MA2485,MA2085封裝內(nèi)無記憶體,MA2485內(nèi)含4Gbit記憶體)。
Movidius在被英特爾收購后,Google依然鐘愛Movidius技術。2017年底Google推出AIY Vision Kit的開發(fā)套件,該套件內(nèi)仍可見MA2450芯片的蹤影。AIY Vision Kit是Google用來推行其影像人工智能技術的評估套件,以樹莓派電腦(Raspberry Pi, RPi)為基礎提供擴充延伸的硬件配件,即可摸索與評估Google的影像人工智能技術。
而所謂的AIY是Google自創(chuàng)的復合字,是以人工智能(AI)與DIY(Do-It-Yourself自己動手做)二字疊合而成。事實上Google在推出Vision Kit的同時也有推出Voice Kit,可供摸索評估Google的語音人工智能技術,但語音的人工智能運算其運算負荷并不吃重,不需要專屬加速芯片。
從2014年的Tango到2017年底的AIY Vision Kit,Google均以第二代Movidius芯片為主,因此理論上順其發(fā)展,Google即便在Edge環(huán)節(jié)有其技術主張,認為可配置人工智能硬件加速芯片,應也會屬意Movidius,而非自行研發(fā)Edge TPU。
不過,最終Google提出了Edge TPU,因此不得不推測,英特爾購并Movidius后,Google可能認為后續(xù)新發(fā)展并不完全合乎期待,過往Movidius為小型獨立企業(yè)時,可能提供Google高度支援,然英特爾可能對Movidius技術資產(chǎn)的后續(xù)延伸與新走向有不同的想法。
對此可若干比較第三代Movidius Myriad X與Edge TPU,前者支援FP16的16位元浮點數(shù)推測運算及8位元整數(shù)推算,而Edge TPU如前述僅支援8位元整數(shù)及16位元整數(shù)推算;Movidius Myriad系列仍可能顧及潛在市場機會最大化,雖未廣泛支援多種AI框架,但至少支援兩種現(xiàn)階段主流框架,即TensorFlow與Caffe
Google可能對TensorFlow Lite寄予厚望,因而有專屬設計的加速芯片Edge TPU,Edge TPU可能一直維持比Movidius Myriad系列更低規(guī)(無浮點數(shù))、更專精(只支援TensorFlow Lite )的技術發(fā)展定位,更高階的需求仍會選用Movidius Myriad系列,兩者高低并用并行。
或者Google未來只屬意自家Edge TPU,只在云端外推行Edge TPU,并一直維持低階定位,不往更高階發(fā)展,或Edge TPU僅是首發(fā),未來將持續(xù)發(fā)展更高階的Edge TPU,如此將與英特爾Movidius競爭,甚在效能規(guī)格大幅強化后而與NVIDIA Xavier競爭。
認為Edge TPU將與Movidius競爭的另一支持,在于Edge TPU也將推出USB隨身碟型態(tài)的開發(fā)/運用套件,并同樣使用AIY之名推展。早于Movidius未被英特爾收購前,Movidius即有提供USB隨身碟型態(tài)的人工智能評估/運用套件(圖6),英特爾收購Movidius套件產(chǎn)品仍持續(xù),套件稱為NCS(Neural Compute Stick)。
另一需考量的是,雖然Google在技術布局上已逐漸同時注重軟硬件的均衡與呼應,自身對于硬件發(fā)展的主導與涉入也日深,但就過往經(jīng)驗而言Google的硬件技術策略仍經(jīng)常搖擺,甚在短期內(nèi)放棄,因此Edge TPU仍可能不是長期技術策略中的一環(huán),而是一個技術嘗試,特別是Cloud TPU、Edge TPU均為加速作用的輔助處理器,為選擇性使用,必要時仍可由其他芯片實現(xiàn)相同運算效果,或在英特爾、NVIDIA等芯片商給予更多技術發(fā)展承諾后,仍可能停止自有芯片發(fā)展路線。
其他產(chǎn)業(yè)推測也包含,Google Edge TPU的技術授權來自于Movidius,有可能初始使用Movidius技術與架構之后獨立發(fā)展,也可能持續(xù)向英特爾Movidius取得授權,而始終與英特爾Movidius主力銷售芯片保持區(qū)隔與技術落差時間。
Edge TPU后續(xù)策略、動向推測
展望未來,Edge TPU由于將提供給系統(tǒng)商,估計日后揭露的技術資訊將較Cloud TPU為多,Cloud TPU由于目前只在Google機房端配置,至多提供遠端租用,因此可以不揭露更多技術資訊,事實上Google對于第三代Cloud TPU所揭露的資訊,已明顯少于前二代。
倘若Edge TPU推展順遂,支持的系統(tǒng)伙伴日增,則可激勵Google更快速發(fā)展新版Edge TPU。若推展不如預期,則Google也可能自行推出官方版的Edge閘道器、Edge裝置,作為產(chǎn)業(yè)示范,或自始至終不投入官方版示范,直接停止Edge TPU后續(xù)發(fā)展。
評論
查看更多