為期兩天的 AICon 全球人工智能與機(jī)器學(xué)習(xí)技術(shù)大會(huì)已落下帷幕,作為一場(chǎng)面向各行業(yè) AI 中高層技術(shù)人員的盛會(huì),歷年 AICon 都吸引了業(yè)界頂級(jí)公司參與其中,今年也不例外,包括華為、AWS、阿里巴巴、騰訊等公司的 AI 專家們齊聚一堂,共同探討圍繞 AI 的產(chǎn)業(yè)變革機(jī)會(huì)與技術(shù)創(chuàng)新方向。
這場(chǎng)大會(huì)上所展示的 AI 落地案例、AI 技術(shù)實(shí)踐以及 AI 的工業(yè)化應(yīng)用,都在強(qiáng)調(diào)一個(gè)事實(shí):站在 2019 年 11 月的時(shí)間點(diǎn)去看,AI 之于各個(gè)行業(yè)的意義已經(jīng)不再是「是否有價(jià)值」,而是變成了「如何讓 AI 變得更有價(jià)值」。
與此同時(shí),在 5G 商用元年,全新通訊技術(shù)帶來的巨大潛力,正在傳遞到產(chǎn)業(yè)的各個(gè)鏈條,而云計(jì)算的持續(xù)進(jìn)化,已經(jīng)深刻影響到了從政府到大型企業(yè)的方方面面。
這也留給行業(yè)一個(gè)命題:當(dāng) 5G、AI 與云共同定義了這個(gè)時(shí)代,各個(gè)行業(yè)應(yīng)用 AI 的第一步從哪里開始?
參與這場(chǎng)大會(huì)的華為云給出了自己的一個(gè)回答:利用華為云的全棧全場(chǎng)景 AI 能力,開發(fā)者、企業(yè)可以快速駛?cè)?AI 開發(fā)、部署與應(yīng)用的賽道。
據(jù)了解,此次大會(huì)上,華為云進(jìn)一步展示了其全棧全場(chǎng)景的 AI 解決方案。具體來說,「全?!怪傅氖前?a target="_blank">芯片、芯片使能、訓(xùn)練和推理框架和應(yīng)用使能在內(nèi)的全堆棧方案;「全場(chǎng)景」則是將公有云、私有云、各種邊緣計(jì)算、物聯(lián)網(wǎng)行業(yè)終端以及消費(fèi)類終端在內(nèi)的全場(chǎng)景納入到 AI 的部署環(huán)境中。
那么,如何進(jìn)一步理解當(dāng)下 AI 開發(fā)、部署的痛點(diǎn),華為云全棧全場(chǎng)景的 AI 能力,又對(duì)開發(fā)者、企業(yè)有何意義?
接下來,我們來一一解讀。
1.AI 開發(fā)/部署所面臨的挑戰(zhàn)
對(duì)于任何一個(gè)行業(yè)來說,AI 開發(fā)、部署都是一個(gè)全新的挑戰(zhàn),而且這些挑戰(zhàn)也貫穿在 AI 開發(fā)、部署的始終。
首先,AI 算力需求旺盛且多樣化。自 2012 年以來,AI 計(jì)算能力需求早已超過摩爾定律,當(dāng)模型越發(fā)復(fù)雜,當(dāng)算力需求越來越大,開發(fā)者、企業(yè)所面臨的計(jì)算成本也在大幅上升。
另一方面,隨著物聯(lián)網(wǎng)以及即將到來的 5G 時(shí)代,AI 計(jì)算的場(chǎng)景也將變得多元化,從大型數(shù)據(jù)中心到迷你終端設(shè)備,不同場(chǎng)景下的計(jì)算需求、功耗成本以及計(jì)算延時(shí)也有著不同的需求。
這意味著,AI 開發(fā)者和企業(yè)需要強(qiáng)大、靈活以及多場(chǎng)景的算力。
其次,AI 框架與一站式 AI 平臺(tái)的需求。作為向下對(duì)接芯片、向上承載應(yīng)用的 AI 框架,業(yè)界目前流行的 TensorFlow 等,多為美國(guó)公司研發(fā)并開源出來的產(chǎn)品,且不說會(huì)不會(huì)受到國(guó)際大環(huán)境的影響,只談開源產(chǎn)品的本地化后續(xù)服務(wù),TensorFlow 等都很難直接適應(yīng)中國(guó)開發(fā)者的需求。
而面對(duì) AI 人才短缺的現(xiàn)實(shí),如何進(jìn)一步降低 AI 開發(fā)門檻成為行業(yè)的迫切需求,更進(jìn)一步,開發(fā)者和企業(yè)也需要一站式的 AI 開發(fā)環(huán)境,從而快速完成從數(shù)據(jù)標(biāo)注到模型部署的一整套工作流程。
第三,云、邊、端的訓(xùn)練和部署如何協(xié)同。這是一個(gè)擺在全行業(yè)面前的共同挑戰(zhàn), 相比于 AI 模型訓(xùn)練為數(shù)不多的技術(shù)選型(GPU,數(shù)據(jù)中心),AI 模型部署對(duì)于開發(fā)者、企業(yè)而言更復(fù)雜。這是因?yàn)椋珹I 部署所面臨的是紛繁復(fù)雜的設(shè)備環(huán)境,特別是在移動(dòng)設(shè)備、邊緣設(shè)備交織的業(yè)務(wù)場(chǎng)景里,如何高效完成模型從快速訓(xùn)練到快速部署,成為各行各業(yè) AI 從業(yè)者關(guān)注的命題。
2.華為云如何破解算力難題?
在 ICT 領(lǐng)域耕耘多年的華為,面對(duì) AI 領(lǐng)域開發(fā)、部署的難點(diǎn)、痛點(diǎn),提出了自己的一番思考。
正如上文所言,AI 計(jì)算需求在過去七年里迎來大爆發(fā),根據(jù) OpenAI 的統(tǒng)計(jì),自 2012 年至今,AI 算力需求增長(zhǎng)了 30 萬倍。
這帶來兩個(gè)顯著變化:其一,傳統(tǒng)的 CPU 已經(jīng)無法承擔(dān)起 AI 計(jì)算的需求;其二,業(yè)界對(duì)于 GPU、FPGA 與 NPU 的需求開始上升。
這正是華為昇騰芯片出現(xiàn)的行業(yè)背景。通過底層創(chuàng)新性的「達(dá)芬奇架構(gòu)」,使得華為昇騰芯片具備了在端邊云上擁有統(tǒng)一的計(jì)算架構(gòu),由此帶來了不僅是計(jì)算能力的大幅提升,而且還可以實(shí)現(xiàn)算法一次開發(fā),再順利遷移到其他場(chǎng)景的芯片上的能力。
以今年正式發(fā)布的的昇騰 910 芯片為例,其主要面向數(shù)據(jù)中心的云端AI訓(xùn)練,半精度 (FP16)算力達(dá)到256 Tera-FLOPS,整數(shù)精度 (INT8) 算力達(dá)到512 Tera-OPS,達(dá)到規(guī)格算力所需功耗僅310W,無論計(jì)算能力還是功耗,都屬業(yè)界領(lǐng)先水平。
與此同時(shí),基于「達(dá)芬奇架構(gòu)」,華為在端、邊、云都已推出了相應(yīng)芯片,這些芯片構(gòu)成了華為 AI 能力的最底層:芯片層/利用華為云的調(diào)度能力,滿足開發(fā)者、企業(yè)不同場(chǎng)景中的計(jì)算需求,而公有云「用多少付多少錢」的商業(yè)模式,可以大幅降低企業(yè)的 AI 計(jì)算成本。
3.從框架到一站式開發(fā)平臺(tái)的賦能
在 AI 開發(fā)流程里,華為將 MindSpore 作為統(tǒng)一訓(xùn)練和推理的開源框架。MindSpore 從設(shè)計(jì)開始,就確定了「AI 算法即代碼」的設(shè)計(jì)范式,可以大幅降低 AI 開發(fā)門檻;而在執(zhí)行模式中,基于 Ascend Native 的執(zhí)行引擎,能夠充分發(fā)揮昇騰芯片的強(qiáng)大算力;與此同時(shí),MindSpore 還具備了適配端、邊、云的能力,在統(tǒng)一架構(gòu)的基礎(chǔ)上,根據(jù)場(chǎng)景不同可大可小,最大限度滿足企業(yè)場(chǎng)景需求,并提供更好的資源效率和隱私保護(hù)。
值得一提的是,MindSpore 未來也將全面開源,不同行業(yè)的開發(fā)者,完全可以根據(jù)其自身業(yè)務(wù)需求,靈活擴(kuò)展和定制,將其應(yīng)用到更多硬件平臺(tái)之上,構(gòu)建自己的 AI 訓(xùn)練模型。
在開源框架 MindSpore 之上,華為還擁有一站式 AI 開發(fā)平臺(tái) ModelArts,這個(gè)平臺(tái)所肩負(fù)的,是如何為開發(fā)者/企業(yè)提供一整套基于云端的機(jī)器學(xué)習(xí)開發(fā)全流程服務(wù)。
2019 年 3 月份,ModelArts 在 AI 權(quán)威競(jìng)賽斯坦福大學(xué) DAWNBench 榜單中取得圖像識(shí)別訓(xùn)練和推理性能雙料冠軍,將模型訓(xùn)練時(shí)間大幅縮減的同時(shí)實(shí)現(xiàn)了超強(qiáng)推理性能。
來看一組具體數(shù)字,在訓(xùn)練性能方面,ResNet50_on_ImageNet上的測(cè)試結(jié)果顯示,當(dāng)采用128塊V100時(shí),華為云ModelArts上模型訓(xùn)練時(shí)間僅需4分08秒,與 2018年12月創(chuàng)下的9分22秒紀(jì)錄相比又快了一倍,比此前 fast.a(chǎn)i 在 AWS 平臺(tái)上的訓(xùn)練速度快4倍;在推理性能方面,華為云ModelArts識(shí)別圖片的速度是排名第二廠商的1.7倍、亞馬遜的 4 倍以及 Google 的 9.1倍。
ModelArts 能取得這樣的成績(jī),展現(xiàn)了其在機(jī)器學(xué)習(xí)平臺(tái)的技術(shù)優(yōu)化能力,通過技術(shù)創(chuàng)新降低機(jī)器學(xué)習(xí)平臺(tái)的使用成本,最終將技術(shù)紅利讓給企業(yè)和開發(fā)者。
值得一提的是,華為云 ModelArts 也踐行了華為公司「把復(fù)雜留給自己,把簡(jiǎn)單帶個(gè)客戶」的理念,內(nèi)置了自動(dòng)(機(jī)器)學(xué)習(xí)特性,通過算法實(shí)現(xiàn)模型訓(xùn)練的參數(shù)自動(dòng)化選擇和模型自動(dòng)調(diào)優(yōu),讓零 AI 基礎(chǔ)的業(yè)務(wù)開發(fā)者快速完成模型的訓(xùn)練和部署,甚至在一些場(chǎng)景中可以實(shí)現(xiàn)零代碼開發(fā) AI 模型。
比如在機(jī)器學(xué)習(xí)最耗時(shí)耗力的數(shù)據(jù)標(biāo)注中,ModelArts 通過內(nèi)置 AI 數(shù)據(jù)框架,以 AI 機(jī)制來治理數(shù)據(jù),再通過迭代訓(xùn)練解決標(biāo)注的數(shù)據(jù)量問題,這在數(shù)據(jù)量較大的場(chǎng)景中可百倍提升數(shù)據(jù)標(biāo)注效率。
再比如針對(duì) AI 開發(fā)全流程管理,ModelArts 內(nèi)置了可視化管理模塊,可以幫助開發(fā)者快速了解模型訓(xùn)練的進(jìn)展,ModelArts 提供了從數(shù)據(jù)、算法、訓(xùn)練、模型、服務(wù)全流程可視化管理,通過任意一個(gè)對(duì)象查看這個(gè)流程,真正做到了工作流的可視化。
值得一提的是,在技術(shù)創(chuàng)新到產(chǎn)品全流程思考之外,ModelArts 還在生態(tài)使能上有自己的思考。AI 市場(chǎng)就是其中一例,這是一個(gè)基于 ModelArts 構(gòu)建的開發(fā)者生態(tài)社區(qū),提供了 AI 模型、API 交易、數(shù)據(jù)、競(jìng)賽案例等內(nèi)容共享功能。
在這個(gè)市場(chǎng),不管是科研機(jī)構(gòu)還是 AI 應(yīng)用開發(fā)商、解決方案集成商,抑或是不同行業(yè)不同類型的企業(yè),都可以快速找到符合自身需求的技術(shù)或商業(yè)機(jī)會(huì),有效連接 AI 開發(fā)生態(tài)鏈各參與方,加速 AI 產(chǎn)品的開發(fā)與落地,也保障了 AI 開發(fā)生態(tài)鏈上各個(gè)參與方的商業(yè)利益。
4. 高效可信的云端 AI 開發(fā)環(huán)境
如何將芯片帶來的計(jì)算能力與框架/平臺(tái)釋放的場(chǎng)景能力更便捷地交付給開發(fā)者,華為還為 AI 開發(fā)準(zhǔn)備了一整套基于 CloudIDE 與 CodeHub 的高效可信開發(fā)環(huán)境。
首先,CloudIDE 定義了一種全新的在線編程體驗(yàn),開發(fā)者只需通過瀏覽器即可訪問云端集成的開發(fā)環(huán)境,無須擔(dān)心安裝過多軟件所帶來的本地資源消耗;其內(nèi)置了主流技術(shù)棧、支持 100 +語言的語法高亮,同時(shí)還能在線調(diào)試與在線運(yùn)行;而利用云端按需獲取的方式,開發(fā)者可以靈活配置開發(fā)所需的計(jì)算與存儲(chǔ)資源,并根據(jù)需求彈性擴(kuò)容。
與此同時(shí),CloudIDE 與華為面向終端設(shè)備的 AppGallery Connect 形成了有效協(xié)同。對(duì)于移動(dòng)設(shè)備開發(fā)者、企業(yè)的開發(fā)需求,可以提供包括計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、數(shù)據(jù)庫及 AI 在內(nèi)的等公有云資源,幫助開發(fā)者降低應(yīng)用開發(fā)部署的難度和成本,從而讓他們更專注于提升應(yīng)用體驗(yàn)與打造優(yōu)質(zhì)內(nèi)容。
其次,華為云在開發(fā)代碼托管中做出了一系列創(chuàng)新,比如企業(yè)最關(guān)注的代碼安全性,華為云的 CodaHub 從訪問安全性到存儲(chǔ)安全性再到 對(duì) Git-Crypt 的支持,全方面提升安全性。
更進(jìn)一步,CodeHub 的代碼模版共享計(jì)劃,開發(fā)者或企業(yè),可以將自己的項(xiàng)目作為一個(gè)代碼模版開放出來,提供給行業(yè)共同使用,這不僅體現(xiàn)了「我為人人、人人為我」的開源精神,也可以讓更多開發(fā)者通過「站在巨人肩膀上」的方式,實(shí)現(xiàn)更多創(chuàng)新。
第三,DevCloud 上述兩大服務(wù)與 AI 開發(fā)的全面協(xié)同效應(yīng)。正如上文所言,CloudIDE 具備隨時(shí)可取云端開發(fā)資源的能力,這也意味著,利用 CloudIDE,開發(fā)者可以快速搭建 AI 開發(fā)環(huán)境,而通過 ModelArts SDK的樣例模板,可以快速構(gòu)建自己的項(xiàng)目。
在整個(gè)過程中,開發(fā)者和企業(yè)根據(jù)自己的業(yè)務(wù)需求,定制不同的計(jì)算/存儲(chǔ)資源,快速部署 AI 項(xiàng)目開發(fā)環(huán)境,然后引入 ModelArts 的 SDK,直接可以在 ModelArts 上完成訓(xùn)練與部署的一站式開發(fā),其成本也僅僅是使用云服務(wù)的成本。
5.寫在最后:中國(guó) AI 開發(fā)進(jìn)入黃金時(shí)代
無論是將 AI 定義為第四次技術(shù)革命的主要技術(shù)還是將其看作為一種通用目的技術(shù),AI 之于各行各業(yè)的意義已經(jīng)在過去幾年初現(xiàn)出來——它將重構(gòu)眾多行業(yè)數(shù)十年甚至上百年的游戲規(guī)則,并帶來一次巨大的技術(shù)與商業(yè)創(chuàng)新。
這是技術(shù)帶來產(chǎn)業(yè)的新機(jī)遇。當(dāng)國(guó)家層面的 AI 政策紅利不斷釋放,當(dāng)我國(guó)的 AI 算法、學(xué)術(shù)研究屢次獲得國(guó)際贊譽(yù),當(dāng)各行各業(yè)開始擁抱 AI 的開發(fā)、部署與應(yīng)用,如何為 AI 開發(fā)落地提供一整套解決方案,無疑成為擺在中國(guó)科技巨頭們面前的重要課題。
華為云正是其中一個(gè)重要玩家。
基于「達(dá)芬奇架構(gòu)」芯片賦能,為整個(gè) AI 領(lǐng)域不斷上漲的算力提供了解決方案,滿足開發(fā)者、企業(yè)對(duì)于 AI 強(qiáng)大算力、多場(chǎng)景算力的需求;利用 MindSpore 和 ModelArts 的場(chǎng)景賦能,在大幅降低 AI 開發(fā)門檻、加速企業(yè) AI 開發(fā)的同時(shí),還將利用開源持續(xù)推進(jìn)中國(guó)自研 AI 框架的發(fā)展;圍繞 CloudIDE 的云端開發(fā)環(huán)境,既可以釋放華為在 AI 芯片與 AI 框架的核心能力,還可以釋放華為云的產(chǎn)業(yè)紅利。
上述三個(gè)方面,構(gòu)成了觀察華為云全棧全場(chǎng)景 AI 戰(zhàn)略的一個(gè)橫切面。
華為依托自身在 ICT 領(lǐng)域的技術(shù)積累,過去幾年迅速形成了一套從數(shù)據(jù)中心到邊緣設(shè)備的 AI 軟硬產(chǎn)品線以及解決方案,從自研芯片到自主框架,從一站式開發(fā)平臺(tái)到云端開發(fā)集成環(huán)境,華為將一系列 AI 軟硬件產(chǎn)品以華為云公有云的方式使能各行各業(yè),加速各行各業(yè)步入 AI 開發(fā)、應(yīng)用的快車道,實(shí)現(xiàn)行業(yè)數(shù)字化、智能化的變革。
一個(gè)可能的場(chǎng)景是,隨著包括華為云在內(nèi)的中國(guó) AI 基礎(chǔ)設(shè)施服務(wù)商的快速發(fā)展,未來中國(guó)最好的 AI 應(yīng)用一定是由中國(guó) AI 芯片(昇騰芯片)驅(qū)動(dòng)的 AI 框架與開發(fā)平臺(tái)(MindSpore+ModelArts)和云端開發(fā)環(huán)境(CloudIDE+CodeHub)所開發(fā),并運(yùn)行在中國(guó)最領(lǐng)先的云服務(wù)之一(華為云鯤鵬云服務(wù))之上,這個(gè)屬于中國(guó) AI 的黃金時(shí)代正在到來。
評(píng)論
查看更多