在2019年的re:Invent大會(huì)上,當(dāng)亞馬遜AWS首席執(zhí)行官Andy Jassy進(jìn)行主旨演講時(shí),他意識(shí)到有關(guān)機(jī)器學(xué)習(xí)的內(nèi)容簡(jiǎn)直太多了,僅僅這一部分就花了差不多75分鐘。
時(shí)間寶貴,但內(nèi)容更加重要,這促使AWS在一年后做出調(diào)整,在長(zhǎng)達(dá)三周的re:Invent 2020上,機(jī)器學(xué)習(xí)單獨(dú)拿出來成為內(nèi)容擔(dān)當(dāng)。AWS機(jī)器學(xué)習(xí)副總裁Swami Sivasupamanian親自登臺(tái)講解,美國(guó)IT媒體 SiliconANGLE評(píng)價(jià),AWS發(fā)布的信息和一系列發(fā)布,“加強(qiáng)了其在機(jī)器學(xué)習(xí)領(lǐng)域的莊重承諾?!?/p>
機(jī)器學(xué)習(xí)不再“空中樓閣”
用Swami Sivasupamanian本人的話來評(píng)價(jià)機(jī)器學(xué)習(xí),它就是“我們這一代人將遇到的最具破壞性的技術(shù)之一。”這句話,在整個(gè)2020年都已經(jīng)被證實(shí)。
例如,疫情之下,零售商家試圖通過線上各個(gè)渠道拓展銷量,快速成為制勝法則。達(dá)美樂披薩使用機(jī)器學(xué)習(xí)進(jìn)行訂單管理,在客戶下單僅10分鐘左右之后,就能夠提供新鮮的披薩。
而在醫(yī)療領(lǐng)域,機(jī)器學(xué)習(xí)運(yùn)用的一個(gè)典型的應(yīng)用場(chǎng)景是,醫(yī)生用其來幫助判別病患腦部供血的狀況或是癌癥發(fā)展的狀況,這種行話被稱為“讀片”的操作,正極大地改善和輔助醫(yī)院的工作流程。
按照AWS公布的數(shù)據(jù),接入并使用AWS機(jī)器學(xué)習(xí)服務(wù)的客戶已經(jīng)超過10萬家,其中包括起亞、雅馬哈、美國(guó)宇航局、普華永道等,不同行業(yè)不同機(jī)構(gòu)的用戶,正在把自己的數(shù)據(jù)交給機(jī)器學(xué)習(xí)來分析。
“機(jī)器學(xué)習(xí)就是工具,越來越多的行業(yè)用戶開始使用工具,去更多地幫到他們的業(yè)務(wù)?!?在面向媒體和分析師的溝通會(huì)上,AWS大中華區(qū)云服務(wù)產(chǎn)品管理總經(jīng)理顧凡如此解釋,機(jī)器學(xué)習(xí)迅速滲透,是因?yàn)槠髽I(yè)發(fā)現(xiàn)新工具有用且好用。
具體到AWS層面,不斷夯實(shí)技術(shù),簡(jiǎn)化機(jī)器學(xué)習(xí)難度就是一直以來的主題,其中必須遵循的理念是:將機(jī)器學(xué)習(xí)交到更多應(yīng)用程序開發(fā)者和終端用戶手中,而他們無需機(jī)器學(xué)習(xí)經(jīng)驗(yàn);讓更多開發(fā)者應(yīng)用機(jī)器學(xué)習(xí),創(chuàng)造更好的終端用戶體驗(yàn)。
技術(shù)領(lǐng)先,產(chǎn)品以用戶為本,使用者自然紛至沓來。AWS公布的數(shù)據(jù)顯示,目前92%的基于Tensorflow框架的機(jī)器學(xué)習(xí)工作負(fù)載,91%的基于PyTorch框架的工作負(fù)載都跑在AWS云上。在一系列云服務(wù)商中,AWS體現(xiàn)了絕對(duì)優(yōu)勢(shì)。
總結(jié)AWS在機(jī)器學(xué)習(xí)上一直以來的努力,顧凡認(rèn)為,工具庫上的深度和廣度、開放心態(tài)以及一些必要的服務(wù)原則,是AWS被越來越多開發(fā)者和客戶信任的原因。
首先,機(jī)器學(xué)習(xí)是一個(gè)“Right tools for the right job”的事情,顧凡稱 “你希望運(yùn)行什么樣的工作,在什么樣的場(chǎng)景下,應(yīng)該選擇工具箱中什么樣的工具最適合?!?也就是一把鑰匙開一把鎖,合適的工具做合適的事兒。而AWS在機(jī)器學(xué)習(xí)服務(wù)上深度和寬度,能滿足用戶的不同需求。
其次,AWS力求采取開放包容的工具選擇策略,讓云端可以和客戶的整個(gè)環(huán)境做到良好的集成。不僅是機(jī)器學(xué)習(xí)框架和接口標(biāo)準(zhǔn),在AI芯片選型、計(jì)算實(shí)例上,也可以讓用戶根據(jù)應(yīng)用的不同場(chǎng)景,自由選擇。簡(jiǎn)單來說,讓開發(fā)者自行選擇最具成本效益的云基礎(chǔ)架構(gòu)。
不過,機(jī)器學(xué)習(xí)的一個(gè)關(guān)鍵是“Know-How”(專業(yè)知識(shí)),同時(shí)要實(shí)現(xiàn)解決方案的產(chǎn)品化。但這并不容易,因?yàn)槿瞬牌嫒?,有時(shí)候,懂技術(shù)的人往往不懂業(yè)務(wù),懂業(yè)務(wù)的人往往不懂技術(shù)。對(duì)此,AWS有必要向客戶“授人以漁”,為客戶賦能。
“當(dāng)客戶真正在工程方面有差距的時(shí)候,在產(chǎn)品原型實(shí)現(xiàn)方面需要幫忙的時(shí)候,我們會(huì)把客戶扶上馬再送一程,真正幫他/她快速地把一些業(yè)務(wù)難題,先用產(chǎn)品原型的方式把它實(shí)現(xiàn)出來?!鳖櫡舱f。
最終,在用戶不斷的機(jī)器學(xué)習(xí)實(shí)踐中,復(fù)雜的“數(shù)據(jù)分析”及“AI計(jì)算”需求將持續(xù)爆發(fā),專業(yè)的云計(jì)算服務(wù)商和數(shù)字化技術(shù)服務(wù)商價(jià)值將被快速釋放。
自下而上
AWS在這次re:Invent陸續(xù)發(fā)布了基于英特爾Habana AI加速芯片的實(shí)例、Amazon Kendra企業(yè)搜索、Amazon CodeGuru自動(dòng)代碼審核、Amazon Fraud Detector自動(dòng)欺詐檢測(cè)等功能和服務(wù),也借此更進(jìn)一步打牢基礎(chǔ)設(shè)施,拓展企業(yè)商用市場(chǎng),從云端到邊緣,實(shí)現(xiàn)對(duì)企業(yè)日常任務(wù)的重塑和改進(jìn)。
長(zhǎng)期觀察AI技術(shù)的IT專家們不難發(fā)現(xiàn),在洞悉機(jī)器學(xué)習(xí)的核心驅(qū)動(dòng)力后,這些功能發(fā)布背后的邏輯就已經(jīng)自然顯現(xiàn)了。它是自下而上的。
首先是基礎(chǔ)設(shè)施。
一個(gè)現(xiàn)象是,云計(jì)算廠商們?cè)诩夹g(shù)研發(fā)上的投入已經(jīng)不局限于基本的云技術(shù)本身,還投向了芯片、開發(fā)框架、邊緣計(jì)算、數(shù)據(jù)庫核心軟件等等。對(duì)于任何全棧云計(jì)算廠商而言,這些投入已經(jīng)不可或缺。但從機(jī)器學(xué)習(xí)的角度來看,用AWS的話來總結(jié),它們是打牢平臺(tái)能力的堅(jiān)實(shí)基矗
例如,AWS在這次re:Invent上推出機(jī)器學(xué)習(xí)訓(xùn)練芯片AWS Trainium,與標(biāo)準(zhǔn)的GPU實(shí)例相比,可帶來30%的數(shù)據(jù)吞吐量提升,并降低45%的單次引用成本。此外,AWS Trainium和AWS的機(jī)器學(xué)習(xí)推理芯片AWS Inferentia在SDK上保持一致。
值得一提的是,當(dāng)Habana芯片進(jìn)入AWS云服務(wù)的時(shí)候,被英特爾視為一次在云計(jì)算市場(chǎng)上對(duì)英偉達(dá)的重要?jiǎng)倮?。?shí)際上,真正的勝利者屬于AWS的用戶們,根據(jù)AWS測(cè)試顯示,Habana對(duì)機(jī)器學(xué)習(xí)任務(wù)這類云服務(wù)的性價(jià)比,能比目前基于GPU的云服務(wù)高40%。
無論英偉達(dá)GPU或英特爾Habana芯片,還是AWS自研機(jī)器學(xué)習(xí)芯片,在AWS上都永遠(yuǎn)是可選項(xiàng)。一方面,客戶選擇無比豐富,遠(yuǎn)遠(yuǎn)超過AWS的所有競(jìng)爭(zhēng)對(duì)手。另一方面,當(dāng)AWS選擇追求極致時(shí),大幅降低機(jī)器學(xué)習(xí)成本的暢想又讓客戶無法拒絕。
“如果只是依賴合作伙伴,很難把(機(jī)器學(xué)習(xí))性價(jià)比做到極致,這也是我們一再強(qiáng)調(diào)AWS Trainium和AWS Inferentia兩款芯片的原因,一個(gè)是機(jī)器學(xué)習(xí)訓(xùn)練里面的性價(jià)比的極致,一個(gè)是推理里面的性價(jià)比極致。” 顧凡說,AWS手握市面上絕大多數(shù)芯片,可任企業(yè)自由選擇。“但回到合作伙伴的關(guān)系上,無論是英特爾還是英偉達(dá),一定有不一樣的場(chǎng)景對(duì)客戶選擇是合適的,其中我們不會(huì)干預(yù)客戶的選擇?!?/p>
對(duì)于大多數(shù)機(jī)器學(xué)習(xí)用戶來說,AWS的 Amazon SageMaker是目前機(jī)器學(xué)習(xí)配置效率和性價(jià)比最高的選擇。
Amazon SageMaker是面向機(jī)器學(xué)習(xí)開發(fā)者的集成開發(fā)環(huán)境和完全托管服務(wù)。它依托多項(xiàng)工具,化繁為簡(jiǎn),使開發(fā)人員和數(shù)據(jù)科學(xué)家能夠從根本上更輕松、更快速地構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型,并降低成本。自2017年發(fā)布了SageMaker以來,SageMaker在機(jī)器學(xué)習(xí)開發(fā)者之間極受歡迎,成為AWS手中的機(jī)器學(xué)習(xí)大殺器。
反饋到業(yè)務(wù)上,一些客戶發(fā)現(xiàn),SageMaker“指導(dǎo)”下機(jī)器學(xué)習(xí)帶來的業(yè)務(wù)增長(zhǎng),就有點(diǎn)像是魔法了。
比如拉丁美洲在線食品配送公司iFood,每月訂單達(dá) 3060 萬份,在超過 1000 個(gè)城市中注冊(cè)了約 160000 家餐廳。iFood首席數(shù)據(jù)科學(xué)家Sandor Caetano表示,通過Amazon SageMaker,一方面,使用機(jī)器學(xué)習(xí)來改善顧客和餐廳的體驗(yàn),讓商家和商品的推薦更加智能和個(gè)性化。另一方面,體現(xiàn)在物流上的成績(jī)則是,由于路線優(yōu)化,配送人員的行程縮短了 12%。
而美國(guó)職業(yè)橄欖球大聯(lián)盟 (NFL) 則是體育運(yùn)動(dòng)中使用機(jī)器學(xué)習(xí)技術(shù)的先鋒,一方面,體育賽場(chǎng)天然是數(shù)據(jù)產(chǎn)生的高發(fā)地,選手和教練需要數(shù)據(jù)來指導(dǎo)賽場(chǎng)決策,這是賽事需要;另一方面,將掌握的數(shù)據(jù)運(yùn)用到實(shí)況轉(zhuǎn)播中,提升觀賽的沉浸感,這是商業(yè)需求。為此,NFL創(chuàng)建了名為Next Gen Stats (NGS) 的程序來采集數(shù)據(jù)。
關(guān)鍵在于,如何運(yùn)用這些寶貴的數(shù)據(jù)?美式橄欖球數(shù)據(jù)公司Pro Football Focus CEO、NBC體育解說員Cris Collinsworth就曾告訴界面新聞,“我們過去總讓老派、學(xué)界的人來為體育賽事出主意,而教練則通過比賽錄像來分析和指導(dǎo)運(yùn)動(dòng)員?!钡手拖嘛@而易見。
最終NFL選擇與AWS合作,因?yàn)闄C(jī)器學(xué)習(xí)進(jìn)入體育,意味著“思維方式的變化”,在效率和成本上均更優(yōu)。借助SageMaker,可以更快速有效地給出數(shù)據(jù)分析結(jié)果。一個(gè)例子是,當(dāng)NFL構(gòu)建、訓(xùn)練和運(yùn)行這些預(yù)測(cè)模型時(shí),時(shí)間從 12 小時(shí)縮短到 30 分鐘。
甚至比賽觀賞性也提高到一種從未達(dá)到過的程度。借助Amazon QuickSight商業(yè)智能工具,NFL 能夠在內(nèi)部獲得更深入的見解,同時(shí)還為球迷提供了與數(shù)據(jù)互動(dòng)的機(jī)會(huì)。俱樂部、廣播公司的人可以針對(duì)比賽,在面板上提問查詢,并極快地獲得回答。
來自客戶驚喜的反饋并不讓Swami Sivasupamanian意外,“SageMaker可以說是在AWS歷史上發(fā)展最快的一個(gè)云服務(wù)?!彼岬?,在過去一年中AWS已經(jīng)發(fā)布了超過50個(gè)SageMaker功能,目的就是讓客戶使用機(jī)器學(xué)習(xí)的過程更為容易。
回顧AWS在本次大會(huì)上SageMaker的功能發(fā)布,無論是數(shù)據(jù)特征提取器Data Wrangler,數(shù)據(jù)特征存儲(chǔ)庫Feature Store,還是自動(dòng)化工作流Pipelines,都和Swami Sivasupamanian提出的降低機(jī)器學(xué)習(xí)難度的宗旨毫無偏離,甚至多數(shù)時(shí)候,還會(huì)讓客戶感到驚喜。
比如Data Wrangler,其內(nèi)置了300多個(gè)數(shù)據(jù)轉(zhuǎn)換器,讓客戶無需編寫任何代碼,就可以將機(jī)器學(xué)習(xí)用到的特征進(jìn)行規(guī)范化、轉(zhuǎn)換和組合,被稱為“準(zhǔn)備機(jī)器學(xué)習(xí)數(shù)據(jù)的最快、最簡(jiǎn)單的方法”。Pipelines是第一個(gè)專為機(jī)器學(xué)習(xí)構(gòu)建的、方便易用的持續(xù)集成和持續(xù)交付服務(wù)。另外,大型復(fù)雜深度學(xué)習(xí)模型的分布式訓(xùn)練,可以將訓(xùn)練速度提升兩倍。
不難發(fā)現(xiàn),在AWS的努力下,SageMaker正在朝兩個(gè)方向的迭代:一方面,機(jī)器學(xué)習(xí)每一個(gè)步驟做得越來越細(xì)、做得越來越易用;然后,將復(fù)雜機(jī)器學(xué)習(xí)的工作流給串聯(lián)起來。比如,Data Wrangler的數(shù)據(jù)準(zhǔn)備工作流程就可以與 Amazon SageMaker Pipelines 無縫集成,以便用戶自動(dòng)執(zhí)行模型部署和管理。
這種串聯(lián)和無縫集成一定程度上令人著迷,也為開發(fā)者打開了“新世界”?!皩?shí)際上機(jī)器學(xué)習(xí)的工作流是可以被組織的,因?yàn)闄C(jī)器學(xué)習(xí)的流程中,要么有些步驟是串行的,一步一步走,要么有些步驟在某個(gè)環(huán)境下是可以并行的,但是它都可以被組織、被編排的?!鳖櫡舱f。
豐富且友好的機(jī)器學(xué)習(xí)工具在一定程度上加強(qiáng)了AWS上的用戶粘性。相比于其他平臺(tái),AWS的機(jī)器學(xué)習(xí)工具鏈更加完善可靠,這意味著當(dāng)用戶考慮使用機(jī)器學(xué)習(xí)時(shí),AWS總會(huì)在各種云服務(wù)可選項(xiàng)中脫穎而出。
責(zé)任編輯:YYX
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8306瀏覽量
131846 -
AWS
+關(guān)注
關(guān)注
0文章
418瀏覽量
24184
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論