說(shuō)起近年來(lái)手機(jī)上出現(xiàn)的新玩意兒,AI芯片可能是其中最耀眼的明星。無(wú)論是安卓陣營(yíng)還是iOS陣營(yíng),旗艦級(jí)別手機(jī)所使用的SoC中,AI算力總能成為著力吆喝的賣(mài)點(diǎn)。例如最近華為發(fā)布麒麟990芯片,其AI模塊的算力相比前代大幅提升數(shù)倍,甚至登頂安卓陣營(yíng)AI Benchmark榜單;而在最新發(fā)布的iPhone 11當(dāng)中,所使用的A13 Bionic仿生芯片也表現(xiàn)不俗,性能提升20%,每秒可執(zhí)行1萬(wàn)億次運(yùn)算??梢哉f(shuō),AI芯片目前已經(jīng)進(jìn)入到了軍備競(jìng)賽階段。
iPhone 11所使用的A13 Bionic芯片,AI性能是歷代之最
然而,和性能提升可以直觀感受到的CPU、GPU模塊不同,SoC當(dāng)中的AI性能攀升,其實(shí)際應(yīng)用場(chǎng)景一直令很多朋友感到迷?!狝I這么強(qiáng),日常使用的APP似乎也沒(méi)太大變化,游戲該咋玩還是咋玩。但AI芯片是否真的雞肋?這也未必。
軟件應(yīng)用往往滯后于硬件發(fā)展。觸摸屏并非是什么新鮮事物,但直到iOS橫空出世才讓人找到正確的交互方式;NFC早在安卓2.X時(shí)代就已經(jīng)實(shí)裝,但直到近年才迎來(lái)各種支付應(yīng)用的廣泛支持。
AI芯片目前的應(yīng)用范圍并不廣,大家可以感受到的,可能就是相機(jī)中場(chǎng)景的AI識(shí)別、人臉認(rèn)證等等。隨著AI芯片算力的提升、軟件應(yīng)用的完善,未來(lái)的APP到底能進(jìn)化到怎樣的神奇地步?今天一起來(lái)聊聊吧。
·為何手機(jī)需要AI芯片?
作為近年最熱門(mén)的話題之一,AI這一字眼頻頻出現(xiàn)在各類科技資訊當(dāng)中。而谷歌開(kāi)發(fā)的圍棋AI Alpha Go一舉擊敗李世石、柯潔,更是令A(yù)I走進(jìn)了聚光燈下。和傳統(tǒng)的算法相比,AI能夠讓計(jì)算機(jī)的某些舉止更接近人類,例如能夠識(shí)別圖像內(nèi)容、識(shí)別句法語(yǔ)義等等,而這些,往往得益于使用神經(jīng)算法來(lái)進(jìn)行機(jī)器學(xué)習(xí)。
移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來(lái)令數(shù)據(jù)規(guī)模前所未有的龐大,這為AI提供了茁壯成長(zhǎng)的土壤。這些數(shù)據(jù)成為了AI極其有價(jià)值的樣本,人們通過(guò)神經(jīng)算法對(duì)這些樣本進(jìn)行卷積分類,進(jìn)行一遍又一遍的機(jī)器學(xué)習(xí),輸出了不同權(quán)重的結(jié)果,并以此作為識(shí)別行為事物的判斷依據(jù)。從這方面來(lái)看,AI的本質(zhì)是數(shù)據(jù)密集、算法先進(jìn)、分類權(quán)重細(xì)致的統(tǒng)計(jì)學(xué),通過(guò)不斷輸入數(shù)據(jù)、不斷卷積衡量權(quán)重,AI最終所能做出的判斷會(huì)無(wú)比接近甚至超越人類。
AI芯片能支持多種機(jī)器學(xué)習(xí)模型
由此可見(jiàn),AI是依賴特定的神經(jīng)算法實(shí)現(xiàn)的,這個(gè)任務(wù)交給普通的CPU來(lái)做,效率比較低下——CPU屬于通用計(jì)算單元,暴力運(yùn)行某種算法并非其特長(zhǎng),例如CPU挖礦的效率就遠(yuǎn)比不上專門(mén)為HASH算法特制的ASIC礦機(jī)芯片。而AI芯片正是為密集處理數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)算法特制的,例如華為的麒麟990就可以支持包括VGG、VDSR等在內(nèi)的90%視覺(jué)神經(jīng)網(wǎng)絡(luò)計(jì)算模型。
換言之,AI芯片能否發(fā)揮其功用,關(guān)鍵在于軟件應(yīng)用是否對(duì)相應(yīng)的神經(jīng)網(wǎng)絡(luò)算法有著良好的支持和運(yùn)用。隨著APP不斷進(jìn)化,AI會(huì)越來(lái)越多地應(yīng)用到實(shí)際當(dāng)中,出于算力和能效方面的考慮,AI芯片(模塊)的確必不可少。而當(dāng)AI芯片的性能日益強(qiáng)大時(shí),下面這些神奇的應(yīng)用可能會(huì)漸漸成為我們的日常。
·AI實(shí)時(shí)P視頻
在一些手機(jī)中,拍照APP可以通過(guò)AI來(lái)識(shí)別場(chǎng)景,然后成像風(fēng)格根據(jù)不同的場(chǎng)景變化,例如拍植物增加色彩的鮮艷度讓花朵綠葉更加?jì)善G欲滴,拍人像則增加柔光令皮膚更加白嫩等等。而在未來(lái),AI在圖像識(shí)別方面的應(yīng)用會(huì)更加廣泛,這在現(xiàn)在已經(jīng)可以看到一些苗頭。
AI既然可以辨認(rèn)出場(chǎng)景,自然也能辨認(rèn)出圖像中的事物。例如一張照片中,哪里是人臉,哪里是寵物,哪里是背景,AI都可以做到比較準(zhǔn)確的判斷。在這個(gè)前提下,AI實(shí)時(shí)“PS”視頻,也就成為了可能。
Google利用“卷積神經(jīng)網(wǎng)絡(luò)(CNN)”技術(shù)將人從視頻背景中摳出來(lái)
例如Google之前就展示了一項(xiàng)名為“卷積神經(jīng)網(wǎng)絡(luò)(CNN)”技術(shù),它是一種機(jī)器學(xué)習(xí)算法。該技術(shù)使用了數(shù)以萬(wàn)計(jì)的圖像數(shù)據(jù)用以機(jī)器學(xué)習(xí),并且專門(mén)分辨出“頭發(fā)”、“頸部”、“皮膚”等處的數(shù)據(jù),能夠輕而易舉地將人從背景中“摳”出來(lái),背景自然也可以實(shí)時(shí)更換。從演示來(lái)看,Google的這項(xiàng)技術(shù)的確效果拔群,很輕松就能夠在雜亂的背景中辨認(rèn)人像,然后只置換視頻中的背景,效果還非常自然。
Google利用AI實(shí)時(shí)視頻摳圖的演示
而相關(guān)的應(yīng)用在國(guó)內(nèi)也由開(kāi)展,而且可能很快就會(huì)和消費(fèi)者見(jiàn)面。華為在演示麒麟990的AI性能之時(shí),也呈現(xiàn)了令人吃驚的實(shí)時(shí)摳圖功能。在AI的作用下,視頻中的人物能夠隨時(shí)變更背景,非常神奇。
華為對(duì)AI技術(shù)的新應(yīng)用——實(shí)時(shí)P視頻
而AI算法顯然不僅僅能作用于背景,也可以作用于人像。前不久AI換臉APP“ZAO”的上線,引起了人們的熱烈討論。在ZAO應(yīng)用當(dāng)中,只要上傳一段視頻,即可通過(guò)AI算法將其中的人臉換成另一個(gè)人的,這種偽造身份的玩法的確令人感到驚愕。而在未來(lái)的AI應(yīng)用中,隨著算力的加強(qiáng),這一過(guò)程可能在手機(jī)中就能夠?qū)崟r(shí)完成,P一段子虛烏有的視頻,并非天方夜譚。
·AI去碼(圖像修復(fù))
看到這個(gè)小標(biāo)題,可能很多老司機(jī)就頓時(shí)不困了。如果說(shuō)AI實(shí)時(shí)P視頻只是將已有的元素重新組合,例如場(chǎng)景換成另一個(gè)場(chǎng)景、人臉換成另一張人臉等;而AI去碼,則可謂是憑空畫(huà)餅,將原本不存在的事物添加上去,這在很多場(chǎng)景下都有極大用途。
一般而言,去馬賽克是需要人類“腦補(bǔ)”的工作。從原理來(lái)看,馬賽克屬于不可逆運(yùn)算,把大量的小像素點(diǎn)合并到一個(gè)大的像素點(diǎn),并取平均色,就制造成了馬賽克——很顯然,你是難以知道被攪勻之前的各個(gè)小像素的顏色是如何排布的。一般來(lái)說(shuō),要消除馬賽克,需要人進(jìn)行想象腦補(bǔ),然后把缺失的內(nèi)容重新畫(huà)出來(lái)。而有了AI,人不再是必須了,Google Brain的算法能夠自動(dòng)去除馬賽克,騎兵自動(dòng)變步兵。
就算是不可名狀的馬賽克,AI技術(shù)也能修復(fù)成高清
Google Brain使用的是一種全新的像素遞歸超分辨率技術(shù),通過(guò)大量高、低分辨率的采樣學(xué)習(xí),然后得出規(guī)律來(lái)匹配修復(fù)結(jié)果。例如,Google Brain學(xué)習(xí)到了某種黑點(diǎn)是屬于眼鏡,那么在還原馬賽克的時(shí)候,就可以把這種黑點(diǎn)還原成眼睛。從測(cè)試來(lái)看,效果的確不同凡響。
這樣的AI技術(shù)有什么用?去除馬賽克只是特定場(chǎng)合的具體應(yīng)用,類似的算法在很多時(shí)候都可以發(fā)揮作用——只要當(dāng)圖像需要修復(fù)的時(shí)候,就用用武之地。例如拍照片手抖了失焦了,糊成一片該咋辦?傳統(tǒng)的方法可能就是簡(jiǎn)單粗暴的銳化了,而如果拍照APP使用AI技術(shù),就可以“腦補(bǔ)”回丟失的細(xì)節(jié)和銳度,給你一張盡量可用的照片。
·AI上色
既然AI能夠識(shí)別圖像內(nèi)容、腦補(bǔ)細(xì)節(jié),那么AI自動(dòng)上色也就成為了可能。上色其實(shí)涉及到了創(chuàng)作層面,而創(chuàng)作被很多人視為人類和機(jī)器的鴻溝,但這在AI時(shí)代不那么靈了。借助AI技術(shù),手機(jī)APP可以自動(dòng)為黑白照片甚至線稿畫(huà)作來(lái)涂上適合的顏色。
類似的技術(shù)現(xiàn)在已經(jīng)出現(xiàn)。照片處理自不必說(shuō),AI識(shí)別場(chǎng)景調(diào)節(jié)顏色和黑白照片上色并沒(méi)有本質(zhì)上的區(qū)別;而給線稿上色,在之前曾被認(rèn)為是不可思議的事情——電腦能夠讀懂線條勾勒的是何種輪廓、該輪廓還得填上適合的顏色,聽(tīng)上去就如同魔法。不過(guò)Paintschainer推出的AI上色技術(shù)卻令人大吃一驚——它可以識(shí)別某部分屬于皮膚,某部分是頭發(fā),某部分是衣服,某部分是背景,然后分別涂上適當(dāng)?shù)念伾?/p>
Paintschainer的AI自動(dòng)上色,可以精準(zhǔn)辨認(rèn)線稿
不僅如此,Paintschainer的上色范圍還相當(dāng)精準(zhǔn),盡管線稿沒(méi)有封閉,但顏色依然會(huì)保留在適當(dāng)?shù)姆秶?,而不?huì)涂得滿地都是——用過(guò)PS中油漆桶工具上色的朋友,應(yīng)該知道這是什么意思。
這意味著,以后在手機(jī)中繪畫(huà)成為了可能。盡管手機(jī)的屏幕小且觸控并不算精確(相比數(shù)位板),但得益于AI已經(jīng)能辨識(shí)線稿,因此手指繪畫(huà)粗糙的筆跡,就可以被AI完補(bǔ)為精細(xì)的描線,并填上適合的顏色。對(duì)于創(chuàng)作者而言,這大大節(jié)省了打磨具體畫(huà)技所需要的功夫,將更多精力留給設(shè)計(jì)、構(gòu)思,提高了效率。
這種AI輔佐創(chuàng)作的技術(shù),并不僅能用于攝影、繪畫(huà),在作曲等領(lǐng)域也同樣適用?;蛟S在不久后,對(duì)著手機(jī)哼一段旋律,AI自動(dòng)幫你編好曲、選擇好演奏樂(lè)器、最后完成一段高質(zhì)量曲子的日子,也已經(jīng)并不遙遠(yuǎn)。
·AI自動(dòng)翻譯
語(yǔ)義識(shí)別可謂是AI另一大廣泛實(shí)裝的應(yīng)用了。無(wú)論是語(yǔ)音識(shí)別,還是自動(dòng)翻譯,都離不開(kāi)精準(zhǔn)的語(yǔ)義判斷。得益于AI,近年的機(jī)翻竟然也能說(shuō)人話了——例如Google翻譯,已經(jīng)基本做到了語(yǔ)句通順流暢,用來(lái)閱讀一些專業(yè)性不強(qiáng)的外文,Google翻譯綽綽有余。這是如何做到的呢?
這主要得益于Google翻譯引入了神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等人工智能算法,邁入了“神經(jīng)機(jī)器翻譯(GNMT)”的時(shí)代。得益于人工智能和谷歌的大數(shù)據(jù),谷歌翻譯對(duì)語(yǔ)言的解析有了遠(yuǎn)比之前深入的理解,因此在長(zhǎng)句、整篇翻譯方面有了長(zhǎng)足的進(jìn)步。
引入了GNMT后,Google翻譯的精度與日俱增,越來(lái)越像是說(shuō)人話了
在未來(lái),AI翻譯還會(huì)愈加強(qiáng)悍,也不僅僅局限于靜態(tài)的文字。例如在Android 10當(dāng)中,引入了Live Caption(實(shí)時(shí)字幕)功能,借助機(jī)器學(xué)習(xí),它能夠讓手機(jī)在播放任何視頻的時(shí)候,精準(zhǔn)識(shí)別出音頻,并生成字幕。該技術(shù)顯然可以和AI翻譯結(jié)合,幫助人們啃下各地語(yǔ)言的生肉,大大減少交流的鴻溝。
得益于AI,安卓可以為任何視頻生成字幕,未來(lái)有望還能實(shí)時(shí)翻譯
另外,AI自動(dòng)翻譯還可以用于語(yǔ)音交流。隨著處理速度和精準(zhǔn)度的上升,手機(jī)安裝響應(yīng)的APP后,化身同聲傳譯器也并非不可能,雖然對(duì)于一些專業(yè)詞句、地域文化梗的翻譯,可能還比不上人工,但對(duì)比現(xiàn)在已有的機(jī)翻,這無(wú)疑要好上太多。
·AI自動(dòng)對(duì)話
自從蘋(píng)果推出了Siri,語(yǔ)音助手成為了人們關(guān)注的焦點(diǎn)之一。然而在大多數(shù)情況下,語(yǔ)音助手們的表現(xiàn)并不盡如人意,無(wú)法理解自然語(yǔ)義、對(duì)話機(jī)械、無(wú)法針對(duì)上下文內(nèi)容應(yīng)答等缺點(diǎn),令語(yǔ)音助手如同“人工弱智”。而在AI的加持下,未來(lái)的語(yǔ)音助手們將會(huì)飛躍上新的臺(tái)階。
例如,Google Assistant就已經(jīng)走在了進(jìn)化的路上。在 I/O開(kāi)發(fā)者大會(huì)上,Google演示了AI技術(shù)加持的Google Assistant,它能夠和人類對(duì)答如流,能夠識(shí)別上下文內(nèi)容,話語(yǔ)也都非常符合邏輯,無(wú)論是內(nèi)容還是語(yǔ)調(diào)都異常接近真人。無(wú)論是識(shí)別、應(yīng)答還是任務(wù)的完成度,新的Google Assistant都遠(yuǎn)比之前的語(yǔ)音助手表現(xiàn)出色。
得益于大數(shù)據(jù)和AI算法,Google Assistant的智能程度大大提升,甚至可以對(duì)答如流
這樣的進(jìn)化,很大程度上得益于企業(yè)利用用戶數(shù)據(jù)訓(xùn)練語(yǔ)音、語(yǔ)言模型——蘋(píng)果、谷歌、微軟、Facebook等大佬都被爆出干過(guò)這樣的事情。在未來(lái),手機(jī)APP的語(yǔ)音交互或許會(huì)更加智能,但這種進(jìn)化的代價(jià)卻以用戶隱私作為代價(jià)。我們到底該如何平衡技術(shù)發(fā)展的需求和隱私信息的保護(hù)?這恐怕是值得一直深究的問(wèn)題。
·AI信息分類
智能分類在當(dāng)前很多相冊(cè)服務(wù)中都已經(jīng)初現(xiàn)雛形。例如在Google Photo中,照片可以根據(jù)題材、人物等自動(dòng)歸類為風(fēng)景照、建筑照、美食照、某個(gè)人的合照等等,查找起來(lái)非常方便。而智能分類的出現(xiàn),很大程度上依賴于AI技術(shù)的發(fā)展——AI通過(guò)機(jī)器學(xué)習(xí),得以辨認(rèn)出照片場(chǎng)景、主體后,才讓智能分類成為可能。
目前AI對(duì)照片已經(jīng)能夠進(jìn)行比較精確的智能分類
而伴隨著AI的進(jìn)步,智能分類擁有了更多可能。目前智能分類主要涉及照片,而在未來(lái)隨著AI芯片算力的加強(qiáng),視頻的智能分類也將最終得以實(shí)現(xiàn)。而由于AI經(jīng)過(guò)足夠訓(xùn)練后,能夠較好地理解語(yǔ)言語(yǔ)義,因此將文稿按照其中內(nèi)容進(jìn)行分門(mén)別類,也成為了可能。類似的功用也可以作用于音頻中,某些音樂(lè)APP可以將音樂(lè)按照不同風(fēng)格的旋律分類,例如舒緩、激烈、甜美等,而隨著AI芯片愈發(fā)強(qiáng)大,手機(jī)本地也可以完成這樣的任務(wù)。
也就是說(shuō),當(dāng)AI發(fā)展到一定地步,手機(jī)中的相冊(cè)APP能夠按照內(nèi)容整理照片、視頻庫(kù)可以自動(dòng)分類不同內(nèi)容的視頻、文件管理器可以將近似內(nèi)容的文檔歸類在一起、音樂(lè)APP能夠識(shí)別風(fēng)格各異的旋律,都有可能成為現(xiàn)實(shí)。而當(dāng)AI將這些結(jié)合在一起,視頻的自動(dòng)剪輯、踩點(diǎn)等應(yīng)用,也將愈發(fā)成熟——目前微軟Windows 10中的相冊(cè)就已經(jīng)初步提供了類似功能,但還不太智能,將來(lái)手機(jī)在AI芯片的加持下,利用相應(yīng)的APP一鍵生成短視頻、Vlog等,將不再是夢(mèng)。
AI行為調(diào)度
得益于大數(shù)據(jù),AI能夠采集方方面面的信息,并給出一個(gè)統(tǒng)計(jì)學(xué)上的最優(yōu)解。例如Google的Alpha Go,就在學(xué)習(xí)了大量對(duì)弈樣本后,得知了圍棋每一步的權(quán)重,從而擊敗最頂級(jí)的棋手。因此當(dāng)AI的涉及面足夠廣,它就能以普通人所難以企及的全面視野,來(lái)為你安排生活中的點(diǎn)點(diǎn)滴滴,讓你真正感受到“智能”的精髓。
AI將能成為真正的智能管家
例如,很多人家中都購(gòu)置了智能家電,但這些家電的調(diào)度仍不那么的“智能”——你需要為它們預(yù)設(shè)開(kāi)啟、工作的時(shí)間段或者條件,雖然比傳統(tǒng)家電方便,但仍做不到根據(jù)你的實(shí)際行程,全自動(dòng)為你安排家電的開(kāi)啟。
例如當(dāng)你設(shè)置了下班后自動(dòng)提前開(kāi)啟空調(diào)等待回家,但某天突然塞車(chē),又不便操作手機(jī),智能家電并不能因?yàn)檫@個(gè)調(diào)整自己的開(kāi)啟時(shí)間,白白耗費(fèi)電能。當(dāng)你需要突然出差的時(shí)候,你還得手動(dòng)調(diào)節(jié)智能家電的使用方案,更加不便。而如果管控智能家電的APP加入了AI相關(guān)技術(shù),一切可能就變得不同了——APP會(huì)根據(jù)你的行程、身體情況、環(huán)境氣候等等,自動(dòng)安排自己的工作時(shí)段、時(shí)長(zhǎng)、模式,你甚至?xí)杏X(jué)到電器上的開(kāi)關(guān)功能按鈕是多余的——這才叫做智能家電嘛。
總結(jié)
AI的一大魅力在于找出大數(shù)據(jù)中的內(nèi)在規(guī)律,從而讓功能的自動(dòng)化實(shí)現(xiàn)成為可能,甚至能極大程度模糊人與機(jī)器間的界限。AI芯片目前仍處于起步階段,或許我們現(xiàn)在只能在少量應(yīng)用場(chǎng)景中感受到它的存在,但隨著應(yīng)用生態(tài)的完善,AI芯片將會(huì)為手機(jī)帶來(lái)更多神奇功用,期待AI芯片能在未來(lái)進(jìn)一步發(fā)光發(fā)熱吧。
-
soc
+關(guān)注
關(guān)注
38文章
4100瀏覽量
217782 -
AI
+關(guān)注
關(guān)注
87文章
29824瀏覽量
268116 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8856瀏覽量
137217
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論