王海峰是百度首席技術(shù)官,也是上海人工智能戰(zhàn)略咨詢專家委員會成員。在2019世界人工智能大會召開之際,王海峰接受解放日報。上觀新聞記者專訪,分享了他對人工智能熱點話題的看法。
問:您認為,人工智能技術(shù)意味著什么?
答:眾所周知,自18世紀60年代起,人類經(jīng)歷了三次工業(yè)革命,分別以機械技術(shù)、電氣技術(shù)和信息技術(shù)為核心驅(qū)動力。當(dāng)今,我們正身處第四次工業(yè)革命浪潮之中,而人工智能技術(shù)則是這次工業(yè)革命的核心驅(qū)動力量。人工智能技術(shù)將滲入到人們生產(chǎn)生活的各個角落,人工智能正將人類社會帶入智能時代。
問:自從“人工智能”一詞為公眾所熟悉,有關(guān)“人工智能是否會取代人類”的爭議就一直不斷。您如何看待這個問題?
答:當(dāng)前,部分公眾對人工智能認識不足,存在一定的恐慌情緒,認為人工智能會取代人類的工作、會威脅到人類。所以,讓公眾對人工智能有正確認知和合理期待,是人工智能從業(yè)者,也是全社會需要解決的問題。
目前的人工智能技術(shù)整體而言依賴大數(shù)據(jù)、大模型和大的計算能力,這之中依舊有很多問題需要解決?,F(xiàn)階段,人工智能在特定應(yīng)用、特定場景上的能力超過了人類,但想全面達到甚至超越人類還有很長的路要走,尤其是在語言與知識等認知技術(shù)上,還有很大的發(fā)展空間。
人工智能的使命不是替代人類,而是為人類服務(wù)。人工智能能夠比人類更出色地完成某些任務(wù),比如重復(fù)性、基礎(chǔ)性或者純體力工作;但是也有很多能力機器是不能替代人類的,比如科學(xué)家、工程師、藝術(shù)家等需要創(chuàng)造性的工作。
未來,人類將更多地充當(dāng)管理者的角色,機器只是輔助人類做出決定。全社會對于人工智能應(yīng)抱有正確的認識和預(yù)期,不能過高,也不能畏懼,這樣才能更好地擁抱人工智能。
問:您更看重哪些領(lǐng)域的人工智能探索?
答:想要務(wù)實地推動人工智能發(fā)展,首先要看到人工智能發(fā)展過程中面臨的機遇和挑戰(zhàn)。我認為人工智能領(lǐng)域的探索,要從理論基礎(chǔ)、應(yīng)用技術(shù)、產(chǎn)業(yè)基礎(chǔ)、應(yīng)用系統(tǒng)四個層面同時展開。
在基礎(chǔ)理論層面,小樣本、低能耗、可解釋是人工智能目前面臨的最大挑戰(zhàn)。人工智能,尤其是深度學(xué)習(xí)的發(fā)展離不開大數(shù)據(jù)和大的計算能力,但強大算力的背后,是巨大的能耗在支撐。另一方面,深度神經(jīng)網(wǎng)絡(luò)的結(jié)果很難解釋,難以賦以物理意義。目前在這方面的探索包括遷移學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)、對抗生成網(wǎng)絡(luò)以及符號與神經(jīng)網(wǎng)絡(luò)的結(jié)合等等。因此,人工智能理論研究要探索如何讓人工智能像人類一樣、實現(xiàn)小樣本學(xué)習(xí)、能耗低,且真正地被理解。
在應(yīng)用技術(shù)上,感知技術(shù)與認知技術(shù)仍然是未來的重要方向,尤其是認知技術(shù)。與聽覺、視覺相關(guān)的感知技術(shù),在深度學(xué)習(xí)的這一波紅利里得到了巨大的發(fā)展。但自然語言理解和知識圖譜等認知技術(shù),還有很多問題亟待解決。同時,融合感知與認知技術(shù)的多模態(tài)深度語義理解會進一步發(fā)展。
產(chǎn)業(yè)基礎(chǔ)層面,軟硬結(jié)合很重要,深度學(xué)習(xí)框架和AI芯片逐漸成為人工智能發(fā)展的新趨勢,也是新的產(chǎn)業(yè)機會。另外,隨著5G的到來,邊緣計算也成為人工智能發(fā)展不可忽視的一環(huán)。
在應(yīng)用系統(tǒng)層面,多技術(shù)綜合應(yīng)用、結(jié)合場景的系統(tǒng)性創(chuàng)新至關(guān)重要。隨著人工智能與各行各業(yè)的融合越來越深入,真正落地的產(chǎn)業(yè)應(yīng)用往往是多種技術(shù)的綜合應(yīng)用,需要結(jié)合特定場景、業(yè)務(wù)需求及數(shù)據(jù)特點,實現(xiàn)系統(tǒng)性的創(chuàng)新,才能切實為現(xiàn)有業(yè)務(wù)提升效率,或者發(fā)展新的業(yè)務(wù)模式。
總結(jié)而言,人工智能系統(tǒng)和生物、和人一樣,是不斷進化的。人工智能系統(tǒng)在應(yīng)用場景中,與環(huán)境、用戶互相作用,不斷產(chǎn)生新數(shù)據(jù),不斷學(xué)習(xí),沉淀知識,改進算法,越來越強大。
問:在百度的人工智能研究中,是否對這四個層面有所涉及?
答:百度從2010年開始人工智能技術(shù)布局和基礎(chǔ)能力積累,2016年9月正式發(fā)布的百度大腦是百度人工智能技術(shù)多年積累和業(yè)務(wù)實踐的集大成。在百度大腦的研發(fā)和業(yè)務(wù)實踐中,對理論基礎(chǔ)、應(yīng)用技術(shù)、產(chǎn)業(yè)基礎(chǔ)、應(yīng)用系統(tǒng)均有涉及。
目前,百度大腦已經(jīng)形成完整的技術(shù)體系,并全方位開放人工智能技術(shù)能力。其核心技術(shù)進入“多模態(tài)深度語義理解”階段,能夠?qū)ξ淖?、聲音、圖像等多模態(tài)的數(shù)據(jù)和信息進行深層次多維度的語義理解。今年7月發(fā)布的百度大腦5.0,AI算法、計算架構(gòu)和應(yīng)用場景融合創(chuàng)新,成為“軟硬一體AI大生產(chǎn)平臺”,打通了人工智能產(chǎn)業(yè)化應(yīng)用落地的全流程,從深度學(xué)習(xí)技術(shù)及平臺到通用AI能力、應(yīng)用技術(shù)方案,再到定制化模型開發(fā)平臺,以及最終的部署和集成,實現(xiàn)了AI技術(shù)的標(biāo)準(zhǔn)化、自動化和模塊化,深度賦能開發(fā)者,加速產(chǎn)業(yè)智能化進程。
問:能否請您以百度大腦5.0為例,簡要介紹一下百度人工智能技術(shù)的進展及應(yīng)用?
答:百度大腦5.0在語音、視覺、知識圖譜、語義理解等核心技術(shù)層面持續(xù)創(chuàng)新,保持世界領(lǐng)先水平;在算力層面,實現(xiàn)面向人工智能的計算架構(gòu),發(fā)布AI芯片;同時不斷完善和升級深度學(xué)習(xí)開源開放平臺百度飛槳,降低人工智能技術(shù)門檻,促進人工智能應(yīng)用落地。
比如在語音識別方面,成功將注意力模型應(yīng)用于大規(guī)模線上語音識別系統(tǒng),準(zhǔn)確率進一步提升。該技術(shù)已經(jīng)在智能音箱和語音輸入法等產(chǎn)品中應(yīng)用,實現(xiàn)高精準(zhǔn)的中英文混合語音識別。
在語音合成方面,風(fēng)格遷移技術(shù)把聲音中的音色、風(fēng)格、情感等不同元素解耦分離,獨立組合,靈活控制合成的聲音;同時只需錄制20句話,就可以制作一個人的專屬聲音。
自然語言理解方面,結(jié)合知識和語義理解,發(fā)布可持續(xù)學(xué)習(xí)的知識增強語義理解框架ERNIE。首先結(jié)合先驗知識和海量數(shù)據(jù)構(gòu)建預(yù)訓(xùn)練任務(wù),然后學(xué)習(xí)其中的語言、實體、關(guān)系、知識等等各種信息,模型能力可以持續(xù)增強,提升效果,快速應(yīng)用。
百度大腦5.0還在機器同傳領(lǐng)域取得了突破。綜合聯(lián)合詞向量解碼、語篇翻譯模型等新技術(shù),實現(xiàn)高準(zhǔn)確、低時延的機器同傳,并發(fā)布了語音到語音的機器同傳系統(tǒng)“DuTongChuan(度同傳)”以及全球首個中文-英文演講場景語音翻譯數(shù)據(jù)集(BSTC)。有機會試用一下就能發(fā)現(xiàn),百度的機器同傳效果已經(jīng)媲美人類譯員。
以上只是百度大腦5.0在語音和自然語言處理領(lǐng)域的部分技術(shù)進展及應(yīng)用。整體上,百度大腦布局完整,核心技術(shù)領(lǐng)先。一方面,百度大腦是百度業(yè)務(wù)強有力的技術(shù)支撐;另一方面,百度大腦也是全方位開放的,助力合作伙伴和開發(fā)者,加速人工智能技術(shù)落地應(yīng)用,賦能各行各業(yè)轉(zhuǎn)型升級,促進社會經(jīng)濟變革。
百度搜索、信息流、百度地圖、百度輸入法等產(chǎn)品基于百度大腦的AI能力變得更加智能。比如,百度智能搜索可以更深入地理解用戶需求、高效地連接人與信息、提升用戶體驗;百度地圖,充分利用百度大腦的技術(shù)優(yōu)勢,成為業(yè)內(nèi)智能化水平最高、搭載的人工智能技術(shù)最強最豐富的地圖,實現(xiàn)了全流程AI化數(shù)據(jù)生產(chǎn),為用戶提供路線規(guī)劃、智能語音助手、步行AR導(dǎo)航、實時路況、個性化推薦、智能旅游導(dǎo)覽等智能出行服務(wù)。
還有,基于百度大腦技術(shù)能力,百度智能家居、自動駕駛等領(lǐng)域處于全球領(lǐng)先水平,擁有智能語音交互開放生態(tài)“小度助手(DuerOS)”,以及智能駕駛開放生態(tài)“Apollo”。此外,面向企業(yè)及開發(fā)者的智能云計算服務(wù)平臺“百度智能云”,為各行業(yè)智能化轉(zhuǎn)型提供解決方案,促進數(shù)字中國建設(shè)。
問:對于當(dāng)下人工智能的研發(fā)和應(yīng)用情況,您有什么建議或意見?
答:從研究的層面看,我認為人工智能的基礎(chǔ)研究還相對薄弱,而基礎(chǔ)研究是關(guān)乎人工智能核心競爭力的關(guān)鍵領(lǐng)域,亟需加強。從應(yīng)用層面看,我覺得要避免對人工智能期望過高。眼下,部分產(chǎn)業(yè)、資本、公眾等抱有人工智能“無所不能”的想法,有大量資金涌入人工智能領(lǐng)域;但以當(dāng)下的技術(shù)條件和環(huán)境,不是所有的產(chǎn)業(yè)都能用人工智能解決核心問題,期望過高會給人工智能產(chǎn)業(yè)發(fā)展帶來泡沫化風(fēng)險。從另一個角度來說,技術(shù)也不是要做到100%的準(zhǔn)確率才能應(yīng)用,效果達到一定程度,就可以投入應(yīng)用,讓人工智能技術(shù)在場景化的應(yīng)用中持續(xù)進化,同時更深入地推動人工智能的產(chǎn)業(yè)應(yīng)用落地。所以在今年的百度AI開發(fā)者大會上,我們多次提及的關(guān)鍵詞之一就是“產(chǎn)業(yè)智能化”,百度也會更關(guān)注技術(shù)和不同行業(yè)的融會貫通,促進產(chǎn)業(yè)智能化發(fā)展。
-
百度
+關(guān)注
關(guān)注
9文章
2235瀏覽量
89860 -
人工智能
+關(guān)注
關(guān)注
1787文章
46076瀏覽量
235219 -
工業(yè)革命
+關(guān)注
關(guān)注
0文章
107瀏覽量
15766
發(fā)布評論請先 登錄
相關(guān)推薦
評論