PC時代,瀏覽器成為了互聯(lián)網(wǎng)的一道入口;到了移動互聯(lián)網(wǎng)時代,以App Store為代表各類應用商店成為了入口。而到了IOT(物聯(lián)網(wǎng))的時代,人工智能助手可能會成為入口。用戶界面的交互方式,最早看到的是Web,然后是App,到了新時代可能是自然語言。
除了輸入法可以使用語音輸入以外,語音技術(shù)也可以廣泛應用在醫(yī)療領域、智能車載、智能可穿戴、智能家居、教育領域等各行各業(yè)。
本期公開課我們請到了訊飛輸入法的創(chuàng)始人翟吉博為大家揭秘人工智能浪潮下人機交互的未來走向。
“汽車沒有出現(xiàn)之前,人們只想要一匹跑的更快的馬”,這就是創(chuàng)新驅(qū)動路徑,也正是因為這種創(chuàng)新精神,人工智能大時代順勢而生。人工智能、科學技術(shù)、人機交互滲透進你我生活的每個縫隙,我們經(jīng)歷的每種改變、突破甚至革命,都值得借鑒、探索和挖掘。
Part1: 人工智能為何物?
人工智能是能夠和人一樣進行感知、認知、決策、執(zhí)行的人工程序或系統(tǒng)。
1956年達特茅斯會議召開,以麥卡賽、明斯基、羅切斯特和申農(nóng)等為首的一批有遠見卓識的年輕科學家在一起聚會,共同研究和探討用機器模擬智能的一系列有關(guān)問題,并首次提出了“人工智能”這一術(shù)語,它標志著“人工智能”這門新興學科的正式誕生。
莫爾,麥卡錫,明斯基,塞爾夫里奇,所羅蒙夫(從左至右) 2006 年出席紀念人工智能學科50 周年會議合影
70年代后期,人們發(fā)現(xiàn)過去的理論和模型,只能解決一些非常簡單的問題,很快人工智能進入了第一個冬天。80年代又興起一撥人工智能的熱潮,包括語音識別、語音翻譯計劃,以及日本提出的第五代計算機。
元罔達的《第五代計算機》中,第五代計算機系統(tǒng)概念圖
到了90年代后期,人們發(fā)現(xiàn)這種東西離實際生活實在太遙遠。IBM在90年代的時候提出了一款語音聽寫的軟件叫IBM Viavoice,效果其實不錯,但是真正用的時候卻遭冷遇。因此,在2000年左右第二次人工智能的浪潮再次破滅。
人工智能開始進入真正爆發(fā)的標志,是2006年Geoffrey Hinton提出的深度學習技術(shù),以及在圖像、語音識別以及其他領域內(nèi)取得的一些成功。
Part2: 弱人工智能時代
人機交互的發(fā)展
在此次AI公開課上,分享人翟吉博提到了人工智能的三個階段,他認為人工智能可以分為三個階段,分別是弱人工智能、強人工智能和超人工智能。目前我們常說的人工智能主要是弱人工智能,只擅長于單個方面的人工智能。
比如AlphaGo,雖然下圍棋很強,但如果讓它下象棋或者國際象棋,也許就不會了。還有我們常見的掃地機器人,它在掃地方面也許具備一定的智能,但它并不能通過學習,掌握其他的技能,比如它就學不會洗碗。弱人工智能和人類智能的區(qū)別在于它并不能通過自適應的學習,掌握它之前并不會的技能。
人工智能的三個階段
還有一種是研究人工智能學者眼中的“強”人工智能,這些人希望能真正破解人類產(chǎn)生智能的奧秘,例如做一個類似人類大腦的機器,這樣它就可以通過學習,掌握不同領域的事情。至于超人工智能,還只存在于科幻電影和小說中,很長一段時間內(nèi)還無法實現(xiàn)。目前,我們還處于弱人工智能時代。
Part3: 人機交互的走向
“人機交互”顧名思義是人與機器的交互,隨著科技、網(wǎng)絡、社情、人口、文化等多方面的發(fā)展,人機交互從最開始的單一刻板到如今越來越“貼心”和人性化,甚至可以想你所想,做你所做。
觸控、語音、體感等交互方式都是自然的人機交互方式。在未來10年內(nèi),人機交互將以語音交互為主,觸控、體感交互為輔。
人機交互的未來:體感交互
萬物互聯(lián)時代,很多智能設備也許沒有屏幕,這樣輸入就會非常麻煩,所以語音輸入成了最自然的解決方案。而且由于許多設備的不可移動性,所以在遠場情況下,語音交互也是最方便的。除此之外,語音輸入的技術(shù)發(fā)展也早已達到實用階段。AI公開課上也提到了,以訊飛輸入法的發(fā)展為例,用戶對語音輸入習慣已經(jīng)養(yǎng)成,訊飛輸入法的月活躍用戶達到1.1億,其中45%的用戶在使用語音輸入,且平均使用次數(shù)高達15次以上。
在未來,人和機器交互會變得和人交流一樣,機器像一個老朋友,能夠理解你的任何意圖,并幫你完成。而且機器還能夠根據(jù)你的習慣,提供主動服務。
終極的人機交互可能就是不需要交互,你可以通過腦電波直接控制機器,就像控制你的身體一樣,機器成為你的一部分
Part4: 人機交互的適應性
人機交互應該是從人適應機器到機器適應人的一個過程,例如從鍵盤到鼠標到觸摸再到語音就是一個具體的表現(xiàn)。眾所周知,觸屏交互已經(jīng)成為智能手機的主要交互方式,或者說是移動互聯(lián)網(wǎng)時代的主流交互方式??蔀槭裁凑Z音、體感現(xiàn)在還沒有大規(guī)模的應用?原因主要有兩個:一個是技術(shù)發(fā)展的程度,一個是應用場景。
語音輸入實際上直到2010年才開始真正走入實用,隨著DNN深度神經(jīng)網(wǎng)絡技術(shù)的發(fā)展,目前技術(shù)已經(jīng)成熟,識別率可以達到97%以上,現(xiàn)在手機上已經(jīng)有應用場景。但真正大規(guī)模的普及應用還在未來。目前手機上有屏幕,用戶還是會習慣按鍵輸入,也許未來等到穿戴設備出現(xiàn),可能沒有屏幕,用戶必須要用語音輸入。
門捷洛夫曾說:“為了照亮地球深處,在黑暗之中看到蘊藏豐富的礦產(chǎn)資源,科學之燈是必須的”,面對未知面對困惑,拋開猶豫不前拋開“沒時間”的借口,雷厲風行的行動起來吧,掌握干貨,才能成為時代弄潮兒!
-
人機交互
+關(guān)注
關(guān)注
12文章
1199瀏覽量
55269 -
智能家居
+關(guān)注
關(guān)注
1926文章
9472瀏覽量
183883 -
人工智能
+關(guān)注
關(guān)注
1789文章
46663瀏覽量
237096
發(fā)布評論請先 登錄
相關(guān)推薦
評論