2018年6月的一天,在IBM公司舊金山辦公室內(nèi),一場人機辯論大賽如期舉行。
辯論賽的主角叫做“Project Debater”,這是由IBM位于以色列的海法研究院為主的科學(xué)家們歷經(jīng)六年研發(fā)的能進(jìn)行復(fù)雜辯論的AI系統(tǒng)。辯論另一方是以色列國家辯論冠軍Noa Ovadia和以色列國際辯論協(xié)會主席 Dan Zafrir。
Debater與兩位人類辯手進(jìn)行了兩場辯論,辯題分別是“我們是否應(yīng)該資助太空探索”、“我們是否要增加遠(yuǎn)程醫(yī)療的使用”。兩場辯論分別有三個固定環(huán)節(jié):4分鐘陳述自己論點,4分鐘反駁對方論點,2分鐘總結(jié)陳詞?,F(xiàn)場觀眾通過投票支持各方觀點,決出勝者。
意料之中的事情還是發(fā)生了,機器辯手Debater在主題為“是否應(yīng)該增加使用遠(yuǎn)程醫(yī)療”的辯論中最終扭轉(zhuǎn)了更多的現(xiàn)場觀眾最初觀點,贏得了辯論。
近日,網(wǎng)易智能有幸對Debater團(tuán)隊幾位主要研發(fā)者進(jìn)行了采訪,詳細(xì)了解了Debater的研發(fā)過程、主要技術(shù)能力,以及未來應(yīng)用前景。
1、計算辯論的崛起
其實,這早已經(jīng)不是人類第一次被機器戰(zhàn)勝。
早在1997年,IBM研發(fā)的超級計算機深藍(lán)(Deep Blue)在國際象棋比賽中擊敗了世界冠軍加里.卡斯帕羅夫(Gary Kasparov)。
2011年,IBM人工智能系統(tǒng)Watson在益智游戲節(jié)目《危險邊緣》(Jeopardy!)中擊敗了兩位最優(yōu)秀的人類冠軍。
2015年,DeepMind研發(fā)的AlphaGo擊敗了人類圍棋冠軍李世石,第一次在圍棋上贏得了冠軍。緊接著在2016年,DeepMind又打敗了更強大的中國圍棋冠軍選手柯潔,再一次證明了AI的實力。
近兩年,人機大戰(zhàn)持續(xù)火熱,不管是***大戰(zhàn)中的人工智能“冷撲大師”(Libratus)賺的盆滿缽滿,還是OpenAI研發(fā)的AI系統(tǒng)在Dota游戲爭霸賽擊敗人類冠軍,AI在游戲領(lǐng)域的已經(jīng)玩到了極致。然而,辯論不是簡單的非黑即白的博弈。
IBM把Project Debater稱為人工智能的又一個里程碑。IBM研究院海法研究院AI Tech副總裁Aya Soffer表示,辯論是一個開放式的挑戰(zhàn),這與之前AI所解決的挑戰(zhàn)是不同的。之前的挑戰(zhàn)會有一些具體的衡量工具,比如說去判斷是贏是輸,傳統(tǒng)的技術(shù)可以直接幫助制定相應(yīng)的衡量工具,并且判斷輸贏。而在辯論中是沒有辦法做這樣的打分,在辯論中就像在實際中做商業(yè)決策一樣,沒有清晰的以分?jǐn)?shù)高低衡量輸贏的簡單標(biāo)準(zhǔn)。這就對機器的語言文字理解能力和決策能力要求非常高。
IBM為什么要研發(fā)一臺有辯論功能的計算機?Aya Soffer解釋說,IBM會不斷地去尋找在AI領(lǐng)域的重大挑戰(zhàn)是什么?“我們是以尋找到的重大挑戰(zhàn)來引領(lǐng)下一個計算機功能的選擇?!盇ya Soffer認(rèn)為,在真實的世界中,我們并不是需要回答很多瑣碎的問題,而是要回答真正重要的問題做出真正重要的決策。信息是海量的,但是找到那些能助力我們做出正確決策的信息是難的。因此,決策的重要性決定了我們確定要把辯論功能作為AI的下一個重大挑戰(zhàn)去做相關(guān)的研究,并且能夠使得我們的AI發(fā)展讓它擁有辯論的用途和功能。
IBM研究院海法實驗室AI Tech副總裁Aya Soffer
在辯論現(xiàn)場,雖然機器在很多方面都表現(xiàn)地不太自然和磕絆,但AI辯手傳遞信息量的豐富度則優(yōu)于人類,這場史無前例的事件也讓業(yè)內(nèi)注意到計算機如何學(xué)習(xí)并應(yīng)對非結(jié)構(gòu)化的人類決策世界。
據(jù)悉,目前有50多個不同的研究團(tuán)體都是在做計算輔助辯論方面的研究。但是自2014年以來,IBM已經(jīng)組織了第五次辯論數(shù)據(jù)挖掘研討會,Debater團(tuán)隊成員在各種高質(zhì)量科學(xué)會議上發(fā)表了他們?nèi)〉玫募夹g(shù)進(jìn)步,目前已在各個研究領(lǐng)域發(fā)表了30多篇作品。計算辯論(Computational Argumentation)正在迅速崛起。
2、演講、聽力理解、模擬困境
Debater首席研究員Noam Slonim博士在采訪中回顧了辯論過程。
拿到辯題后,Debater首先會分析單個辯論問題,然后掃描龐大的語料庫文檔,通過算法找出與辯題相關(guān)性最高的觀點性內(nèi)容,同時通過算法減少重復(fù)信息。在此基礎(chǔ)上,Debater會挑選出最有說服力、最具多樣性和支持最完善的論點,并對這些論點進(jìn)行編排,從而形成一段完整且有說服力的敘述。
也就是說,辯論雖然是實時辯論,但是機器辯手和人類辯手在拿到選題后都會有30分鐘的準(zhǔn)備時間。30分鐘之內(nèi),Debater會通過自己的算法,在自己的語料庫中去進(jìn)行搜索,形成有利于自己方面論點的論證。
Debater全球經(jīng)理Ranit(左)與首席研究員Noam博士(右)
既然辯論過程是完全即興,Project Debater如何應(yīng)對完全即興、無法預(yù)期的情況?Noam表示,這要靠知識圖譜去模擬人類的困境,形成辯駁的能力。比如說涉及到是否要禁止器官的販運、器官貿(mào)易,是否要禁止酒精的貿(mào)易。類似于這種類型的辯題,我們可以自然而然期待如果禁止了器官交易、酒精交易,有一種風(fēng)險是會有黑市的蓬勃發(fā)展。理論上來講,Project Debater的系統(tǒng)可以理解與這種類型相關(guān)的一些辯論,但凡是針對這種類型的觀點進(jìn)行辯論,后續(xù)就會有可能出現(xiàn)與黑市相關(guān)的問題,于是可以在模擬好中的圖譜等待著與黑市相關(guān)話題的出現(xiàn)。但辯論并不總是這樣,比如美國最近討論比較多的是否要禁止在公共場合母乳喂養(yǎng),但這跟黑市一點都沒有關(guān)系,所以我們依然是在這個方面不斷地去建模、擴(kuò)大語料庫,包括人類豐富的語言中各種細(xì)微和微妙的地方。“這樣Project Debater在已經(jīng)建模的知識圖譜中,才能夠更加精準(zhǔn)地為自己導(dǎo)航,找到與支持自己論點相關(guān)的觀點?!盢oam說到。
那么,Debater的論點是怎么形成的?Noam表示,對于給定的主題,Project Debater的系統(tǒng)會在巨大的知識庫內(nèi)進(jìn)行搜索,尋找最相關(guān)的觀點和證據(jù),然后在其中選擇最吸引人、最多樣化、支持度最高的論點,然后把這些構(gòu)建成一個完整的觀點加以敘述。與關(guān)鍵詞搜索不同,Debater能對話題即時產(chǎn)生更深理解,并基于它的搜索結(jié)果等構(gòu)建自己的觀點。
強大的語料庫是Debater展開辯論的基礎(chǔ)。據(jù)悉,訓(xùn)練Debater的語料庫擁有3億多個可靠信息來源,包含2011年以來全球商業(yè)、法律、學(xué)術(shù)和政府機構(gòu)等領(lǐng)域的專業(yè)人士所使用的主流報紙和雜志中的文章,以及維基百科中的內(nèi)容。
IBM研究院團(tuán)隊為Debater的系統(tǒng)賦予了三大核心能力:
第一,驅(qū)動的演講稿撰寫與表達(dá)。Debater第一次證實了,計算機能夠理解大量語料庫,若給定一個有爭議的主題的簡短描述,它能夠撰寫結(jié)構(gòu)良好的演講內(nèi)容,并清晰且有針對性地表達(dá)出來,甚至還會適時地展現(xiàn)幽默風(fēng)趣。
第二,實時聽力理解。當(dāng)對方辯手開始講的時候,Project Debater要能聽長達(dá)4分鐘的內(nèi)容,對方人類辯手在講的過程中語速可能是快的,情感可能是充滿激情的,同時還會有一些道德性、倫理性的問題,Project Debater要能夠識別人類辯手口述的長篇大論中隱含的重要概念及觀點主張,能夠識別長段連續(xù)口語中隱含的重要概念觀點。
第三,模擬人類困境。通過獨特的知識表達(dá)方式來模擬人類爭議和困境,使系統(tǒng)能夠根據(jù)需要提出有原則的論點。研發(fā)團(tuán)隊總結(jié)了人類專家辯手的一些共同性,對他進(jìn)行模擬、建模,并且把這個注入到系統(tǒng)中去,就形成了一個知識圖譜給到Project Debater來用。所以一旦開始去進(jìn)行辯論的時候,Project Debater就可以在已經(jīng)形成的圖譜中去做自己的向?qū)Ш?a target="_blank">索引,找到可以支撐他的證據(jù)。
3、商業(yè)價值與AI未來發(fā)展
Debater全球經(jīng)理Ranit Aharonov闡述了如何將Project Debater應(yīng)用到商業(yè)中。
關(guān)于商業(yè)運用,Debater僅僅預(yù)示著一個開始,目前主要有兩大類用途。
第一類是應(yīng)用在有研究、分析的領(lǐng)域,比如幫助金融分析師找出金融事實,用以支持或反對金融分析師所思考的金融投資選擇;幫助律師尋找相關(guān)案件和主張,或借助Project Debater模擬法庭辯論來分析優(yōu)勢和劣勢;幫助記者或?qū)W生找出更多信息以改進(jìn)報告和論文。
第二類是決策領(lǐng)域的應(yīng)用,比如幫助企業(yè)高層分析優(yōu)劣勢,提供基于事實、沒有人為偏見的觀點?;蛘咄ㄟ^Debater拓寬思路,在關(guān)鍵決策中納入他們可能沒有考慮到的新觀點?!安还苁切畔⒌氖占⒀芯糠治鲞€是做決策,總的來講,Debater最終的目的是支持基于循證的決策,而不是基于直覺的決策?!?/p>
Ranit同時表示,Project Debater相關(guān)的項目和技術(shù)依然在進(jìn)行進(jìn)一步深耕之中,其商業(yè)應(yīng)用僅僅是一個預(yù)設(shè)。“現(xiàn)在商業(yè)化為時尚早,也沒有具體的計劃?!?/p>
Noam表示,Debater雖然已經(jīng)研發(fā)了六年,但目前仍然是在不斷再開發(fā)、再開發(fā)過程中,在工程、算法上依然有很多的挑戰(zhàn)。比如,目前的Debater只能參與一對一辯論,無法跟大規(guī)模選手辯論。。
Debater是否真正理解對方辯手的話?當(dāng)網(wǎng)易智能把這個問題拋出的時候,Ranit笑著回答說,這是一個哲學(xué)高度的問題,因為這涉及到我們?nèi)绾稳ダ斫釧I的理解能力?!皬慕Y(jié)果上來看,當(dāng)我們就是否要為太空探索來提供資助提出辯論的時候,AI也能聽,也能回應(yīng),也能形成自己的觀點去辯論,它所展示的是理解了對方講的話的理解能力。但是如果當(dāng)我們說理解是指人類之間的理解,比如我理解你、你理解我的這種理解、內(nèi)心的理解,意識到對方和心理過程的理解,AI目前是沒有這個理解能力的。”
在談到Debater所代表的AI的未來發(fā)展方向,Aya Soffer向網(wǎng)易智能表達(dá),希望讓人工智能更像人。人之所以能夠從小數(shù)據(jù)中學(xué)習(xí),就是因為人可以去理解概念,并且在概念的基礎(chǔ)上學(xué)以致用到新的領(lǐng)域,這種開放域的應(yīng)用能力是非常強的。發(fā)達(dá)的AI,應(yīng)該不僅從大數(shù)據(jù),還能從小數(shù)據(jù),甚至未來能把概念進(jìn)行學(xué)以致用的應(yīng)用?!拔覀兿M鸄I進(jìn)一步發(fā)展這個能力,從比較窄的具體例子中學(xué)習(xí),而后擴(kuò)展到比較寬泛的領(lǐng)域、跨不同領(lǐng)域的應(yīng)用,以及能夠從概念上學(xué)習(xí)?!盇ya說到。
-
IBM
+關(guān)注
關(guān)注
3文章
1743瀏覽量
74595 -
人工智能
+關(guān)注
關(guān)注
1791文章
46707瀏覽量
237221
原文標(biāo)題:揭秘IBM AI辯手:AlphaGo之后新的里程碑?
文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論