2018年6月的一天,在IBM公司舊金山辦公室內(nèi),一場(chǎng)人機(jī)辯論大賽如期舉行。
辯論賽的主角叫做“Project Debater”,這是由IBM位于以色列的海法研究院為主的科學(xué)家們歷經(jīng)六年研發(fā)的能進(jìn)行復(fù)雜辯論的AI系統(tǒng)。辯論另一方是以色列國家辯論冠軍Noa Ovadia和以色列國際辯論協(xié)會(huì)主席 Dan Zafrir。
IBM Project Debater和人類辯論,
圖引用自IBM官網(wǎng)
Debater與兩位人類辯手進(jìn)行了兩場(chǎng)辯論,辯題分別是“我們是否應(yīng)該資助太空探索”、“我們是否要增加遠(yuǎn)程醫(yī)療的使用”。兩場(chǎng)辯論分別有三個(gè)固定環(huán)節(jié):4分鐘陳述自己論點(diǎn),4分鐘反駁對(duì)方論點(diǎn),2分鐘總結(jié)陳詞?,F(xiàn)場(chǎng)觀眾通過投票支持各方觀點(diǎn),決出勝者。
意料之中的事情還是發(fā)生了,機(jī)器辯手Debater在主題為“是否應(yīng)該增加使用遠(yuǎn)程醫(yī)療”的辯論中最終扭轉(zhuǎn)了更多的現(xiàn)場(chǎng)觀眾最初觀點(diǎn),贏得了辯論。
近日,網(wǎng)易智能有幸對(duì)Debater團(tuán)隊(duì)幾位主要研發(fā)者進(jìn)行了采訪,詳細(xì)了解了Debater的研發(fā)過程、主要技術(shù)能力,以及未來應(yīng)用前景。
1
計(jì)算辯論的崛起
其實(shí),這早已經(jīng)不是人類第一次被機(jī)器戰(zhàn)勝。
早在1997年,IBM研發(fā)的超級(jí)計(jì)算機(jī)深藍(lán)(Deep Blue)在國際象棋比賽中擊敗了世界冠軍加里.卡斯帕羅夫(Gary Kasparov)。
2011年,IBM人工智能系統(tǒng)Watson在益智游戲節(jié)目《危險(xiǎn)邊緣》(Jeopardy!)中擊敗了兩位最優(yōu)秀的人類冠軍。
2015年,DeepMind研發(fā)的AlphaGo擊敗了人類圍棋冠軍李世石,第一次在圍棋上贏得了冠軍。緊接著在2016年,DeepMind又打敗了更強(qiáng)大的中國圍棋冠軍選手柯潔,再一次證明了AI的實(shí)力。
近兩年,人機(jī)大戰(zhàn)持續(xù)火熱,不管是***大戰(zhàn)中的人工智能“冷撲大師”(Libratus)賺的盆滿缽滿,還是OpenAI研發(fā)的AI系統(tǒng)在Dota游戲爭霸賽擊敗人類冠軍,AI在游戲領(lǐng)域的已經(jīng)玩到了極致。然而,辯論不是簡單的非黑即白的博弈。
IBM把Project Debater稱為人工智能的又一個(gè)里程碑。IBM海法研究院AI Tech副總裁Aya Soffer表示,辯論是一個(gè)開放式的挑戰(zhàn),這與之前AI所解決的挑戰(zhàn)是不同的。之前的挑戰(zhàn)會(huì)有一些具體的衡量工具,比如說去判斷是贏是輸,傳統(tǒng)的技術(shù)可以直接幫助制定相應(yīng)的衡量工具,并且判斷輸贏。而在辯論中是沒有辦法做這樣的打分,在辯論中就像在實(shí)際中做商業(yè)決策一樣,沒有清晰的以分?jǐn)?shù)高低衡量輸贏的簡單標(biāo)準(zhǔn)。這就對(duì)機(jī)器的語言文字理解能力和決策能力要求非常高。
IBM為什么要研發(fā)一臺(tái)有辯論功能的計(jì)算機(jī)?Aya Soffer解釋說,IBM會(huì)不斷地去尋找在AI領(lǐng)域的重大挑戰(zhàn)是什么?“我們是以尋找到的重大挑戰(zhàn)來引領(lǐng)下一個(gè)計(jì)算機(jī)功能的選擇?!盇ya Soffer認(rèn)為,在真實(shí)的世界中,我們并不是需要回答很多瑣碎的問題,而是要回答真正重要的問題做出真正重要的決策。信息是海量的,但是找到那些能助力我們做出正確決策的信息是難的。因此,決策的重要性決定了我們確定要把辯論功能作為AI的下一個(gè)重大挑戰(zhàn)去做相關(guān)的研究,并且能夠使得我們的AI發(fā)展讓它擁有辯論的用途和功能。
在辯論現(xiàn)場(chǎng),雖然機(jī)器在很多方面都表現(xiàn)地不太自然和磕絆,但AI辯手傳遞信息量的豐富度則優(yōu)于人類,這場(chǎng)史無前例的事件也讓業(yè)內(nèi)注意到計(jì)算機(jī)如何學(xué)習(xí)并應(yīng)對(duì)非結(jié)構(gòu)化的人類決策世界。
據(jù)悉,目前有50多個(gè)不同的研究團(tuán)體都是在做計(jì)算輔助辯論方面的研究。但是自2014年以來,IBM已經(jīng)組織了第五次辯論數(shù)據(jù)挖掘研討會(huì),Debater團(tuán)隊(duì)成員在各種高質(zhì)量科學(xué)會(huì)議上發(fā)表了他們?nèi)〉玫募夹g(shù)進(jìn)步,目前已在各個(gè)研究領(lǐng)域發(fā)表了30多篇作品。計(jì)算辯論(Computational Argumentation)正在迅速崛起。
2
演講、聽力理解、模擬困境
IBM海法研究院Project Debater首席研究員Noam Slonim博士在采訪中回顧了辯論過程。
拿到辯題后,Debater首先會(huì)分析單個(gè)辯論問題,然后掃描龐大的語料庫文檔,通過算法找出與辯題相關(guān)性最高的觀點(diǎn)性內(nèi)容,同時(shí)通過算法減少重復(fù)信息。在此基礎(chǔ)上,Debater會(huì)挑選出最有說服力、最具多樣性和支持最完善的論點(diǎn),并對(duì)這些論點(diǎn)進(jìn)行編排,從而形成一段完整且有說服力的敘述。
也就是說,辯論雖然是實(shí)時(shí)辯論,但是機(jī)器辯手和人類辯手在拿到選題后都會(huì)有30分鐘的準(zhǔn)備時(shí)間。30分鐘之內(nèi),Debater會(huì)通過自己的算法,在自己的語料庫中去進(jìn)行搜索,形成有利于自己方面論點(diǎn)的論證。
既然辯論過程是完全即興,Project Debater如何應(yīng)對(duì)完全即興、無法預(yù)期的情況?Noam表示,這要靠知識(shí)圖譜去模擬人類的困境,形成辯駁的能力。比如說涉及到是否要禁止器官的販運(yùn)、器官貿(mào)易,是否要禁止酒精的貿(mào)易。類似于這種類型的辯題,我們可以自然而然期待如果禁止了器官交易、酒精交易,有一種風(fēng)險(xiǎn)是會(huì)有黑市的蓬勃發(fā)展。理論上來講,Project Debater的系統(tǒng)可以理解與這種類型相關(guān)的一些辯論,但凡是針對(duì)這種類型的觀點(diǎn)進(jìn)行辯論,后續(xù)就會(huì)有可能出現(xiàn)與黑市相關(guān)的問題,于是可以在模擬好中的圖譜等待著與黑市相關(guān)話題的出現(xiàn)。但辯論并不總是這樣,比如美國最近討論比較多的是否要禁止在公共場(chǎng)合母乳喂養(yǎng),但這跟黑市一點(diǎn)都沒有關(guān)系,所以我們依然是在這個(gè)方面不斷地去建模、擴(kuò)大語料庫,包括人類豐富的語言中各種細(xì)微和微妙的地方?!斑@樣Project Debater在已經(jīng)建模的知識(shí)圖譜中,才能夠更加精準(zhǔn)地為自己導(dǎo)航,找到與支持自己論點(diǎn)相關(guān)的觀點(diǎn)?!盢oam說到。
那么,Debater的論點(diǎn)是怎么形成的?Noam表示,對(duì)于給定的主題,Project Debater的系統(tǒng)會(huì)在巨大的知識(shí)庫內(nèi)進(jìn)行搜索,尋找最相關(guān)的觀點(diǎn)和證據(jù),然后在其中選擇最吸引人、最多樣化、支持度最高的論點(diǎn),然后把這些構(gòu)建成一個(gè)完整的觀點(diǎn)加以敘述。與關(guān)鍵詞搜索不同,Debater能對(duì)話題即時(shí)產(chǎn)生更深理解,并基于它的搜索結(jié)果等構(gòu)建自己的觀點(diǎn)。
強(qiáng)大的語料庫是Debater展開辯論的基礎(chǔ)。據(jù)悉,訓(xùn)練Debater的語料庫擁有3億多個(gè)可靠信息來源,包含2011年以來全球商業(yè)、法律、學(xué)術(shù)和政府機(jī)構(gòu)等領(lǐng)域的專業(yè)人士所使用的主流報(bào)紙和雜志中的文章,以及維基百科中的內(nèi)容。
IBM研究院團(tuán)隊(duì)為Debater的系統(tǒng)賦予了三大核心能力:
第一,驅(qū)動(dòng)的演講稿撰寫與表達(dá)。Debater第一次證實(shí)了,計(jì)算機(jī)能夠理解大量語料庫,若給定一個(gè)有爭議的主題的簡短描述,它能夠撰寫結(jié)構(gòu)良好的演講內(nèi)容,并清晰且有針對(duì)性地表達(dá)出來,甚至還會(huì)適時(shí)地展現(xiàn)幽默風(fēng)趣。
第二,實(shí)時(shí)聽力理解。當(dāng)對(duì)方辯手開始講的時(shí)候,Project Debater要能聽長達(dá)4分鐘的內(nèi)容,對(duì)方人類辯手在講的過程中語速可能是快的,情感可能是充滿激情的,同時(shí)還會(huì)有一些道德性、倫理性的問題,Project Debater要能夠識(shí)別人類辯手口述的長篇大論中隱含的重要概念及觀點(diǎn)主張,能夠識(shí)別長段連續(xù)口語中隱含的重要概念觀點(diǎn)。
第三,模擬人類困境。通過獨(dú)特的知識(shí)表達(dá)方式來模擬人類爭議和困境,使系統(tǒng)能夠根據(jù)需要提出有原則的論點(diǎn)。研發(fā)團(tuán)隊(duì)總結(jié)了人類專家辯手的一些共同性,對(duì)他進(jìn)行模擬、建模,并且把這個(gè)注入到系統(tǒng)中去,就形成了一個(gè)知識(shí)圖譜給到Project Debater來用。所以一旦開始去進(jìn)行辯論的時(shí)候,Project Debater就可以在已經(jīng)形成的圖譜中去做自己的向?qū)Ш?a target="_blank">索引,找到可以支撐他的證據(jù)。
3
商業(yè)價(jià)值與AI未來發(fā)展
IBM海法研究院Project Debater全球經(jīng)理Ranit Aharonov闡述了如何將Project Debater應(yīng)用到商業(yè)中。
關(guān)于商業(yè)運(yùn)用,Debater僅僅預(yù)示著一個(gè)開始,未來主要有兩大類用途。
第一類是應(yīng)用在有研究、分析的領(lǐng)域,比如幫助金融分析師找出金融事實(shí),用以支持或反對(duì)金融分析師所思考的金融投資選擇;幫助律師尋找相關(guān)案件和主張,或借助Project Debater模擬法庭辯論來分析優(yōu)勢(shì)和劣勢(shì);幫助記者或?qū)W生找出更多信息以改進(jìn)報(bào)告和論文。
第二類是決策領(lǐng)域的應(yīng)用,比如幫助企業(yè)高層分析優(yōu)劣勢(shì),提供基于事實(shí)、沒有人為偏見的觀點(diǎn)?;蛘咄ㄟ^Debater拓寬思路,在關(guān)鍵決策中納入他們可能沒有考慮到的新觀點(diǎn)?!安还苁切畔⒌氖占?、研究分析還是做決策,總的來講,Debater最終的目的是支持基于循證的決策,而不是基于直覺的決策?!?/p>
Ranit同時(shí)表示,Project Debater相關(guān)的項(xiàng)目和技術(shù)依然在進(jìn)行進(jìn)一步深耕之中,其商業(yè)應(yīng)用僅僅是一個(gè)預(yù)設(shè)?!艾F(xiàn)在商業(yè)化為時(shí)尚早,也沒有具體的計(jì)劃?!?/p>
Noam表示,Debater雖然已經(jīng)研發(fā)了六年,但目前仍然是在不斷再開發(fā)、再開發(fā)過程中,在工程、算法上依然有很多的挑戰(zhàn)。比如,目前的Debater只能參與一對(duì)一辯論,無法跟大規(guī)模選手辯論。
Debater是否真正理解對(duì)方辯手的話?當(dāng)網(wǎng)易智能把這個(gè)問題拋出的時(shí)候,Ranit笑著回答說,這是一個(gè)哲學(xué)高度的問題,因?yàn)檫@涉及到我們?nèi)绾稳ダ斫釧I的理解能力。“從結(jié)果上來看,當(dāng)我們就是否要為太空探索來提供資助提出辯論的時(shí)候,AI也能聽,也能回應(yīng),也能形成自己的觀點(diǎn)去辯論,它所展示的是理解了對(duì)方講的話的理解能力。但是如果當(dāng)我們說理解是指人類之間的理解,比如我理解你、你理解我的這種理解、內(nèi)心的理解,意識(shí)到對(duì)方和心理過程的理解,AI目前是沒有這個(gè)理解能力的?!?/p>
在談到Debater所代表的AI的未來發(fā)展方向,Aya Soffer向網(wǎng)易智能表達(dá),希望讓人工智能更像人。人之所以能夠從小數(shù)據(jù)中學(xué)習(xí),就是因?yàn)槿丝梢匀ダ斫飧拍?,并且在概念的基礎(chǔ)上學(xué)以致用到新的領(lǐng)域,這種開放域的應(yīng)用能力是非常強(qiáng)的。發(fā)達(dá)的AI,應(yīng)該不僅從大數(shù)據(jù),還能從小數(shù)據(jù),甚至未來能把概念進(jìn)行學(xué)以致用的應(yīng)用。“我們希望AI進(jìn)一步發(fā)展這個(gè)能力,從比較窄的具體例子中學(xué)習(xí),而后擴(kuò)展到比較寬泛的領(lǐng)域、跨不同領(lǐng)域的應(yīng)用,以及能夠從概念上學(xué)習(xí)?!盇ya說到。
-
IBM
+關(guān)注
關(guān)注
3文章
1743瀏覽量
74595 -
AI
+關(guān)注
關(guān)注
87文章
29886瀏覽量
268174
原文標(biāo)題:【AI專題】揭秘IBM AI辯手:AlphaGo之后新的里程碑?
文章出處:【微信號(hào):IBMGCG,微信公眾號(hào):IBM中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論