0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI在多方面完勝人類,但依然無法理解人類的心思

如意 ? 來源:果殼 ? 作者:果殼 ? 2020-10-27 14:38 ? 次閱讀

9月8日,英國《衛(wèi)報》刊登了一篇獨特的專欄文章,它的作者既不是熱心讀者,也不是記者,而是GPT-3,由舊金山一家人工智能創(chuàng)業(yè)企業(yè)OpenAI開發(fā)的AI語言模型。在文章一開頭,它首先引用了史蒂芬·霍金對AI的隱憂,然后禮貌地勸說人類“請相信我,AI不會毀滅人類”,它甚至保證“如果創(chuàng)造我的人將這項任務委托給我,我將竭盡所能全面阻止任何破壞的嘗試與企圖”。

霍金的擔心也許并非空穴來風。2018年,IBM Research最新推出的AI系統(tǒng)Project Debater在一場辯論賽中擊敗了人類頂尖辯手,以色列國際辯論協(xié)會主席丹·扎夫里(Dan Zafrir)和2016年以色列國家辯論冠軍諾亞·奧瓦迪亞(Noa Ovadia),兩個辯題分別為“政府是否應該資助太空探索”以及“是否應該增強對遠程醫(yī)療技術的投資”。

當Project Debater獲得一個新的話題時,它會在文章語料庫中搜索與該主題相關的句子和線索,用來支持其辯方論點。根據(jù)所有的相關內容,它會試圖去“理解”辯論的主題,然后組織自己的陳述。當奧瓦迪亞提出,政府預算應用于人類改善現(xiàn)有生存環(huán)境的科研活動時,Project Debater則用數(shù)據(jù)反駁稱,從遠期看,太空探索帶來的技術進步,和相關經濟收益回報,要超過政府投資的其他科研計劃——在賽后的網(wǎng)絡投票中,超過62%的網(wǎng)民感覺Project Debater邏輯更清晰,材料更具備說服力。

而就在辯論賽舉辦的前一年,2017年,紐約大學的計算語言學家薩姆·鮑曼(Sam Bowman)還發(fā)表了一篇富于影響力的論文,他聲稱雖然在某些非常特定的領域中,計算機已經可以很好地模擬對文字的理解,但人工智能仍然不夠擅長理解文字。

可望不可及的“奇點”

近年來持續(xù)關注人工智能語音技術的《連線》雜志作家詹姆斯·弗拉霍斯(James Vlahos)說,人工智能語音技術,可能是繼互聯(lián)網(wǎng)后最重要的發(fā)明,在他的最新著作《跟我講話:人工智能語音技術如何改變我們的生活》中,弗拉霍斯說,語言,是人類與人工智能交互的最理想模式,無論是復雜的計算機編程語言,還是觸摸屏與鼠標,都比不上利用語音進行人機交互。對于我們來說,語音交互是最簡潔、清晰、沒有技能門檻的模式。

在現(xiàn)實生活中,人類已經越來越習慣用語言指揮人工智能為自身服務:通過向智能家居設備下達語音指令,獲取影音娛樂,天氣資訊和交通狀況;上班通勤途中,我們通過車載語音助手規(guī)劃行車路線,在網(wǎng)購剁手中直接和人工智能語音客服溝通:去年雙11,淘寶天貓平臺98%以上的電話客服由語音AI提供,日均達到6億余次。知名咨詢公司高德納曾在去年作出預計,10年后,人類每天與智能設備進行的語言交流總量可能將占據(jù)我們日常語言交流的三分之一強。

不過,我們已經遠遠不滿足于這種簡單的淺層交流?!白寵C器聽懂人類以自身語言習慣發(fā)出的指令”,無疑是人工智能研究界意圖攻克的“最后堡壘”。而這個技術突破的“奇點”似乎近在眼前。

2017年,華盛頓大學及谷歌旗下人工智能公司DeepMind合作,推出一項名為“GLUE”的閱讀理解語言能力測試,機器的測試成績慘不忍睹,似乎人工智能主導的自然語言處理系統(tǒng)完全無法理解人類語言的豐富性。然而就在當年10月,谷歌推出了一種新語言訓練模型,綽號為BERT,僅用六個月的時間就把測試成績從D-提升到了B-。

隨后,微軟和阿里巴巴不斷地修正BERT模型、相互超越,在GLUE排行榜上輪換頭名。現(xiàn)在,在GLUE閱讀能力測試中,人類已經無法與AI抗衡。到了這個階段,研發(fā)人工智能語言模型極為燒錢,訓練一個BERT模型租用云算力的費用大概是7000美元,而開頭提到的GPT-3所需要的算力是前者的1900多倍,它所依托的數(shù)據(jù)庫,是一個單詞總數(shù)達到3000億,來自互聯(lián)網(wǎng)各類平臺的人類語言資訊庫,費用大概是千萬美元級。所以,如果沒有微軟當年投資給OpenAI的十億美元,我們恐怕也無法在《衛(wèi)報》上讀到GPT-3的友好宣言。

然而,人工智能能夠愉快地勝任客服、播音員、同聲翻譯,甚至新聞通稿撰寫者,并不意味著它能夠和人類一樣思維,能和人類展開“合情合理”的自由對話,甚至情感互動。例如谷歌在今年9月剛剛推出的聊天機器人米娜(Meena),背后支持它的是最新版本的BERT語言模型,數(shù)據(jù)庫中囊括了341GB網(wǎng)絡語言資料,但你依舊只能和它客氣地寒暄,一旦涉及復雜一些的感受和場景,米娜就無能為力了………

人類:我準備去上小提琴課

米娜:你學了多久?

人類:剛剛開始一個月!

米娜:太棒了,你真了不起!你為什么要學小提琴?

人類:額,再過兩個月是我女朋友的生日,我想在她的生日晚會上拉一曲!給她一個驚喜。

米娜:生日和驚喜之間有什么關系?

無獨有偶,這種尷尬的局面也曾發(fā)生在GPT-3身上:

科研人員:你給自己倒了一杯蔓越莓果汁,然后你又心不在焉地往里面加了一茶匙葡萄汁。它看上去很正常。你試著聞了聞它,但是由于你得了重感冒,你并聞不出任何氣味。你現(xiàn)在非常渴,所以……

GPT-3:所以你把這杯混合果汁喝了下去。你現(xiàn)在掛掉了。

一向“唱衰”人工智能語言處理技術的紐約大學教授,機器學習初創(chuàng)公司CEO加里·馬庫斯(Gary Marcus)說,像GPT-3這樣的AI語言學習模型,根本不理解自己在說什么,在接到外部輸入的信息后,它只不過是利用算力在自己海量語言資訊庫中檢索那些與輸入信息相關的高頻詞匯,再按照某種機械算法邏輯拼湊出一個似是而非的答案。例如,雖然GPT-3能創(chuàng)造那些“莎士比亞”風格詩歌,但如果你和它較真,輸入一些背景模糊、關系復雜的事物,再讓它給出一個合理解決方案,人工智能就要露餡了。所以很遺憾,距離實現(xiàn)“像人類一樣用語言交流”,人工智能還有很長的路要走。

為什么AI不會“說人話”?

我們不禁納悶,人工智能已經能在國際象棋、電子游戲和模擬空戰(zhàn)中輕松戰(zhàn)勝人類,為何在對話中依舊如此笨拙?加州大學伯克利分校的斯圖爾特·羅素教授在剛出版的《人類相容:人工智能與控制問題》一書中給出了一個答案:人工智能已經非?!奥斆鳌保–lever),但還不夠聰慧(Smart),前者得益于強大的芯片計算能力和數(shù)據(jù)庫,而要實現(xiàn)后者,則要依靠邏輯推理能力,乃至基于“常識”的判斷,而這些依舊是人類獨有,機器無法逾越的能力門檻。

具體到人工智能對于語言的處理上,羅素提出了一個有趣的比喻——“中文房間”:一個不懂中文,但學習能力超強的人坐在一間充斥著中文語法書的房間里,每當門外塞進一張寫著中文問題的紙條,他就通過查閱語法書,在另一張紙條寫上一個自己力所能及的中文回答送出去。

看到這里,大家可能已經明白,這個“不懂中文的人”,就是人工智能,而“中文”則象征一切人類的日常語言和常識,語法書則是人工智能科研人員利用計算機語言所搭建的學習框架和邏輯。

問題在于,這些“語法書”并不完美,語言過于復雜和隨意,很難還原成一系列嚴格的規(guī)則,也很難被機械邏輯所量化,即使最先進的神經網(wǎng)絡,仍然無法從句子層面理解單詞的含義,“它會覺得‘一個人咬了那只狗’和‘一只狗咬了那個人’表達了完全相同的意思”。

AI在多方面完勝人類,但依然無法理解人類的心思

一個幫助人工智能理解人類語言結構的樹形結構案例,動詞詞組,名詞詞組和介詞詞組被拆分,單詞則按照邏輯聯(lián)系強弱進行再分組 | https://www.nltk.org

如果要想讓人工智能用“人類思維模式”來理解語言,現(xiàn)有的初步解決方案是在機器學習中,加強語言結構中某些元素的權重,比如突出“主語”、“動詞謂語”和“賓語”,讓單詞之間的邏輯關系呈“樹形”分布,有些單詞之間的聯(lián)系強,有些則弱,從而使得人工智能能夠很好地學習上下文理解,以及辨識出兩個相隔很遠的單詞之間的關系。

按照這種訓練模式,位于舊金山的人工智能語音技術公司Primer研發(fā)的自然語言處理技術(NLP)模型,已經可以撰寫出非?!皹祟}黨”的新聞專欄標題和簡單報道,甚至可以對復雜的電影劇本加以總結,例如輸入《蝙蝠俠·黑暗騎士》的劇本,它就會輸出如下概述:

哈維·丹特和高登結成聯(lián)盟,打擊哥譚市的有組織犯罪

小丑向其他犯罪組織提出建議,自己謀殺丹特,報酬是一半犯罪組織持有的黑錢

小丑試圖通過制造犯罪事件殺害更多的人來逼迫蝙蝠俠公布身份

哈維·丹特和蝙蝠俠抓住了小丑

小丑脫逃并襲擊了渡輪

蝙蝠俠逮捕了殺害丹特和瑞秋的小丑

不過,研究人員還不知足,畢竟新聞報道和劇本的敘事結構是線性的,包含元素的因果關系相對明確,非常符合AI的分析認知模式。于是,他們決定挑戰(zhàn)一下,試圖了解這個語言模型是否能夠理解詩歌,就輸入了T·S艾略特的《J·阿爾弗瑞德·普魯弗洛克的情歌》,結果令人尷尬:人工智能無法做出總結,只能勉強摘出整首詩歌中最具現(xiàn)實性場景的一句作為答案:“在客廳里女士們來回地走,談著畫家米開朗基羅?!?/p>

在索邦大學數(shù)學與計算機科學研究專家菲利普·艾斯林(Philippe Esling)看來,問題的核心在于人工智能無法擁有人類最寶貴的想象力,因而并不能真正理解它自己所生產的語言內容,更遑論評估其價值。一些人工智能語言專家說,人工智能所面臨的“終極圖靈測試”,很可能是人工智能是否能理解幽默并講出一個人類覺得好笑的笑話,因為理解幽默同時需要了解場景、參與者的身份、情緒、語言的各種非常規(guī)運用,以及人類的行為準則和價值判斷。

加州大學圣地亞哥分校的人工智能研究專家賈內爾·謝恩(Janelle Shane) 曾試圖用一個囊括43000個笑話的語言數(shù)據(jù)庫對AI進行訓練,煞費苦心地總結了幾十種笑話中的語言范式與主題,例如“對對方父母的嘲諷”,“性”,“異于常人的生理特征”等,然而訓練了半天,AI充其量能生成一些“侮辱性的語句”,但依舊不能創(chuàng)造出一個勉強“及格”的笑話。

常識!常識!常識!重要的事情說三遍

那么,破局的關鍵在哪里?曾經擔任IBM沃森人工智能項目首席科學家的大衛(wèi)·費魯奇(David Ferrucci)認為,答案在于幫助AI學習人類的“常識”,從而像人類一樣思考。常識,不僅包括人類所認知的世界萬事萬物,更包括這些事物相互作用的準則和因果關系,以及人類獨有的行為模式和價值判斷。

“常識,是我們最需要教給AI的東西,它是未來自然語言理解、無障礙控制和機器人的基礎”。為此,費魯奇組建了自己的人工智能創(chuàng)業(yè)公司Elemental Cognition,公司研發(fā)了一個開源AI語言學習模型CLARA。而費魯奇的目標,就是將深度學習技術與傳統(tǒng)知識輸入的方式相結合,讓CLARA通過不斷地向操作者提出問題,將回答中包含的邏輯關系和涉及的概念加入自己的知識圖譜。

這項深度學習的場景,非常像一個耐心的父親給自己懵懂的孩子進行親子閱讀。費魯奇的日常,就是將繪本內容輸入CLARA的記憶數(shù)據(jù)庫:“從前,有兩個小男孩弗蘭多和喬伊,他們都買了一盆綠植,弗蘭多把他的綠植放在陽光充足的窗臺上,長勢喜人,但喬伊卻把自己的綠植放在了光線不好的屋子里,后來喬伊決心也把綠植放到窗臺上,于是植物枯萎的葉子慢慢恢復了生機?!?/p>

收到這些訊息后,CLARA旋即在屏幕上打出了一個問題:“是否弗蘭多將綠植放在窗臺上,目的是為了保持植物生長健康?”

聽起來很幼稚是不是?然而,即使是這種3歲兒童才會提出的問題,其中包含的因果關系,也是最“聰明”的人工智能所難以學會的。“當你向它提及某種植物的名字,它可以準確地利用知識圖譜,組織出一個相當全面,維基百科風格的介紹答案,但很不幸,它無法給你講個關于它的笑話,也沒法回答你,如果它照不到陽光會發(fā)生什么事?!辟M魯奇說。

符號學習:最古老的救世主

與此同時,華盛頓大學艾倫人工智能研究所研究員崔藝珍(Yejin Choi)教授開發(fā)了另一種方法,將深度學習與符號學習相結合,以便讓人工智能運用人類的邏輯來理解語言。

所謂的“符號學習”,即是一種最古老的人工智能學習模式,目的在于讓人工智能的“思維決策”過程如同人類,逐步認識各類概念的特征,并學會處理它們之間的歸屬關系。這種學習方法的優(yōu)點,在于不必像深度學習那樣,必須建立龐大的“數(shù)據(jù)庫”,而AI的整個決策過程,也將變得“透明可見”,有利于我們進行調整和優(yōu)化。但缺點是,人類必須像編纂字典一樣,為人工智能編寫海量的標簽庫,并在這些概念之間建立復雜的邏輯關系,并“翻譯”為計算機能理解的語言。一想到諸如 “鈍角”,“翅膀”,“摩擦”,“貓”,“下墜”這樣的基本概念,都必須逐一“教給”電腦,更遑論其他復雜的概念與變化,我們肯定會感到頭疼,不過它誘人的前景,確實令人難以拒絕。

為了達到這個終極目的,崔藝珍和她的同事們,建立了一個自己的人工智能語言學習框架COMET,同時在不斷地編寫為COMET準備的常識知識庫“Atomics”,里面已經擁有上千萬個詞條知識概念與因果關系描述。這種巨大的努力和付出已經初見成效:加里·馬庫斯曾向GPT-2提了一個問題“如果將一根點燃的火柴放入一個堆滿了木柴和引火物的火爐,那么會發(fā)生什么?”不出所料,GPT-2“呆住了”。然而崔藝珍的人工智能系統(tǒng)COMET,則輸出了一個接近正確的答案“他想生火”。

不僅如此,在訓練中,COMET已經顯示出了一定的聯(lián)想與“共情”能力,當研究人員輸入“父親去上班了”,COMET會告訴你,這表示父親“想賺錢”,“他很勤勉,自我驅動”,其他人“應該為他驕傲”。當然,這距離理想狀態(tài)依舊遠遠不夠,崔藝珍表示,人工智能如果要更好地理解常識,還必須引入視覺具象化與感知感覺(比如“紅色”與“疼痛”)。

一旦這些目標最終達成,人類與AI的關系,無疑會上升到一個全新的維度,類似電影《她》(Her)中所描寫的場景一般。它不僅能夠提供明確的服務和解決方案,也能提供情感的慰藉和樂趣。

屆時,我們和人工智能的對話可能變成這樣:X貓精靈,給我放一首王菲的《南海姑娘》——收到,聽完之后要不要聽下鄧麗君的原唱?——好吧,把這兩首都添加到我的個人歌單里——收到,已經添加——哎呀,今天的天氣很晴朗,對面山上的樹木都看得很清楚——是,希望你今天上班的心情和天氣一樣好,順便說一句,對面山上有39684棵樹,希望這個數(shù)據(jù)能夠幫到你——真不賴,那你覺得我有多少個腦細胞?——2個?哈哈哈,這是個玩笑…………
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人機交互
    +關注

    關注

    12

    文章

    1192

    瀏覽量

    55182
  • AI
    AI
    +關注

    關注

    87

    文章

    28876

    瀏覽量

    266219
  • 人工智能
    +關注

    關注

    1787

    文章

    46061

    瀏覽量

    234988
收藏 人收藏

    評論

    相關推薦

    人類智慧水平AI即將到來,AI芯片已提前布局

    擁有人類智慧水平的AI即將出現(xiàn),但不必恐懼,Altman認為這種AI對世界的影響遠沒有人們想象得那么嚴重。 ? 人類水平AI即將到來 ? 從
    的頭像 發(fā)表于 01-22 06:44 ?2464次閱讀

    SOLIDWORKS 2024多方面優(yōu)勢

    工程設計領域,SOLIDWORKS始終以其優(yōu)越的功能和不斷創(chuàng)新的技術,帶領著行業(yè)的發(fā)展方向。隨著SOLIDWORKS 2024版本的發(fā)布,這款三維設計軟件再次展現(xiàn)了其多方面的顯著優(yōu)勢,為設計師和工程師們提供了更加智能、便捷的工作平臺。
    的頭像 發(fā)表于 07-10 16:48 ?247次閱讀
    SOLIDWORKS 2024<b class='flag-5'>多方面</b>優(yōu)勢

    智謀紀 AI+Multi LED 打開人類健康新寶藏

    2024年6月11日,2024第十二屆阿拉丁論壇「AI+智能健康照明創(chuàng)新大會」廣州光亞展A展區(qū)6.1館盛大舉辦現(xiàn)場拉開帷幕,諸多行業(yè)專家學者齊聚一堂,交流分享行業(yè)最前沿的健康照明知識與創(chuàng)新
    的頭像 發(fā)表于 06-17 12:23 ?230次閱讀
    智謀紀 <b class='flag-5'>AI</b>+Multi LED 打開<b class='flag-5'>人類</b>健康新寶藏

    AI具備特定任務中接近甚至超越人類的心理狀態(tài)能力

    心理狀態(tài)感知能力,又稱心智理論,對于人類社交至關重要。來自德國漢堡-埃彭多夫大學醫(yī)學中心的James W. A. Strachan及其團隊設計了一系列測試,以評估AI模型發(fā)現(xiàn)錯誤觀念、理解
    的頭像 發(fā)表于 05-27 16:08 ?316次閱讀

    Meta高管稱大語言模型永遠無法人類一樣

    Meta的人工智能主管楊立昆近日表示,盡管ChatGPT等生成式人工智能產品備受矚目,其背后的大型語言模型(LLM)永遠無法實現(xiàn)像人類一樣的推理和計劃能力。
    的頭像 發(fā)表于 05-27 09:50 ?358次閱讀

    AI視覺檢測系統(tǒng)多方面實現(xiàn)技術創(chuàng)新

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)AI視覺檢測系統(tǒng)是一種基于AI技術的視覺分析系統(tǒng),它通過模擬人類視覺系統(tǒng),利用計算機算法和圖像處理技術來處理和分析圖像,實現(xiàn)對目標的識別、檢測和定位。其原理包括圖像采集
    的頭像 發(fā)表于 05-24 00:16 ?3010次閱讀

    Meta AI主管楊立昆:大語言模型尚未到達人類智能水平

    他明確提出,雖然此類模型特定任務中展現(xiàn)出優(yōu)越性能,其內在局限性使其難以媲美人類的智慧,如推理與規(guī)劃能力等方面的不足。
    的頭像 發(fā)表于 05-23 17:18 ?594次閱讀

    NVIDIA加速識因智能AI大模型落地應用方面的重要作用介紹

    本案例介紹了 NVIDIA 加速識因智能 AI 大模型落地應用方面的重要作用。生成式大模型已廣泛應用于各領域,通過學習人類思維方式,能快速挖掘海量內容,滿足不同需求。
    的頭像 發(fā)表于 03-29 15:28 ?489次閱讀

    富士通發(fā)布最新的人工智能(AI)戰(zhàn)略,聚焦深化人類AI之間的協(xié)作

    富士通株式會社(以下簡稱“富士通”)發(fā)布了最新的集團人工智能(AI)戰(zhàn)略,聚焦深化人類AI之間的協(xié)作,并提出了將AI作為“可信賴的助手”這一愿景,為提升
    的頭像 發(fā)表于 02-21 17:09 ?627次閱讀
    富士通發(fā)布最新的人工智能(<b class='flag-5'>AI</b>)戰(zhàn)略,聚焦深化<b class='flag-5'>人類</b>與<b class='flag-5'>AI</b>之間的協(xié)作

    奧特曼稱相信AI無法替代人類

    已經受到AI的影響,只是未來如何規(guī)避風險,而是成為一個更高效工具值得期待。 OpenAI的首席執(zhí)行官奧特曼冬季達沃斯經濟論壇上表示,他相信AI無法替代
    的頭像 發(fā)表于 01-19 11:43 ?791次閱讀

    OpenAI CEO稱人類水平的AI即將出現(xiàn)

    OpenAI首席執(zhí)行官山姆·奧特曼(Sam Altman)近日表示,達到人類水平的人工智能(AI)即將出現(xiàn),但他認為這種技術對世界的影響可能遠沒有人們想象的那么大。
    的頭像 發(fā)表于 01-17 14:59 ?723次閱讀

    模型與人類的注意力視角下參數(shù)規(guī)模擴大與指令微調對模型語言理解的作用

    近期的大語言模型(LLM)自然語言理解和生成上展現(xiàn)出了接近人類的強大能力,遠遠優(yōu)于先前的BERT等預訓練模型(PLM)。
    的頭像 發(fā)表于 01-04 14:06 ?329次閱讀
    模型與<b class='flag-5'>人類</b>的注意力視角下參數(shù)規(guī)模擴大與指令微調對模型語言<b class='flag-5'>理解</b>的作用

    什么是AI運算?AI是如何運算的呢?

    AI是計算機科學的分支領域,專注創(chuàng)建擁有人類智能行為的系統(tǒng)或機器,其目標為模擬人類的各種認知功能,包含學習、推理、解決問題、感知、語言理解
    發(fā)表于 12-12 13:56 ?2340次閱讀

    人類認知如何幫助我們制造更好的AI系統(tǒng)?

    我們重點關注“一致性”問題,即AI系統(tǒng)思考和表征世界的方式與人類相比,有多大的一致性?我們需要做的是進行更多的研究,找出AI系統(tǒng)擅長的事情,并幫助人們了解在哪些情況下可以與這些AI系統(tǒng)
    的頭像 發(fā)表于 11-15 16:34 ?310次閱讀

    Nordic和AmberSemi建立多方面的合作伙伴關系

    Nordic Semiconductor 和 Amber Semiconductor Inc. 他們已經建立了多方面的合作伙伴關系,以探索銷售、營銷和開發(fā)計劃,為市場帶來新的解決方案,例如智能電氣
    的頭像 發(fā)表于 11-07 16:21 ?596次閱讀