在人工智能幾經(jīng)起落的發(fā)展史里,人工智能進(jìn)化的里程碑式的演進(jìn)中,我們總會(huì)看見(jiàn)百年企業(yè) IBM 的身影。除了大家所熟知的 1997 年 IBM 的深藍(lán)計(jì)算機(jī)在國(guó)際象棋比賽(和復(fù)賽)中擊敗國(guó)際象棋世界冠軍 Garry Kasparov,還有上世紀(jì)的跳棋人機(jī)大戰(zhàn)等諸多事件。而今天,在大模型的時(shí)代,IBM 帶來(lái)了針對(duì)基礎(chǔ)模型 watsonx 和生成式 AI 的全新平臺(tái) —— watsonx。
IBM 大中華區(qū)董事長(zhǎng)、總經(jīng)理陳旭東這樣說(shuō)道:“ChatGPT 的橫空出世,證明了大語(yǔ)言模型是一條走得通、通往未來(lái) AI 的道路,也意味著 AI 的發(fā)展經(jīng)過(guò)幾十年的算法、算力、數(shù)據(jù)方面的量變積累,‘質(zhì)變時(shí)刻’已經(jīng)到來(lái)?!?/p>
2011 年,IBM(國(guó)際商業(yè)機(jī)器公司)正式踏入了百年企業(yè)的行列,它是世界上最具影響力的科技公司之一,具有豐富的歷史和卓越的技術(shù)傳統(tǒng)。IBM 當(dāng)時(shí)舉辦了一場(chǎng)紀(jì)念百年輝煌歷程的盛大慶典,用一部短片將 IBM 的百年歷史濃縮成了令人陶醉的幾分鐘,并全球各個(gè)角落提供了為時(shí)一整年的志愿者活動(dòng)。
直到現(xiàn)在,我們?nèi)匀豢梢酝ㄟ^(guò) IBM 100 網(wǎng)頁(yè)穿越時(shí)空,回顧從機(jī)械制表機(jī)起,逐一瀏覽原子重排技術(shù)、Fortran、RISC、大型機(jī)、個(gè)人電腦、小型機(jī)、深藍(lán)、Watson 的每一個(gè)創(chuàng)舉。
2023 年,IBM 百年慶典后的第十二年,這是屬于 AI 的一年。各行各業(yè)的公司紛紛加入這股智能潮流,研發(fā)各形各色的大模型,推出可以為我們規(guī)劃假期的生成式聊天機(jī)器人、組織企業(yè)數(shù)據(jù)的 AI 智能助手以及可以創(chuàng)建圖像和視頻的 AI 服務(wù)。今年 8 月,IBM 也緊跟著這道熱潮,宣布啟動(dòng)新一代 AI 與數(shù)據(jù)平臺(tái) IBM watsonx,為企業(yè)級(jí)基礎(chǔ)模型和生成式 AI 提供動(dòng)力。
這是繼紅帽 OpenShift 開(kāi)放式混合云技術(shù)平臺(tái)之后,IBM 落地大中華區(qū)市場(chǎng)的又一個(gè)具有里程碑意義的開(kāi)放式 AI 技術(shù)平臺(tái)。
“Watson ”是 IBM 創(chuàng)始人老沃森的名字,也是 IBM 文化奠基人托馬斯·J·沃森(Thomas J. Watson Sr.)的名字。隨著時(shí)間的推移,這個(gè)名字變得更加具有象征性,代表了 IBM 在人工智能領(lǐng)域的雄心壯志和創(chuàng)新。若要回溯這些歷史,還得先從那些不起眼的象棋棋子開(kāi)始。
始于棋局的 AI
自 20 世紀(jì) 40 年代末人工智能和第一臺(tái)計(jì)算機(jī)出現(xiàn)以來(lái),計(jì)算機(jī)象棋就與人工智能領(lǐng)域聯(lián)系在一起。
這兩個(gè)領(lǐng)域交織了許多知名人士,例如艾倫·圖靈(Alan Turing),現(xiàn)代計(jì)算機(jī)科學(xué)的奠基人;約翰·麥卡錫 (John McCarthy) ,“人工智能”一詞的創(chuàng)造者;布爾邏輯先驅(qū)克勞德·香農(nóng)(Claude Shannon),他率先支持使用國(guó)際象棋作為智力發(fā)展的適當(dāng)起點(diǎn)。
其中,圖靈并沒(méi)有被當(dāng)時(shí)技術(shù)的缺乏和先例的確立所嚇倒,而是尋求支持他的理論,并為世界上第一個(gè)國(guó)際象棋程序編寫(xiě)了算法。不幸的是,這個(gè)由圖靈本人寫(xiě)在紙上并實(shí)施的程序,很快就被一名同事輕松地?fù)魯×恕?/p>
從那以后,大量的程序員投入時(shí)間和精力來(lái)研究國(guó)際象棋,他們堅(jiān)信這個(gè)游戲?qū)?huì)使人工智能領(lǐng)域取得突破性進(jìn)展。這些研究人員在國(guó)際象棋的結(jié)構(gòu)中看到了一個(gè)大規(guī)模問(wèn)題解決的簡(jiǎn)化模型。而從人類比較的角度來(lái)看,世界各地已經(jīng)存在的國(guó)際象棋選手的等級(jí)體系則為工程師提供了一個(gè)用來(lái)輕松而準(zhǔn)確地衡量機(jī)器實(shí)力的標(biāo)尺。
幾十年的研究幾乎沒(méi)有取得進(jìn)展,許多計(jì)算機(jī)都曾與眾多國(guó)際象棋大師對(duì)弈,無(wú)一得勝。直到 1985 年,卡內(nèi)基梅隆大學(xué)的研究生許峰雄(Feng-hsiung Hsu)開(kāi)始著手他的論文項(xiàng)目:ChipTest,一臺(tái)國(guó)際象棋機(jī)器。許峰雄的同學(xué) Murray Campbell 也參與其中,并在 1989 年被聘為 IBM Research 的工作人員。他們加入了 IBM 的團(tuán)隊(duì),并將該項(xiàng)目命名為“深藍(lán)”(Deep Blue)。
憑借強(qiáng)大的硬件系統(tǒng)和創(chuàng)新的評(píng)測(cè)功能,深藍(lán)一號(hào)在 1996 年以六局的賽制(six-game chess matches)發(fā)起了比賽,與當(dāng)時(shí)的國(guó)際象棋世界冠軍卡斯帕羅夫?qū)Q。令許多人驚訝的是,深藍(lán)直接拿下了第一局,這也是機(jī)器首次戰(zhàn)勝國(guó)際象棋世界冠軍。然而,卡斯帕羅夫并沒(méi)被早期失利嚇倒,而是最終以四比二的比分贏得了整個(gè)比賽。
經(jīng)過(guò)多次更新和提高其國(guó)際象棋知識(shí)以對(duì)抗上一場(chǎng)比賽中使用的策略,重建的深藍(lán)在 1997 年的復(fù)賽中戰(zhàn)勝了卡斯帕羅夫。
在比賽中,卡斯帕羅夫擅長(zhǎng)的非傳統(tǒng)開(kāi)局、心理威嚇和超時(shí)戰(zhàn)術(shù)對(duì)機(jī)器沒(méi)有任何影響,因?yàn)樯钏{(lán)只會(huì)冷靜地識(shí)別和分析棋局上的情況:人類玩家在棋盤(pán)上表現(xiàn)出的威脅和情感在機(jī)器對(duì)局勢(shì)的評(píng)估中沒(méi)有太大影響。
深藍(lán)使用的架構(gòu)并未局限于賽場(chǎng),而是很快應(yīng)用到金融建模、數(shù)據(jù)挖掘和分子動(dòng)力學(xué)等方面。最終,深藍(lán)被退役并存放在華盛頓特區(qū)的史密森尼博物館,結(jié)束了風(fēng)光的一生。在 AI 領(lǐng)域,IBM 也沒(méi)有因此懈怠,而是投入到另一項(xiàng)重大挑戰(zhàn):打造一臺(tái)能夠在更復(fù)雜的游戲中擊敗人類冠軍的計(jì)算機(jī)。
AI 能思考嗎?
2011 年,IBM 的 Watson 計(jì)算機(jī)參加了電視智力競(jìng)賽節(jié)目《危險(xiǎn)邊緣》(Jeopardy?。┑谋荣?,對(duì)抗該節(jié)目有史以來(lái)最杰出的兩位冠軍選手。Watson 計(jì)算機(jī)由 IBM 研究部門(mén)開(kāi)發(fā),可以運(yùn)行一個(gè)名為 Deep QA 的軟件。雖然這個(gè)項(xiàng)目的主要挑戰(zhàn)是在《危險(xiǎn)邊緣》中獲勝,但 Watson 的真實(shí)目標(biāo)是創(chuàng)建一代新的技術(shù),試圖戰(zhàn)勝標(biāo)準(zhǔn)搜索技術(shù),更有效地從非結(jié)構(gòu)化數(shù)據(jù)中找到答案。
耳熟嗎?是否很像那個(gè)爆紅的對(duì)話式人工智能——ChatGPT。對(duì)于 IBM 的科學(xué)家而言,這不是什么很難想到的創(chuàng)意,但它涌現(xiàn)出的奇跡卻未能在 2011 年提前現(xiàn)世,而是需要沉淀 12 年的數(shù)據(jù)。
節(jié)目中,Watson 在理解復(fù)雜問(wèn)題和找到最佳答案方面表現(xiàn)出色。IBM 的科學(xué)家也做出了解釋,指出 Watson 實(shí)際上不會(huì)思考。
“我們的目標(biāo)是構(gòu)建一臺(tái)計(jì)算機(jī),能夠更有效地理解和運(yùn)用自然語(yǔ)言,但并不一定需要以與人類相同的方式思考,而不是模仿人腦,”曾在 IBM 研究部門(mén)工作了 15 年,專注于自然語(yǔ)言問(wèn)題和在非結(jié)構(gòu)化信息中找到答案的 David Ferrucci 說(shuō)道。
《危險(xiǎn)邊緣》的問(wèn)題充滿了微妙之處、雙關(guān)語(yǔ)和文字游戲,這些典型的腦筋急轉(zhuǎn)彎問(wèn)題充斥著計(jì)算機(jī)難以應(yīng)對(duì)的元素。計(jì)算機(jī)從來(lái)都不擅長(zhǎng)尋找答案。搜索引擎不會(huì)回答問(wèn)題,它們只會(huì)提供與關(guān)鍵詞匹配的成千上萬(wàn)個(gè)搜索結(jié)果。
長(zhǎng)期以來(lái),大學(xué)研究人員和公司工程師一直致力于創(chuàng)造一個(gè)完美的問(wèn)答軟件,但最優(yōu)秀的軟件也只能理解和回答簡(jiǎn)單直接的問(wèn)題——哪怕是 2023 年的今天,問(wèn)答大模型也經(jīng)常會(huì)“胡謅”出一堆子虛烏有的事實(shí)來(lái)敷衍我們。 Watson 運(yùn)行在一組 Power 750 計(jì)算機(jī)上,包括十個(gè)機(jī)架,90 個(gè)服務(wù)器,共計(jì) 2880 個(gè)處理器核心。它可以容納大約相當(dāng)于一百萬(wàn)本書(shū)的信息。IBM 耗費(fèi)多年時(shí)間讓 Watson 吸收了大量信息,包括商業(yè)來(lái)源的文本以及允許公開(kāi)復(fù)制其內(nèi)容的來(lái)源(如維基百科)。
主持人向 Watson 提出問(wèn)題時(shí),超過(guò) 100 個(gè)算法將以不同的方式分析問(wèn)題,并同時(shí)找到許多不同的合理答案。另一組算法則會(huì)對(duì)答案進(jìn)行排名并給出分?jǐn)?shù)。對(duì)于每個(gè)可能的答案,Watson 會(huì)找到可能支持或反駁該答案的證據(jù)。然而,在《危險(xiǎn)邊緣》的比賽中,如果最高排名的可能答案評(píng)級(jí)不高到足以給 Watson 足夠的信心,那么 Watson 會(huì)決定不按鍵,以避免答錯(cuò)而損失分?jǐn)?shù)。
2010 年末,Watson 進(jìn)行過(guò)一輪測(cè)試,在與前《危險(xiǎn)邊緣》冠軍選手對(duì)戰(zhàn)的比賽中贏得約 70%的比賽。然后,2011 年 2 月,迭代到最新版本的 Watson 戰(zhàn)勝了《危險(xiǎn)邊緣》的人類巨星肯·詹寧斯(Ken Jennings)和布拉德·拉特(Brad Rutter)。
“Watson 之父”約翰·凱利表示:“我想創(chuàng)建一些可以引入到每個(gè)其他零售行業(yè)、交通運(yùn)輸行業(yè)等領(lǐng)域的東西,因?yàn)闊o(wú)論在哪里,時(shí)間都至關(guān)重要,需要將尖端信息提供給前線決策者。計(jì)算機(jī)需要從后勤變成提高人類決策智慧的工具?!?/p>
深藍(lán)和 Watson 分別代表了 IBM 在 AI 領(lǐng)域的兩個(gè)巔峰時(shí)刻。深藍(lán)的勝利證明了機(jī)器在高度專業(yè)領(lǐng)域的潛力,而 Watson 則將 AI 引入了自然語(yǔ)言處理和商業(yè)應(yīng)用的新領(lǐng)域。這兩個(gè)里程碑都為 IBM 在 AI 領(lǐng)域的未來(lái)探索奠定了堅(jiān)實(shí)基礎(chǔ)。
擁抱基礎(chǔ)模型與生成式 AI
上世紀(jì) 80 年代,IBM 猶如硅谷之巔的一尊巨獸,等待著挑戰(zhàn)。微軟和蘋(píng)果虎視眈眈,而無(wú)數(shù)初創(chuàng)企業(yè)也躍躍欲試。幾十年來(lái),IBM 一直走在突破性人工智能科技的前沿。從深藍(lán)到 Watson,再到云原生時(shí)代,在云計(jì)算的基礎(chǔ)上構(gòu)建了 AI 超級(jí)計(jì)算機(jī)。然而,AI 寒冬太過(guò)漫長(zhǎng),許多公司放棄了在人工智能領(lǐng)域的探索,投入資源更多地用于其他領(lǐng)域。
隨著 ChatGPT 點(diǎn)燃了這場(chǎng)寒冬,企業(yè)對(duì)生成式 AI 和大語(yǔ)言模型的關(guān)注度激增,迫切希望應(yīng)用 AI 領(lǐng)域的新技術(shù)來(lái)提升競(jìng)爭(zhēng)力。今年 8 月的發(fā)布會(huì)上,IBM 將多年以來(lái)在企業(yè)級(jí) AI 領(lǐng)域積累的技術(shù)和經(jīng)驗(yàn),結(jié)合最近五年在基礎(chǔ)模型研究方面取得的進(jìn)展,推出了新一代數(shù)據(jù)與 AI 平臺(tái) IBM watsonx。
watsonx 是 IBM 為解決企業(yè)在人工智能應(yīng)用中的數(shù)據(jù)管理、模型開(kāi)發(fā)、驗(yàn)證、部署和治理等方面的挑戰(zhàn)而推出的綜合平臺(tái)。該平臺(tái)包括 watsonx.ai、watsonx.data 和 watsonx.governance 三個(gè)關(guān)鍵組件,共同構(gòu)成了一個(gè)完整的AI生命周期解決方案。
watsonx.ai 是平臺(tái)的核心,專注于AI模型的訓(xùn)練、驗(yàn)證、微調(diào)和部署。它為企業(yè)提供了強(qiáng)大的計(jì)算資源,以處理大規(guī)模的模型訓(xùn)練任務(wù)。有了 watsonx.ai,AI 構(gòu)建者就可以利用 IBM 的模型和 Hugging Face 的模型來(lái)完成一系列 AI 開(kāi)發(fā)任務(wù)。
這些模型經(jīng)過(guò)預(yù)訓(xùn)練,可支持一系列自然語(yǔ)言處理(NLP)類型的任務(wù),包括問(wèn)答、內(nèi)容生成和摘要、文本分類和提取。watsonx.ai 允許企業(yè)選擇適合其需求的模型架構(gòu),并根據(jù)模型性能的基準(zhǔn)測(cè)試結(jié)果來(lái)評(píng)估和選擇最佳模型。
在發(fā)布會(huì)的演講中,IBM 大中華區(qū)首席技術(shù)官、研發(fā)中心總經(jīng)理謝東也對(duì) IBM 近期的 AI 研究作出了詳細(xì)的介紹:「最近,很多人都問(wèn)我一個(gè)問(wèn)題:IBM 是否還在持續(xù)發(fā)展人工智能?我想告訴大家,IBM 一直都是混合云與 AI 領(lǐng)域的領(lǐng)導(dǎo)者。
IBM 多年來(lái)一直是多個(gè)重大體育賽事的技術(shù)贊助商,包括美國(guó)高爾夫球大師賽、英國(guó)溫布爾登網(wǎng)球錦標(biāo)賽和美國(guó)網(wǎng)球公開(kāi)賽。
我之所以提到這些體育賽事,不僅因?yàn)槲覠釔?ài)體育,更重要的是要說(shuō)明,用于這些大賽的基于 watsonx 的生成式人工智能的技術(shù),也是我們用于賦能各行各業(yè)應(yīng)用的 AI 技術(shù)——基于特定專業(yè)領(lǐng)域的數(shù)據(jù)(如網(wǎng)球、高爾夫球)和知識(shí),提供更為準(zhǔn)確的預(yù)測(cè)(如球員比賽的贏率)。
但有人可能會(huì)問(wèn),人工智能如此強(qiáng)大和有趣,是否很容易應(yīng)用到各個(gè)領(lǐng)域呢?我要告訴大家,實(shí)際情況并非如此。雖然很多人熟悉 ChatGPT 等大語(yǔ)言模型,但實(shí)際應(yīng)用 AI 需要考慮多個(gè)因素,包括模型的選擇、數(shù)據(jù)的利用、開(kāi)發(fā)環(huán)境和算力等等。
這就是許多企業(yè)目前面臨的挑戰(zhàn)。隨著大語(yǔ)言模型的不斷涌現(xiàn),企業(yè)需要仔細(xì)思考選擇哪個(gè)模型、如何充分利用自身數(shù)據(jù)、如何開(kāi)發(fā)應(yīng)用和部署等問(wèn)題。而 IBM 正致力于解決這些問(wèn)題,為企業(yè)提供完整的人工智能解決方案?!?/p>
watsonx.data 是數(shù)據(jù)管理的關(guān)鍵部分,它幫助企業(yè)高效地準(zhǔn)備、過(guò)濾和清洗數(shù)據(jù)以用于訓(xùn)練模型。數(shù)據(jù)的分類和詞符化是數(shù)據(jù)準(zhǔn)備過(guò)程中的重要步驟。watsonx.data 還允許企業(yè)使用自有數(shù)據(jù)或 IBM 數(shù)據(jù)堆來(lái)滿足模型訓(xùn)練的需求,并提供了數(shù)據(jù)名片和版本控制,以便進(jìn)行數(shù)據(jù)的可追溯治理。
數(shù)據(jù)——這個(gè)詞匯一直縈繞在無(wú)數(shù)技術(shù)人的心中,更是 IBM 歷史上重要的一頁(yè)。IBM 在上世紀(jì) 70 年代對(duì)數(shù)據(jù)庫(kù)領(lǐng)域產(chǎn)生了深遠(yuǎn)影響。1970 年,IBM 的科學(xué)家埃德加·科德(Edgar F. Codd)提出了關(guān)系型數(shù)據(jù)庫(kù)的理論,這一理論后來(lái)演化成了 SQL(結(jié)構(gòu)化查詢語(yǔ)言),為關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)(RDBMS)的發(fā)展奠定了基礎(chǔ)。
到了上文提到的 IBM Watson 時(shí)代,Watson 利用大規(guī)模的數(shù)據(jù)庫(kù)來(lái)構(gòu)建知識(shí)圖譜,幫助用戶獲取復(fù)雜問(wèn)題的答案。Watson 還被用于醫(yī)療領(lǐng)域,可以通過(guò)分析數(shù)百萬(wàn)篇醫(yī)學(xué)文獻(xiàn)和病例數(shù)據(jù)庫(kù)來(lái)輔助醫(yī)生制定診斷和治療方案。
如今,watson 之名還在延續(xù)。今年晚些時(shí)候,watsonx.data 將利用 watsonx.ai 的基礎(chǔ)模型,來(lái)幫助簡(jiǎn)化和加速用戶與數(shù)據(jù)的交互方式,使他們能夠使用自然語(yǔ)言以對(duì)話式的用戶體驗(yàn)來(lái)發(fā)現(xiàn)、增強(qiáng)、優(yōu)化和可視化其數(shù)據(jù)與元數(shù)據(jù)。
watsonx.governance 關(guān)注企業(yè)級(jí) AI 的合規(guī)性和治理。正如這場(chǎng)發(fā)布會(huì)的名稱——“企業(yè)級(jí) AI 的未來(lái)”。它確保模型和數(shù)據(jù)遵守法律法規(guī)和道德標(biāo)準(zhǔn),特別是在處理敏感信息和隱私數(shù)據(jù)時(shí)。在演講中,強(qiáng)調(diào)了治理的重要性,以確保企業(yè)可以信任其 AI 系統(tǒng)。watsonx.governance 還提供了事實(shí)表,用于記錄模型和數(shù)據(jù)的詳細(xì)信息,以便進(jìn)行監(jiān)控和更新。
跨世紀(jì)的 AI 探索者
深藍(lán)和 Watson 都是早期的 AI 項(xiàng)目,筆者看過(guò)無(wú)數(shù)論壇網(wǎng)友和名人學(xué)者對(duì)它們的抨擊,這些機(jī)器被批評(píng)“沒(méi)有真正的智能”。
盡管深藍(lán)在計(jì)算棋局和搜索可能著法方面非常強(qiáng)大,但它被批評(píng)為一種“硬編碼”方法,即它不具備真正的智能或推理能力。深藍(lán)的勝利主要依賴于其出色的計(jì)算速度和搜索算法,而不是對(duì)棋局的理解。
Watson 的批評(píng)主要涉及到它在回答問(wèn)題時(shí)的不確定性管理和推理能力。盡管 Watson 可以處理大量的信息和文本數(shù)據(jù),但它有時(shí)會(huì)給出不準(zhǔn)確的答案,因?yàn)樗荒苷嬲斫鈫?wèn)題的上下文,只是根據(jù)統(tǒng)計(jì)概率進(jìn)行答案選擇。
現(xiàn)在,大模型也正在受到一樣的抨擊。
它依舊不會(huì)推理、不會(huì)思考、不具備情感,但卻和 IBM 的幾次嘗試一樣有用,為全行業(yè)注入了新的活力。就像深藍(lán)和 Watson 在投入使用后為 IBM 的專業(yè)領(lǐng)域帶來(lái)了重大的貢獻(xiàn)一樣,大模型也滋潤(rùn)著各行各業(yè)。
人工智能領(lǐng)域仍在不斷發(fā)展,無(wú)數(shù)企業(yè)和科學(xué)家們不懈努力,追求更優(yōu)化的方法來(lái)處理認(rèn)知任務(wù)和推理問(wèn)題,以實(shí)現(xiàn)更高級(jí)別的智能。盡管面臨挑戰(zhàn),AI 領(lǐng)域的前景仍然充滿希望。
-
算法
+關(guān)注
關(guān)注
23文章
4587瀏覽量
92501 -
人工智能
+關(guān)注
關(guān)注
1789文章
46652瀏覽量
237083 -
大模型
+關(guān)注
關(guān)注
2文章
2274瀏覽量
2357
原文標(biāo)題:大模型意味著人工智能的質(zhì)變時(shí)刻已經(jīng)到來(lái)!
文章出處:【微信號(hào):AI科技大本營(yíng),微信公眾號(hào):AI科技大本營(yíng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論