3月,隨著OpenAI新一代模型GPT-4以及百度“文心一言”的正式公布,通用人工智能AGI的概念再次點燃全球社交平臺。從最初的文字對話到如今的看圖寫代碼,AGI領域終于迎來了屬于自己的“iPhone 時刻”,而對話式AI這一充滿無限可能的AI類型也再次展現(xiàn)出融合未來趨勢的美妙圖景。
本月初,人工智能聊天機器人公司Character.ai獲得一筆超2億美元融資,由a16z領投,其聯(lián)合創(chuàng)始人Mark Andreessen將加入Character.ai董事會。作為一家成立不到一年的公司,Character.ai在0收入的情況下達到10億美元估值,并得到資本巨頭青睞,發(fā)展不可謂不快,但其業(yè)務卻非?!昂唵巍薄獎?chuàng)建人人可用的AI聊天機器人。
在Character.ai,你可以和任何你想到的人物對話,無論是現(xiàn)實中的埃隆·馬斯克還是漫威電影里的托尼·史塔克,任何人都可以創(chuàng)建屬于自己的虛擬人格并與其對話,對方則會代入對應的身份和語言風格,看似簡單的業(yè)務背后是真正的千人千面型AI未來。打造這一宏大目標的是谷歌早期員工之一,也是Transformer作者之一的Noam Shazeer,從谷歌離開之后,他的對話式AI如今成為投資領域關注的焦點。
縱觀全球,個性化聊天機器人作為流行趨勢已愈發(fā)明顯。從海外的Character.ai到Replika,各自都在探索“人人享有各自專屬AI聊天機器人”的未來,而回望國內,該領域的發(fā)展也日益受到投資者關注,無論是自微軟小冰團隊獨立的小冰公司,亦或者是由清華大學黃民烈教授創(chuàng)立的聆心智能,近年來都正逐漸成為新一輪革命的排頭兵。
01
投資潮爆發(fā),對話式AI價值凸顯
近兩年,以OpenAI為代表,對話式AI成為資本領域的香餑餑。今年1月,微軟確認了對ChatGPT母公司OpenAI的新一輪數(shù)十億美元投資,而Character.ai在0收入的情況下也于今年3月完成超2億美元融資。根據(jù)PitchBook統(tǒng)計數(shù)據(jù),2022年投資圈向生成式AI的投資總額達到13.7億美元(折合人民幣約93.69億元),幾乎為過去5年的總和。
這其中,對話式AI以自然語言處理技術(NLP)為核心,使機器可以理解、反饋人類語言并從交互中學習,最終實現(xiàn)人與機器之間的自然對話,成為眾多企業(yè)沖擊的技術領域。然而,很長一段時間里,對話式AI作為和人們日常距離最近的AI技術類型,一直被認為“不聰明”“沒有條理”。這是由于對話本身是語言處理中最困難的任務,早期聊天機器人的表現(xiàn)都比較刻板和機械,以“關鍵詞+模板”為主,將輸入語句與預先定義的 FAQ 知識庫進行匹配,但在隨后,對話式AI的發(fā)展過程不斷提速,共經歷四個階段:
規(guī)則引擎階段:這一階段主要是基于規(guī)則的對話系統(tǒng),即設定一系列規(guī)則和模板,用于響應用戶的指令和問題,但是由于規(guī)則的限制和模板的創(chuàng)新難度,導致該階段的對話系統(tǒng)具有很大的局限性。
統(tǒng)計學習階段:隨著機器學習和自然語言處理技術的發(fā)展,人們開始嘗試使用統(tǒng)計學習方法來構建對話系統(tǒng),主要是基于概率模型的統(tǒng)計語言模型,如隱馬爾可夫模型和條件隨機場等,但是由于數(shù)據(jù)和算法的限制,該階段的對話系統(tǒng)仍然存在很多問題。
深度學習階段:隨著深度學習技術的發(fā)展,人們開始使用神經網(wǎng)絡模型來構建對話系統(tǒng),主要是基于序列到序列模型和變形自編碼器模型,如Google的Seq2Seq和Facebook的FastText等。這一階段的對話系統(tǒng)在理解上下文和語義的能力方面取得了很大的進步,但是在生成多樣性和流暢度方面仍然存在一定的問題。
GPT模型階段:近年來,以OpenAI的GPT模型為代表的大型預訓練模型的出現(xiàn),使得對話式AI的生成能力和智能水平得到了飛躍式的提升。目前,GPT-3和GPT-4已經可以實現(xiàn)高度流暢的對話和知識問答,并逐漸應用于多個領域。
對話式AI的發(fā)展經歷了從規(guī)則引擎到統(tǒng)計學習,再到深度學習和GPT模型的階段,隨著技術的飛躍,其應用場景和智能水平也不斷擴展和提高。根據(jù)《AI對話系統(tǒng)分級定義》,過去,只能夠完成單一場景下的對話在L1和L2之間。當問題數(shù)量多、語義復雜時,攔截率較低,難以快速實現(xiàn)響應,客戶滿意度低,且維護成本較高。如今,隨著大模型的發(fā)展,從數(shù)據(jù)、算法、算力等方面使對話式 AI 產生巨大變化,ChatGPT 為代表的的L4級別對話式AI無疑是工程、技術、數(shù)據(jù)等方面的綜合成功,并朝著L5級別進一步邁進。
如今,對話式AI在行業(yè)垂直類應用上已展現(xiàn)出其價值。以Character.ai為例,通過搭建端到端的工程棧,覆蓋模型的研發(fā)與訓練、數(shù)據(jù)、應用整條價值鏈。用戶不僅能夠隨意與平臺上訓練好的海量對話式AI角色進行對話互動,還能夠訓練自己需要的任何虛擬角色,并保持角色的屬性一致性。這些產品特性不僅將Character.ai自身的能力無限延伸,也保持了較高的用戶黏性。在外界看來,Character.AI 擁有較大的商業(yè)發(fā)展空間,不僅能夠面向C端以訂閱式服務打造千人千面的Ai陪伴式應用,也能夠面向B端用戶打造符合其定制特性的個性化AI形象。
無論智能客服、IoT語音助手、醫(yī)療診斷還是金融風險評估等領域,其商業(yè)價值快速提升,投資潮也隨之爆發(fā)。而對千人千面的AI聊天機器人來說,其價值不僅在于簡單的問答,還能夠根據(jù)用戶的口吻、情感等進行情感分析和智能回復,提升用戶體驗的同時,進一步融入更多領域。
02
多家概念股持續(xù)拉升,國內對話式AI爭先冒頭
放眼國內,對話式 AI 的市場潛力也不可小覷。根據(jù)利文聯(lián)合頭豹研究院發(fā)布的《人工智能系列報告:2021年中國對話式AI市場報告》數(shù)據(jù),2021年,中國對話式AI市場規(guī)模為82.7億元,到2026年,這一數(shù)字有望增長至265.8億元,年復合增長率高達26.3%。
與此同時,國內巨頭“跑步入場”對話式 AI 領域,百度、阿里、字節(jié)、京東等大廠接連入局,各大 AI 創(chuàng)企也不甘落后。今年以來,以百度“文心一言”、復旦團隊的“MOSS”為代表的功能型語言大模型路線,和以小冰公司“小冰島”、聆心智能團隊“AI烏托邦”等代表的擬人型語言大模型路線受到了廣泛關注。隨著眾多玩家廣泛深入,創(chuàng)新項目不斷涌現(xiàn),但無論是大型企業(yè)還是創(chuàng)業(yè)公司,在人才建設、技術突破、商業(yè)模式等方面都處于早期階段,更需要長期堅持、投入和創(chuàng)新。
國內,早在2021年小冰公司發(fā)布了全球首個 AI 社交平臺“小冰島”。在該平臺中,人類用戶可以創(chuàng)造各種人工智能個體,并形成一個共同生活的社交網(wǎng)絡。在大模型領域,小冰公司發(fā)布了“小冰鏈”。小冰CEO李笛指出,小冰鏈采用自然語言處理技術,能夠理解用戶的問題,并給出相應的答案。此外,小冰公司在檢索模型、生成模型、大模型和X-CoTA等方面也實現(xiàn)突破,于2022年宣布完成了總額10億元人民幣的新融資。
北京彩徹區(qū)明科技在2021年推出的“彩云小夢”,基于常識和小說語料訓練的中國本土語言模型在續(xù)寫生成方面相比 ChatGPT 也有著不錯的表現(xiàn)。其核心邏輯是用戶輸入一段文本,就可以用 AI 續(xù)寫一段文字,用戶還可以任意的增刪改。2022年“彩云小夢”推出了2.0版本,用 NLP 技術驅動對話場景,在情節(jié)續(xù)寫的基礎上實現(xiàn)用戶與 AI 虛擬人物的對話,提供更多互動性和情感陪伴。
相較于前兩者,2022年11月上線的Glow屬于“新玩家”,但吸引了部分Z時代年輕用戶。該產品和 ChatGPT 百科全書一樣的回答不同,其定位為AI 虛擬聊天社交軟件,主打聊天、陪伴等情感功能。GLOW 背后的公司 MiniMax 成立于2021年12月,以實現(xiàn)AGI為目標,由前商湯副總裁閆俊杰創(chuàng)立。在2022年上半年由明勢資本領投了天使輪融資,此前米哈游參與了對 MiniMax 的兩輪投資,目前正在謀劃與紅杉資本共同發(fā)起新一輪投資。
2022年12月上線的“AI烏托邦”則對標Character.AI,由清華大學黃民烈教授創(chuàng)立的聆心智能團隊推出,通過小程序和網(wǎng)頁端向公眾開放,也引發(fā)了Z世代用戶群體的廣泛關注。該產品基于聆心智能團隊自研的超擬人大模型,根據(jù)大模型可控、可配置、可信的核心技術優(yōu)勢,優(yōu)勢在于允許用戶快速定制 AI 角色,提供千人千面的AI形象,不僅能夠滿足用戶聊天、陪伴的情感需求,還能夠提供與 ChatGPT 相似的助理、百科功能。目前,聆心智能已完成Pre-A輪融資。
03
機遇和挑戰(zhàn),對話式AI成為泡沫還是希望?
2023 年作為經濟全面復蘇和發(fā)展的重要一年,數(shù)字化轉型成為當前中國經濟發(fā)展的“主旋律”, 其中人工智能技術在數(shù)字經濟建設中發(fā)揮著重要作用。
我國曾提出《新一代人工智能發(fā)展規(guī)劃》,明確“三步走”戰(zhàn)略:2020年實現(xiàn)我國人工智能總體技術和應用與世界先進水平同步;2025年實現(xiàn)我國人工智能基礎理論重大突破,部分技術與應用達到世界領先水平;2030年實現(xiàn)我國人工智能理論、技術與應用總體達到世界領先水平。2022年,科技部等六部門聯(lián)合印發(fā)的《關于加快場景創(chuàng)新 以人工智能高水平應用促進經濟高質量發(fā)展的指導意見》,圍繞構建全鏈條、全過程的人工智能行業(yè)應用生態(tài)建設十大示范場景,為加快推動人工智能應用。在這樣的政策背景下,人工智能技術在助力穩(wěn)定經濟當年發(fā)揮積極作用,同時為培育新的經濟增長點保駕護航。
從市場前景來看,據(jù)IDC研究預計在未來5年內,對話式人工智能在金融、零售、制造、醫(yī)療、政府和教育等六大行業(yè)至少會帶來30%-64%的價值提升。隨著技術的不斷發(fā)展和普及,對話式AI已經在許多領域展現(xiàn)出了它的巨大潛力,如客戶服務、醫(yī)療診斷、教育培訓等。對話式AI不僅可以為用戶提供更加智能化、個性化的服務,還可以幫助企業(yè)降低成本、提高效率,對于推動產業(yè)升級和經濟發(fā)展具有重要的作用。
與任何新興技術的出現(xiàn)一樣,對話式 AI 仍存在一定的挑戰(zhàn)。
從技術方面來看,目前的對話式AI還難以完全替代人類的智能,特別是在情感理解、判斷和創(chuàng)造性方面。其次,對話式AI的普及和應用還存在一些法律和道德問題,如數(shù)據(jù)隱私、安全性、責任和權益等方面。這些問題需要得到社會和政府的關注和解決。
從應用層面來看,一是語言輸入的問題,目前的對話式AI產品,僅支持正式的文本或語音,這提高了用戶的使用門檻,一些方言、口音等語言會影響 AI 對原始輸入的理解,進而產生錯誤或者無效的回答。二是AI的輸出問題,無論是 ChatGPT 還是其它大語言模型,都可能面臨著胡編亂造、不安全可信的問題,這不僅需要平臺在模型層面做好控制,也需要做好相關政策的治理,避免產生“有害的應用”。
以Character.AI為代表的對話式AI的出現(xiàn)預示著無縫人機交互時代的來臨,也加速了國內外對話式 AI 領域的成長態(tài)勢,但要打開市場,需要的不僅僅是模型的技術,還有場景化的應用開發(fā)。
如今,海外企業(yè)在人工智能方向的投資和熱情已經從技術本身走向了如何應用落地,也為國內行業(yè)探索帶來啟示。清華大學計算機科學與技術系長聘副教授、聆心智能創(chuàng)始人黃民烈指出:“行業(yè)發(fā)展需要推動大模型整個生態(tài)的發(fā)展,不僅需要底層大模型,也需要業(yè)務、垂直場景大模型、工具層,以及直接應用型的公司?!痹谒磥恚逃?、金融、數(shù)字產業(yè)將成為大模型應用生態(tài)的重要領域。
隨著高性能大模型的成本正在快速降低,未來對話式 AI 應用層的顛覆式創(chuàng)新或許不在技術,而在于產品設計的絕妙想法。那些更具有創(chuàng)業(yè)精神、產品基因的年輕團隊,或許更能抓住這一次浪潮。
目前來看,行業(yè)先行者們已經初步形成以數(shù)據(jù)為核心的飛輪效應,伴隨用戶與平臺上的虛擬角色產生互動,海量的數(shù)據(jù)成為完善其基礎模型的最佳基石,正如從量變引發(fā)質變的GPT-3一樣,在虛擬人格方面的行業(yè)進展將大大超過人們想象。
未來,隨著對話服務場景的智能化和線上化,AI 對話引擎與產業(yè)深度融合將成為未來社會釋放數(shù)字化疊加倍增效應、構筑綜合競爭優(yōu)勢的必然選擇,并有極大可能改變人類的生活和生產方式。而如何積極擁抱這門新的技術并通過 AI 實現(xiàn)更高的人生目標與價值、實現(xiàn)更廣泛的應用并產出更高的業(yè)務價值,是個人與企業(yè)共同需要關注的命題。
審核編輯 黃宇
-
AI
+關注
關注
87文章
29862瀏覽量
268154 -
人工智能
+關注
關注
1791文章
46698瀏覽量
237189 - ChatGPT
發(fā)布評論請先 登錄
相關推薦
評論