文章轉(zhuǎn)自「首席數(shù)字官」
ID:ChiefDigitalOfficer
2022年9月6日,一幅由AI生成的畫作《太空歌劇院》點燃了AIGC星星之火;ChatGPT的橫空出世使AIGC浪潮以燎原之勢席卷全球。AIGC開始融入數(shù)字化轉(zhuǎn)型浪潮,并重塑各個行業(yè)乃至全球的“數(shù)字化轉(zhuǎn)型”。什么是AIGC呢?
AIGC ( AI Generated Content)指人工智能生成內(nèi)容。它像人類一樣具有創(chuàng)造力,不過得經(jīng)過訓(xùn)練模型和大量數(shù)據(jù)的學(xué)習,并接收一定的指令才能生成指令發(fā)出者想要的內(nèi)容。它可以生成文本、圖片、視頻、音樂等各種形式的內(nèi)容,為內(nèi)容創(chuàng)作者、設(shè)計師、工程師等行業(yè)人員提供了極大便利。
那么常見的AIGC模型有哪些呢?
國內(nèi)
1. 清華大學(xué)——ChatGLM
號稱“比ChatGPT更懂你的清華水木ChatGLM”,在國內(nèi)受到了廣泛關(guān)注和好評。
此對話語言模型由清華大學(xué) KEG 實驗室和智譜AI基于千億基座模型 GLM-130B 進行文本和代碼預(yù)訓(xùn)練開發(fā)而成,兼具文案寫作、信息抽取、角色扮演、問答、對話等能力。據(jù)斯坦福報告研究,其基座模型GLM-130B 是全球唯一性能上可與 GPT-3 原版基座對標的雙語開源千億模型。
2. 百度——文心一言
具備跨模態(tài)、跨語言的深度語義理解與生成能力,擁有文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成五大能力,其在搜索問答、內(nèi)容創(chuàng)作生成、智能辦公等眾多領(lǐng)域都有更廣闊的想象空間。
3. 阿里巴巴——通義千問
號稱“世界首個突破 10萬億參數(shù)的 AI 大模型”。2023年8月4日,阿里宣布通義千問開源。通義千問70億參數(shù)通用模型Qwen-7B和對話模型Qwen-7B-Chat上架魔搭,功能包括多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持,還可寫郵件、電影腳本、短文等。
阿里的通義千文大模型是一款基于Transformer架構(gòu)的自然語言處理模型,由阿里巴巴自然語言處理實驗室開發(fā)。該模型是目前國內(nèi)最大的中文預(yù)訓(xùn)練模型之一,包含1000億個參數(shù)。通義千文大模型通過在大規(guī)模語料庫上進行預(yù)訓(xùn)練,可以實現(xiàn)多種自然語言處理任務(wù),如文本分類、命名實體識別、情感分析等。此外,該模型還具有較強的遷移學(xué)習能力,可以在不同領(lǐng)域的數(shù)據(jù)上進行微調(diào),適用于各種實際應(yīng)用場景。
4. 騰訊——混元AI大模型
覆蓋NLP(自然語言處理)、CV(計算機視覺)、多模態(tài)等基礎(chǔ)模型和眾多行業(yè)與領(lǐng)域模型,還推出了萬億中文NLP預(yù)訓(xùn)練模型。采用熱啟動降低訓(xùn)練成本,文字視頻等多領(lǐng)域表現(xiàn)優(yōu)異,已在廣告游戲等多場景落地。具體功能上,混元AI大模型除了有對話模塊,還設(shè)置了靈感發(fā)現(xiàn)模塊,可生成文案、視頻腳本以及各種風格的繪畫;場景上,分為工作、編程、生活等。
5. 華為——盤古
盤古系列AI大模型,包括NLP大模型、CV大模型、科學(xué)計算大模型。從 2020 年啟動研發(fā),2021 年 4 月正式發(fā)布,到 2022 年聚焦行業(yè)應(yīng)用落地, 其進化路徑可分為 L0-L1-L2 三個階段,上層是在下層的基礎(chǔ)上演化而來。L0 是指基礎(chǔ)大模型,包括 NLP(中文語言)大模型、CV(視覺)大模型、多模態(tài)大模型、科學(xué)計算大模 型以及 Graph(圖網(wǎng)絡(luò))大模型。自然語言處理(NLP)系列是業(yè)界首個千億級生成與理解中文 NLP 大模型,由華為云、循 環(huán)智能和鵬城實驗室聯(lián)合開發(fā),在訓(xùn)練過程中使用了 40TB 的中文文本數(shù)據(jù),其中包含大 量的通用知識與行業(yè)經(jīng)驗,具備領(lǐng)先的語言理解和模型生成能力,并通過行業(yè)數(shù)據(jù)的小樣 本調(diào)優(yōu)提升模型在場景中的應(yīng)用性能。在中文語言理解評測基準 CLUE 榜單中,盤古 NLP 大模型在總排行榜及分類、閱讀理解單項均排名第一,刷新了三項榜單世界歷史紀錄,總 排行榜得分 83.046(人類水平為 85.61),多項子任務(wù)得分業(yè)界領(lǐng)先。
6. 360——360智腦360版GPT——認知智能通用大模型“360智慧大腦”(簡稱“360智腦”)多項能力位列國產(chǎn)大模型第一。在多輪對話測試中“360智腦”表現(xiàn)出優(yōu)秀的上下文理解能力,代表著人工智能從感知進化到認知,是大模型真正智能的體現(xiàn)?;凇?60智腦”打造四大場景,具體包括:推出專有大模型,打造城市智能中樞和政府級、企業(yè)級GPT;攜手行業(yè)伙伴打造金融、教育、醫(yī)療等產(chǎn)業(yè)級大模型;針對中小微企業(yè)推出AI垂直應(yīng)用,打造生產(chǎn)力工具;結(jié)合搜索引擎和瀏覽器,推出針對個人用戶的AI助理等。
7. 字節(jié)跳動——My AI字節(jié)跳動專屬智能助手「My AI」。從演示來看,My AI 的定位更類似微軟推出的 Office Copilot,用戶可以通過 My AI 總結(jié)生成會議紀要,并可根據(jù)會議紀要創(chuàng)建對應(yīng)的待辦事項,輔助用戶規(guī)劃后續(xù)工作。同時,該 AI 能夠根據(jù)文檔數(shù)據(jù),生成報告等內(nèi)容;并能夠根據(jù)用戶的編輯內(nèi)容,進一步續(xù)寫文檔內(nèi)容,大大提升了工作效率。此外,My AI 還能夠協(xié)助用戶創(chuàng)建會議、查詢案例參考、進行頭腦風暴、規(guī)劃項目進程等,在各方面為用戶提供幫助??梢哉f,雖然在「智能性」上,My AI 可能無法與能夠自由對話的生成式人工智能出色,但在現(xiàn)階段,它能夠為工作提供更多,更為實際的幫助。
8.知乎——知海圖AI“知海圖AI”大模型,由面壁智能與知乎共同訓(xùn)練完成?!爸DAI”的訓(xùn)練基于面壁智能自主研發(fā)的CPM企業(yè)級大模型與ModelForce大模型系統(tǒng)。基于“知海圖AI”大模型,雙方一起嘗試探索將大模型能力應(yīng)用到知乎熱榜。針對知乎熱榜問題中的所有回答,“知海圖AI”能夠快速進行要素抽取、觀點梳理和內(nèi)容聚合,最終將所有回答的梗概展現(xiàn)給知乎用戶,讓大家更快、更全面地了解知友們討論的熱點與焦點。據(jù)稱,在這個特定場景中,把“知海圖AI”大模型的效果與GPT-4進行了比較,兩個模型幾乎是持平的。
9. 商湯科技——日日新商湯以AI大裝置SenseCore打造AGI(通用人工智能)時代的基礎(chǔ)設(shè)施,并基于此將大模型體系命名為“日日新SenseNova”,希望在模型的迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI的更多可能。日日新模型體系包含了自然語言處理、圖片生成、自動化數(shù)據(jù)標注、自定義模型訓(xùn)練等多種大模型及能力。
10. 瀾舟科技——孟子MChat
孟子語言模型作為語言編碼的核心組件,不僅可獨立應(yīng)用于語言理解,也是其他三個模型的基石—作為核心的語言編碼模塊。為確保通用性并方便應(yīng)用于下游系統(tǒng),孟子模型與BERT 保持一致的模型結(jié)構(gòu),側(cè)重于預(yù)訓(xùn)練目標和訓(xùn)練策略上的改進,研究更精巧、更有效、更魯棒的預(yù)訓(xùn)練模型。相較于其他中文預(yù)訓(xùn)練模型,孟子模型使用針對中文優(yōu)化的切分器,可包含更多的中文詞匯,處理更長的文本,更少地使用顯存,并具有更快的推理速度。數(shù)據(jù)上,精選高質(zhì)量、書面風格的語料用于訓(xùn)練,可用于文本分類、實體識別、關(guān)系抽取、閱讀理解等任務(wù)。在CLUE評測上,孟子語言理解模型相比開源的RoBERTa模型體現(xiàn)出了明顯的優(yōu)勢。
11.毫末智行——雪湖·海若毫末打造的自動駕駛生成式大模型 DriveGPT 雪湖·海若重磅發(fā)布,成為大模型技術(shù)落地自動駕駛新范式。它通過引入駕駛數(shù)據(jù)建立 RLHF(人類反饋強化學(xué)習)技術(shù),對自動駕駛認知決策模型進行持續(xù)優(yōu)化,現(xiàn)階段主要用于解決自動駕駛的認知決策問題,終極目標是實現(xiàn)端到端自動駕駛。
12. 達觀數(shù)據(jù)——曹植作為垂直、專用、自主可控的國產(chǎn)版GPT模型,不僅能實現(xiàn)專業(yè)領(lǐng)域的AIGC智能化應(yīng)用,且可內(nèi)置在客戶各類業(yè)務(wù)系統(tǒng)中提供專用服務(wù)。產(chǎn)品應(yīng)用層面,達觀數(shù)據(jù)以“曹植”大模型作為支撐,為達觀全棧AIGC智能產(chǎn)品帶來革命性效果提升。目前AIGC已經(jīng)能實現(xiàn)超高還原度的圖像生成效果,而AIGC+NLP的相結(jié)合,應(yīng)用最廣,主要包含撰寫報告、自動翻譯、自動審核、自動回答,難度最大,影響也最深?!安苤病贝笳Z言模型,是國內(nèi)大規(guī)模語言模型中首批可落地的產(chǎn)業(yè)應(yīng)用級模型,目前已在金融領(lǐng)域AIGC多場景投入應(yīng)用。未來可持續(xù)賦能金融、政務(wù)、制造等多個垂直領(lǐng)域和通用場景人工智能的落地和發(fā)展。
13. 昆侖萬維——天工天工是由昆侖萬維(SZ:300418)和奇點智源合作自研、中國第一個真正實現(xiàn)智能涌現(xiàn)的國產(chǎn)大語言模型。天工基于千億預(yù)訓(xùn)練基座模型和千億RLHF模型,具有超強記憶能力、能夠支持1萬字以上文本對話、20輪交互。
14. 網(wǎng)易——玉言"玉言“是網(wǎng)易伏羲自主研發(fā)的中文文本預(yù)訓(xùn)練大模型系列,這次登頂CLUE分類任務(wù)榜單的模型參數(shù)達到110億,結(jié)構(gòu)由深層 Encoder 和淺層 Decoder 組成,這種結(jié)構(gòu)可以使得大模型具有優(yōu)秀理解能力的同時,也有著較為優(yōu)秀的生成能力。除此之外,Encoder-Decoder結(jié)構(gòu)方便訓(xùn)練任務(wù)的設(shè)計,不需要復(fù)雜的掩碼策略。其預(yù)訓(xùn)練數(shù)據(jù)包括網(wǎng)易自有高質(zhì)量數(shù)據(jù)、各類百科、新聞、社區(qū)問答、wiki、小說等等;網(wǎng)易伏羲對收集到的數(shù)據(jù)進行去重,清洗,產(chǎn)出了大量高質(zhì)量數(shù)據(jù),并采用這些數(shù)據(jù)訓(xùn)練模型,使得模型具有良好的泛化性,在各類任務(wù)上都有著出色的性能。
15.中科院——紫東太初紫東.太初是中科院自動化所在探索通用人工智能路上的重要成果。千億級參數(shù)的超大模型,能夠?qū)崿F(xiàn)視覺、文本、語音三個模態(tài)間的高效協(xié)同,性能全球領(lǐng)先。紫東太初大模型將文本 + 視覺 + 語音 各個模態(tài)高效協(xié)同,實現(xiàn)超強性能,在圖文跨模態(tài)理解與生成性能上都能領(lǐng)先目前業(yè)界的SOTA模型,高效完成跨模態(tài)檢測、視覺問答、語義描述等下游任務(wù)。
16. 復(fù)旦——MOSSMOSS是一個支持中英雙語和多種插件的開源對話語言模型,moss-moon系列模型具有160億參數(shù),在FP16精度下可在單張A100/A800或兩張3090顯卡運行,在INT4/8精度下可在單張3090顯卡運行。MOSS基座語言模型在約七千億中英文以及代碼單詞上預(yù)訓(xùn)練得到,后續(xù)經(jīng)過對話指令微調(diào)、插件增強學(xué)習和人類偏好訓(xùn)練具備多輪對話能力及使用多種插件的能力。
17. 訊飛——星火訊飛星火是科大訊飛的大模型,它與ChatGPT的最大不同在于,它不僅是一個文本生成器,而是一個能夠從海量數(shù)據(jù)和大規(guī)模知識中持續(xù)進化,實現(xiàn)從提出、規(guī)劃到解決問題的全流程閉環(huán)的認知智能系統(tǒng)。從外部資料上看,訊飛星火具有七大核心能力,即文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力。
18. 珍島集團大語言模型--教育政策智慧決策大腦建設(shè)教育現(xiàn)代化監(jiān)測評估體系的決策支持大腦,符合新時代加快推進教育現(xiàn)代化建設(shè)教育強國的宏偉藍圖目標,教育政策研究領(lǐng)域存在著迫切的需求,對教育政策的科學(xué)、準確的研究和分析有重要意義?;趯逃哐芯啃袠I(yè)的市場需求分析,珍島集團的大語言模型--教育政策智慧決策大腦擁有自然語言處理和文本分析、數(shù)據(jù)可視化和報告生成、智能決策支持三大功能,能夠提供高效、準確的教育政策文本分析和決策支持,滿足政府機構(gòu)、研究機構(gòu)和決策者的需求。
19. APUS——天燕大模型AiLMeAPUS自研的多模態(tài)人工智能大模型“天燕大模型AiLMe”,參數(shù)規(guī)模為1000億,具備對文本、圖像、視頻、音頻的理解和生成能力。針對具體應(yīng)用場景,APUS從AiLMe內(nèi)蒸餾出文本模型“異雀八”、圖像模型“異雀三”、視頻模型“異雀四”、音頻模型“異雀六”四個垂直領(lǐng)域精煉模型,并基于此創(chuàng)新研發(fā)出“墨染、簡筆成畫、智能問答大師、Daily Astro、Star Night、KJV Bible Now、PicPik”等系列AI產(chǎn)品。
20. 百融云創(chuàng)——百融云創(chuàng)智能語音機器人伴隨著AIGC技術(shù)逐漸走向臺前,百融云創(chuàng)人工智能實驗室基于智能語音識別、NLP、自動化機器學(xué)習(AutoML)、深度學(xué)習、隱私計算等技術(shù)以及Transformer、模型性能調(diào)優(yōu)、復(fù)雜神經(jīng)網(wǎng)絡(luò)等底層算法的研發(fā)布局,將生成式AI賦能到智能客服、智能營銷、貸后管理等業(yè)務(wù)領(lǐng)域,百融云創(chuàng)智能語音機器人在多種技術(shù)的組合下每日能夠進行超過億級規(guī)模的自動交互,交互頻次規(guī)模業(yè)內(nèi)首屈一指。
21. 即時設(shè)計——即時AI
“即時AI”是一款能夠讓用戶體驗到通過自然語言描述快速生成可編輯的UI設(shè)計稿功能的設(shè)計工具。在內(nèi)測期間,即時AI共向用戶發(fā)出超6萬個內(nèi)測碼,產(chǎn)生了上百萬條的生成結(jié)果。在官方的測試報告當中,即時AI的生成能力已經(jīng)相當于初級設(shè)計師水平。而在最近的一次更新當中,JS-UIbotics模型正式上線,用戶只需30秒即可生成4個可編輯頁面,相較于設(shè)計師做一個UI設(shè)計界面需要30分鐘,即時AI將生產(chǎn)速度提升了60倍。
22. 蜜度——“AI小畫家”蜜小豆“AI小畫家”蜜小豆以多模態(tài)融合生成為核心,通過MiduNLP、MiduCMR、MiduCV等自主研發(fā)引擎,根據(jù)用戶輸入的主題文本生成圖像作品,并采用區(qū)塊鏈技術(shù)將用戶與蜜小豆的聯(lián)名作品生成數(shù)字藏品,實現(xiàn)版權(quán)保護。蜜小豆還擁有AI修圖、AI超分、AI修復(fù)3種功能,能夠利用AI技術(shù)對照片進行調(diào)色、合成、明暗修改、彩度和色度的修改、添加特殊效果、編輯、修復(fù);可以將一幅低分辨率圖像或圖像序列恢復(fù)出高分辨率圖像;還可以增強圖像中的有用信息,對數(shù)字圖像修復(fù)起到良好作用。
23. 硅基智能——炎帝大模型硅基智能發(fā)布將私有域知識用LLM大模型技術(shù)訓(xùn)練而成并疊加硅基AIGC數(shù)字人技術(shù)的多模態(tài)行業(yè)腦炎帝大模型,炎帝大模型加持下的數(shù)字人,支持根據(jù)文本內(nèi)容調(diào)整自己的表演情緒,可以根據(jù)視頻學(xué)習別人的動作。搭載了炎帝大模型的數(shù)字人,已經(jīng)實現(xiàn)了多種場景的商業(yè)化,如短視頻生成、直播生成、電影及電視劇生成等。
24. 金山辦公——WPS AI用戶通過在辦公軟件中接入WPS AI,可快速生成文檔、嵌入多輪對話,并根據(jù)及時滿足用戶更個人的需求,大幅提高辦公效率。WPS AI不僅具備內(nèi)容創(chuàng)作、歸納總結(jié)的能力,還擁有強大的智能助手功能,可以通過對話式交互幫助用戶更好地應(yīng)對辦公中的各種挑戰(zhàn)。這種智慧助手的引入,能夠讓辦公軟件不再只是簡單的工具,而是成為用戶新的智能助手,從而提高工作效率和體驗。
25. 杭州超節(jié)點信息科技——無界AI無界AI一款A(yù)IGC內(nèi)容創(chuàng)作平臺,可以為用戶提供簡潔易用、模型豐富的AIGC繪畫工具。無界AI平臺現(xiàn)已培育出一批優(yōu)秀的AIGC創(chuàng)作者,為實現(xiàn)AIGC產(chǎn)業(yè)化落地,擴大AI藝術(shù)受眾人群,推動AI與藝術(shù)的融合發(fā)展貢獻中堅力量。無界AI在AIGC領(lǐng)域有著成熟的技術(shù),使用前沿的AI模型,并部署了大量高性能機器持續(xù)優(yōu)化供用戶體驗。
26. 出門問問——序列猴子序列猴子大模型是一個具有長序列、多模態(tài)、單模型、大數(shù)據(jù)等特點的超大規(guī)模語言模型?;谄渫ㄓ玫谋硎灸芰εc推理能力,能夠進行多輪交互,打造更便捷流暢的用戶體驗,極大地提高了生產(chǎn)效率和數(shù)據(jù)處理能力,被廣泛應(yīng)用于問答系統(tǒng)、自然語言處理、機器翻譯、文本摘要等領(lǐng)域。
27.一覽科技——一覽運營寶視頻AIGC工作流一覽運營寶由AI編劇、AI繪圖、AI分鏡、數(shù)字人等構(gòu)成,能夠為內(nèi)容創(chuàng)作者提供一個完整的閉環(huán)生成流程。一覽運營寶以完整的AI創(chuàng)作流程完成了從編劇到分鏡的工作,能夠大大提升導(dǎo)演和制片人判斷他們是否需要繼續(xù)深度創(chuàng)作劇本的效率,這是AI參與創(chuàng)作的一個非常典型的降本增效案例。國外
1. ChatGPTChatGPT 是一款由 OpenAI 開發(fā)的人工智能技術(shù)驅(qū)動的語言模型應(yīng)用。ChatGPT 可以識別和理解自然語言,包括英語、法語、德語、西班牙語等多種語言。它可以回答各種問題、提供各種建議,并與人類進行自然的對話。ChatGPT 是一種基于深度學(xué)習的語言模型,它使用了大量的語言數(shù)據(jù)進行訓(xùn)練,可以生成高質(zhì)量的文本、提供各種各樣的人工智能服務(wù)。ChatGPT 可以根據(jù)用戶的反饋和輸入不斷優(yōu)化自己的表現(xiàn),并學(xué)習新的知識和技能。ChatGPT 可以應(yīng)用于各種領(lǐng)域,例如智能客服、智能寫作、自動作文、智能翻譯等,為人們提供更多的便利和服務(wù)。
2. MidjourneyMidjourney是一款強大的 AI 圖像生成工具,具有靈活性高、易使用等特點。只需一些簡短的文字描述或相關(guān)提示詞它便可以將你的想象快速轉(zhuǎn)化為現(xiàn)實,不論多么夸張或抽象。與其它 AI 圖像生成器相比,Midjourney 具有更快的生成速度和更低的學(xué)習門檻,它不僅可以生成各種風格的藝術(shù)作品,還可以作為創(chuàng)作靈感的參考來源。
3. Stable DiffusionStable Diffusion 是一種基于擴散過程的圖像生成模型,可以生成高質(zhì)量、高分辨率的圖像。它通過模擬擴散過程,將噪聲圖像逐漸轉(zhuǎn)化為目標圖像。這種模型具有較強的穩(wěn)定性和可控性,可以生成具有多樣化效果和良好視覺效果的圖像。Stable Diffusion 可以通過生成多樣化、高質(zhì)量的圖像、修復(fù)損壞的圖像、提高圖像的分辨率和應(yīng)用特定風格到圖像上等方式,輔助視覺創(chuàng)意的實現(xiàn)。它為視覺藝術(shù)家、設(shè)計師等提供更多的創(chuàng)作工具和素材,促進視覺藝術(shù)領(lǐng)域的創(chuàng)新和發(fā)展。
4. Bing AI幾個月前,微軟更新了 iOS 和 Android 上的 SwiftKey 鍵盤應(yīng)用,提供了一項新功能,可以使用 Bing AI 以各種樣式重寫文本,而類似的功能即將在桌面版 Microsoft Edge 瀏覽器中推出。該功能允許用戶在輸入框中選擇一段文本,并使用 Alt + I 快捷鍵進行重寫。Edge 會彈出一個窗口,顯示 Bing AI 重寫的文本,還有幾個按鈕可以用來替換選中的文本、調(diào)整生成結(jié)果,或者嘗試重新生成文本。用戶可以選擇四種語氣:專業(yè)、隨意、熱情和非正式;更改格式:段落、電子郵件、博客文章和想法;以及選擇長度:短、中和長。然后點擊重寫按鈕,應(yīng)用設(shè)置并重新生成 Bing AI 的回應(yīng)。
5. BardBard 是一款類 ChatGPT 產(chǎn)品,Bard 中使用的模型基于谷歌自己的 LaMDA(對話應(yīng)用程序語言模型)。致力于將廣泛的世界知識與大型語言模型的強大功能和創(chuàng)造力結(jié)合起來,它利用來自網(wǎng)絡(luò)的信息為輸入問題提供最新、高質(zhì)量的回答。在交互上區(qū)別較大的,就是 Bard 在創(chuàng)作完成后,會給出 3 個預(yù)選答案供你選擇。
6. ClaudeClaude 是 Anthropic[1] 新推出的一款類似于 ChatGPT[2] 的 AI 助手,后者是從 OpenAI 出走的前員工們集體創(chuàng)建的 AI 初創(chuàng)公司。雖然目前尚未開放公測,但從曝光的內(nèi)測對比結(jié)果來看,Claude 已經(jīng)可以和 ChatGPT 掰掰手腕:在邏輯和計算方面,Claude 表現(xiàn)出了旗鼓相當?shù)膶嵙?,盡管在代碼生成和推理問題上存在差距,但在無害性方面表現(xiàn)突出,具體表現(xiàn)為能夠更清晰的拒絕不恰當?shù)恼埱?,當面對超出能力范圍的問題,能夠主動坦白,而不是像 ChatGPT 那樣逃避回答。Claude 開創(chuàng)性引入了“憲法人工智能”(Constitutional AI,CAI)的概念。以 ChatGPT 為代表,現(xiàn)有方法主要通過人類反饋的強化學(xué)習(RLHF)算法,即在強化學(xué)習階段,通過擬合大量的人工標注的偏好數(shù)據(jù),來對齊大規(guī)模語言模型和人類偏好,從而給出令人滿意的有用(Helpful)、可靠(Honest)和無害(Harmless)的回答。Claude 在有用性(有用和可靠)方面沿用人類反饋,但在無害方面開創(chuàng)了一條更低成本且有效的路徑,僅需要制定“憲法“(少量的自然語言準則或指令),AI 系統(tǒng)會自動輸出偏好判斷,指導(dǎo)模型對齊 AI 理解的無害化偏好,從而訓(xùn)練出危害更小的系統(tǒng)。因此這種技術(shù)也叫 AI 反饋的強化學(xué)習(RLAIF)算法。
7. DALL-E2DALL-E2是DALL-E的升級版,能夠根據(jù)自然語言的文本描述生成圖像和藝術(shù)形式。其API可供開發(fā)人員直接使用,按用量收費。DALL-E2的核心競爭力在于精確的AI繪畫能力,增加了組合概念、屬性和樣式的功能,生成更生動、更復(fù)雜的圖像。其圖像分辨率提升了4倍,畫質(zhì)更真實,真實度達到88.8%,識別更精確,語義匹配度達到71.7%。
8. Murf aiMurf ai是一款于2020年10月問世的AI語音生成器,其利用機器學(xué)習和深度學(xué)習技術(shù),能夠?qū)⑽谋巨D(zhuǎn)換為自然語音。通過使用Murf ai,用戶可以在短時間內(nèi)獲得高質(zhì)量的語音輸出,并且可以使用其AI語音克隆功能來滿足對語言情感更多元化的需求。該功能能夠通過調(diào)整音調(diào)、音量、語言和速度,提供栩栩如生的發(fā)音和全方位的人類情感,從而提供多方位的服務(wù)。此外,Murf ai還擁有可調(diào)用的AI功能,以確保特定術(shù)語能夠準確無誤地傳達。該語音生成器提供多合一的功能,操作界面簡單便捷,能夠與谷歌幻燈片共享編輯,用戶可以在AI語音中選擇最合適的演示文稿語音。
9. AIVAAIVA是一款具備作曲家地位的AI軟件,成立于2016年,旨在通過AI技術(shù)創(chuàng)作個性化的音樂,提升用戶的音樂能力。該軟件接受了數(shù)千份樂譜的訓(xùn)練,具備豐富的音樂素材和數(shù)據(jù)集。AIVA提供兩種音樂創(chuàng)作方式:一種是使用預(yù)先訓(xùn)練的“預(yù)設(shè)樣式”,這些樣式基于內(nèi)部精心制作的各種音樂特征,包括曲調(diào)、節(jié)奏模式、旋律線等,可以為用戶提供多樣化的音樂體驗;另一種是使用上傳的音樂來創(chuàng)作,可以根據(jù)用戶的需求和喜好,創(chuàng)作出具有相似音樂特征但截然不同的曲目。10. ynthesiaSynthesia是由來自倫敦大學(xué)學(xué)院、斯坦福大學(xué)、慕尼黑工業(yè)大學(xué)和劍橋大學(xué)的AI研究人員和企業(yè)家團隊于2017年創(chuàng)建的。該公司推出的AI視頻創(chuàng)作產(chǎn)品“Synthesia”已經(jīng)被數(shù)千家公司廣泛應(yīng)用。該產(chǎn)品利用AI技術(shù)創(chuàng)建和定制數(shù)字孿生模型,從而生成視頻。用戶可以從現(xiàn)有演員庫中選擇或上傳自己的視頻來創(chuàng)建AI形象,并輸入腳本讓AI配音、拼接素材,從而快速輸出視頻,從而節(jié)省高達80%的時間和預(yù)算。Synthesia主要應(yīng)用于企業(yè)傳播、數(shù)字視頻營銷和廣告本地化等領(lǐng)域。該產(chǎn)品大幅減少真人出鏡錄制等環(huán)節(jié),從而降低制作費用和周期,同時能夠輕松生成多國語言視頻,方便本土化服務(wù)。
11. Wonder StudioWonder Studio是一種AI工具,可以自動將CG角色動畫、打光并組合成真實場景,無需逐個鏡頭進行處理。用戶只需上傳CG角色模型到一個鏡頭或整個場景,系統(tǒng)會自動檢測剪輯并跟蹤演員。此外,Wonder Studio還能根據(jù)單個鏡頭自動檢測演員表演,并將其傳輸?shù)剿xCG角色,自動執(zhí)行動畫、照明和創(chuàng)作。Wonder Studio支持現(xiàn)有流水線,并自動化了80%-90%“客觀”的視覺特效工作,留下剩余的“主觀”工作給藝術(shù)家完成。同時,Wonder Studio還支持導(dǎo)出到其他軟件中使用。
12. Runway Gen-2Runway是一家先行者,成功地將文本轉(zhuǎn)化為視頻。公司成立于2018年,一直在致力于構(gòu)建多模態(tài)人工智能系統(tǒng),以降低視頻創(chuàng)作門檻,幫助人們輕松制作出內(nèi)容強大且富有創(chuàng)意的視頻內(nèi)容。在2023年2月6日,Runway推出了基于擴散模型的視頻生成模型Gen-1,并在Discord中開啟內(nèi)測。隨后在3月20日,Runway發(fā)布了升級版Gen-2,該模型已經(jīng)能夠?qū)鼍昂蜕{(diào)簡單的幾何體變成酷炫的視頻,但對于復(fù)雜場景的精細化處理還有待提高。不僅如此,Gen-2還支持僅使用文本提示就能合成任意風格的視頻,并且也支持文本+圖像生成視頻。
13. Jasper
Jasper是早期GPT生態(tài)中的最大贏家之一。Dave Rogenmoser、Chris Hull和John Phillip Morgan于2021年創(chuàng)立了Jasper,他們基于GPT-3開發(fā)了生成式AI寫作助手,人們可以用Jasper AI撰寫各類營銷文章、社交媒體播客,后續(xù)也更新了繪畫助手,實際功能與現(xiàn)在的GPT大同小異,只是應(yīng)用界面更加友好。
Jasper 為用戶提供超過 60 個模版,幫助撰寫廣告文案、標語、網(wǎng)頁文案、電子郵件、博客以及社交媒體文章等不同場景的內(nèi)容,并且還集成了 Grammarly 工具來檢查內(nèi)容中涉及的抄襲和錯誤修復(fù),從廣告工具快速發(fā)展成為了 AI 內(nèi)容平臺,支持 29 種語言。
本文基于公開資料整理,僅作分享使用,如有問題或補充可以留言。
-
AI
+關(guān)注
關(guān)注
87文章
29806瀏覽量
268102 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1546瀏覽量
7354 -
AIGC
+關(guān)注
關(guān)注
1文章
352瀏覽量
1484
發(fā)布評論請先 登錄
相關(guān)推薦
評論