久久天天躁夜夜躁狠狠躁2022,国产AV天堂精品一区

文章轉(zhuǎn)自「首席數(shù)字官」

ID：ChiefDigitalOfficer

2022年9月6日，一幅由AI生成的畫作《太空歌劇院》點燃了AIGC星星之火；ChatGPT的橫空出世使AIGC浪潮以燎原之勢席卷全球。AIGC開始融入數(shù)字化轉(zhuǎn)型浪潮，并重塑各個行業(yè)乃至全球的“數(shù)字化轉(zhuǎn)型”。什么是AIGC呢？

AIGC （ AI Generated Content）指人工智能生成內(nèi)容。它像人類一樣具有創(chuàng)造力，不過得經(jīng)過訓(xùn)練模型和大量數(shù)據(jù)的學(xué)習，并接收一定的指令才能生成指令發(fā)出者想要的內(nèi)容。它可以生成文本、圖片、視頻、音樂等各種形式的內(nèi)容，為內(nèi)容創(chuàng)作者、設(shè)計師、工程師等行業(yè)人員提供了極大便利。

那么常見的AIGC模型有哪些呢？

國內(nèi)

1. 清華大學(xué)——ChatGLM

號稱“比ChatGPT更懂你的清華水木ChatGLM”，在國內(nèi)受到了廣泛關(guān)注和好評。

此對話語言模型由清華大學(xué) KEG 實驗室和智譜AI基于千億基座模型 GLM-130B 進行文本和代碼預(yù)訓(xùn)練開發(fā)而成，兼具文案寫作、信息抽取、角色扮演、問答、對話等能力。據(jù)斯坦福報告研究，其基座模型GLM-130B 是全球唯一性能上可與 GPT-3 原版基座對標的雙語開源千億模型。

2. 百度——文心一言

具備跨模態(tài)、跨語言的深度語義理解與生成能力，擁有文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成五大能力，其在搜索問答、內(nèi)容創(chuàng)作生成、智能辦公等眾多領(lǐng)域都有更廣闊的想象空間。

3. 阿里巴巴——通義千問

號稱“世界首個突破 10萬億參數(shù)的 AI 大模型”。2023年8月4日，阿里宣布通義千問開源。通義千問70億參數(shù)通用模型Qwen-7B和對話模型Qwen-7B-Chat上架魔搭，功能包括多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持，還可寫郵件、電影腳本、短文等。

阿里的通義千文大模型是一款基于Transformer架構(gòu)的自然語言處理模型，由阿里巴巴自然語言處理實驗室開發(fā)。該模型是目前國內(nèi)最大的中文預(yù)訓(xùn)練模型之一，包含1000億個參數(shù)。通義千文大模型通過在大規(guī)模語料庫上進行預(yù)訓(xùn)練，可以實現(xiàn)多種自然語言處理任務(wù)，如文本分類、命名實體識別、情感分析等。此外，該模型還具有較強的遷移學(xué)習能力，可以在不同領(lǐng)域的數(shù)據(jù)上進行微調(diào)，適用于各種實際應(yīng)用場景。

4. 騰訊——混元AI大模型

覆蓋NLP（自然語言處理）、CV（計算機視覺）、多模態(tài)等基礎(chǔ)模型和眾多行業(yè)與領(lǐng)域模型，還推出了萬億中文NLP預(yù)訓(xùn)練模型。采用熱啟動降低訓(xùn)練成本，文字視頻等多領(lǐng)域表現(xiàn)優(yōu)異，已在廣告游戲等多場景落地。具體功能上，混元AI大模型除了有對話模塊，還設(shè)置了靈感發(fā)現(xiàn)模塊，可生成文案、視頻腳本以及各種風格的繪畫；場景上，分為工作、編程、生活等。

5. 華為——盤古

盤古系列AI大模型，包括NLP大模型、CV大模型、科學(xué)計算大模型。從 2020 年啟動研發(fā)，2021 年 4 月正式發(fā)布，到 2022 年聚焦行業(yè)應(yīng)用落地，其進化路徑可分為 L0-L1-L2 三個階段，上層是在下層的基礎(chǔ)上演化而來。L0 是指基礎(chǔ)大模型，包括 NLP（中文語言）大模型、CV（視覺）大模型、多模態(tài)大模型、科學(xué)計算大模型以及 Graph（圖網(wǎng)絡(luò)）大模型。自然語言處理（NLP）系列是業(yè)界首個千億級生成與理解中文 NLP 大模型，由華為云、循環(huán)智能和鵬城實驗室聯(lián)合開發(fā)，在訓(xùn)練過程中使用了 40TB 的中文文本數(shù)據(jù)，其中包含大量的通用知識與行業(yè)經(jīng)驗，具備領(lǐng)先的語言理解和模型生成能力，并通過行業(yè)數(shù)據(jù)的小樣本調(diào)優(yōu)提升模型在場景中的應(yīng)用性能。在中文語言理解評測基準 CLUE 榜單中，盤古 NLP 大模型在總排行榜及分類、閱讀理解單項均排名第一，刷新了三項榜單世界歷史紀錄，總排行榜得分 83.046（人類水平為 85.61），多項子任務(wù)得分業(yè)界領(lǐng)先。

6. 360——360智腦360版GPT——認知智能通用大模型“360智慧大腦”（簡稱“360智腦”）多項能力位列國產(chǎn)大模型第一。在多輪對話測試中“360智腦”表現(xiàn)出優(yōu)秀的上下文理解能力，代表著人工智能從感知進化到認知，是大模型真正智能的體現(xiàn)?；凇?60智腦”打造四大場景，具體包括：推出專有大模型，打造城市智能中樞和政府級、企業(yè)級GPT；攜手行業(yè)伙伴打造金融、教育、醫(yī)療等產(chǎn)業(yè)級大模型；針對中小微企業(yè)推出AI垂直應(yīng)用，打造生產(chǎn)力工具；結(jié)合搜索引擎和瀏覽器，推出針對個人用戶的AI助理等。

7. 字節(jié)跳動——My AI字節(jié)跳動專屬智能助手「My AI」。從演示來看，My AI 的定位更類似微軟推出的 Office Copilot，用戶可以通過 My AI 總結(jié)生成會議紀要，并可根據(jù)會議紀要創(chuàng)建對應(yīng)的待辦事項，輔助用戶規(guī)劃后續(xù)工作。同時，該 AI 能夠根據(jù)文檔數(shù)據(jù)，生成報告等內(nèi)容；并能夠根據(jù)用戶的編輯內(nèi)容，進一步續(xù)寫文檔內(nèi)容，大大提升了工作效率。此外，My AI 還能夠協(xié)助用戶創(chuàng)建會議、查詢案例參考、進行頭腦風暴、規(guī)劃項目進程等，在各方面為用戶提供幫助?？梢哉f，雖然在「智能性」上，My AI 可能無法與能夠自由對話的生成式人工智能出色，但在現(xiàn)階段，它能夠為工作提供更多，更為實際的幫助。

8.知乎——知海圖AI“知海圖AI”大模型，由面壁智能與知乎共同訓(xùn)練完成?！爸DAI”的訓(xùn)練基于面壁智能自主研發(fā)的CPM企業(yè)級大模型與ModelForce大模型系統(tǒng)。基于“知海圖AI”大模型，雙方一起嘗試探索將大模型能力應(yīng)用到知乎熱榜。針對知乎熱榜問題中的所有回答，“知海圖AI”能夠快速進行要素抽取、觀點梳理和內(nèi)容聚合，最終將所有回答的梗概展現(xiàn)給知乎用戶，讓大家更快、更全面地了解知友們討論的熱點與焦點。據(jù)稱，在這個特定場景中，把“知海圖AI”大模型的效果與GPT-4進行了比較，兩個模型幾乎是持平的。

9. 商湯科技——日日新商湯以AI大裝置SenseCore打造AGI（通用人工智能）時代的基礎(chǔ)設(shè)施，并基于此將大模型體系命名為“日日新SenseNova”，希望在模型的迭代速度及處理問題的能力上可以日日更新，不斷解鎖AGI的更多可能。日日新模型體系包含了自然語言處理、圖片生成、自動化數(shù)據(jù)標注、自定義模型訓(xùn)練等多種大模型及能力。

10. 瀾舟科技——孟子MChat

孟子語言模型作為語言編碼的核心組件，不僅可獨立應(yīng)用于語言理解，也是其他三個模型的基石—作為核心的語言編碼模塊。為確保通用性并方便應(yīng)用于下游系統(tǒng)，孟子模型與BERT 保持一致的模型結(jié)構(gòu)，側(cè)重于預(yù)訓(xùn)練目標和訓(xùn)練策略上的改進，研究更精巧、更有效、更魯棒的預(yù)訓(xùn)練模型。相較于其他中文預(yù)訓(xùn)練模型，孟子模型使用針對中文優(yōu)化的切分器，可包含更多的中文詞匯，處理更長的文本，更少地使用顯存，并具有更快的推理速度。數(shù)據(jù)上，精選高質(zhì)量、書面風格的語料用于訓(xùn)練，可用于文本分類、實體識別、關(guān)系抽取、閱讀理解等任務(wù)。在CLUE評測上，孟子語言理解模型相比開源的RoBERTa模型體現(xiàn)出了明顯的優(yōu)勢。

11.毫末智行——雪湖·海若毫末打造的自動駕駛生成式大模型 DriveGPT 雪湖·海若重磅發(fā)布，成為大模型技術(shù)落地自動駕駛新范式。它通過引入駕駛數(shù)據(jù)建立 RLHF（人類反饋強化學(xué)習）技術(shù)，對自動駕駛認知決策模型進行持續(xù)優(yōu)化，現(xiàn)階段主要用于解決自動駕駛的認知決策問題，終極目標是實現(xiàn)端到端自動駕駛。

12. 達觀數(shù)據(jù)——曹植作為垂直、專用、自主可控的國產(chǎn)版GPT模型，不僅能實現(xiàn)專業(yè)領(lǐng)域的AIGC智能化應(yīng)用，且可內(nèi)置在客戶各類業(yè)務(wù)系統(tǒng)中提供專用服務(wù)。產(chǎn)品應(yīng)用層面，達觀數(shù)據(jù)以“曹植”大模型作為支撐，為達觀全棧AIGC智能產(chǎn)品帶來革命性效果提升。目前AIGC已經(jīng)能實現(xiàn)超高還原度的圖像生成效果，而AIGC+NLP的相結(jié)合，應(yīng)用最廣，主要包含撰寫報告、自動翻譯、自動審核、自動回答，難度最大，影響也最深?！安苤病贝笳Z言模型，是國內(nèi)大規(guī)模語言模型中首批可落地的產(chǎn)業(yè)應(yīng)用級模型，目前已在金融領(lǐng)域AIGC多場景投入應(yīng)用。未來可持續(xù)賦能金融、政務(wù)、制造等多個垂直領(lǐng)域和通用場景人工智能的落地和發(fā)展。

13. 昆侖萬維——天工天工是由昆侖萬維(SZ:300418)和奇點智源合作自研、中國第一個真正實現(xiàn)智能涌現(xiàn)的國產(chǎn)大語言模型。天工基于千億預(yù)訓(xùn)練基座模型和千億RLHF模型，具有超強記憶能力、能夠支持1萬字以上文本對話、20輪交互。

14. 網(wǎng)易——玉言"玉言“是網(wǎng)易伏羲自主研發(fā)的中文文本預(yù)訓(xùn)練大模型系列，這次登頂CLUE分類任務(wù)榜單的模型參數(shù)達到110億，結(jié)構(gòu)由深層 Encoder 和淺層 Decoder 組成，這種結(jié)構(gòu)可以使得大模型具有優(yōu)秀理解能力的同時，也有著較為優(yōu)秀的生成能力。除此之外，Encoder-Decoder結(jié)構(gòu)方便訓(xùn)練任務(wù)的設(shè)計，不需要復(fù)雜的掩碼策略。其預(yù)訓(xùn)練數(shù)據(jù)包括網(wǎng)易自有高質(zhì)量數(shù)據(jù)、各類百科、新聞、社區(qū)問答、wiki、小說等等；網(wǎng)易伏羲對收集到的數(shù)據(jù)進行去重，清洗，產(chǎn)出了大量高質(zhì)量數(shù)據(jù)，并采用這些數(shù)據(jù)訓(xùn)練模型，使得模型具有良好的泛化性，在各類任務(wù)上都有著出色的性能。

15.中科院——紫東太初紫東.太初是中科院自動化所在探索通用人工智能路上的重要成果。千億級參數(shù)的超大模型，能夠?qū)崿F(xiàn)視覺、文本、語音三個模態(tài)間的高效協(xié)同，性能全球領(lǐng)先。紫東太初大模型將文本 + 視覺 + 語音各個模態(tài)高效協(xié)同，實現(xiàn)超強性能，在圖文跨模態(tài)理解與生成性能上都能領(lǐng)先目前業(yè)界的SOTA模型，高效完成跨模態(tài)檢測、視覺問答、語義描述等下游任務(wù)。

16. 復(fù)旦——MOSSMOSS是一個支持中英雙語和多種插件的開源對話語言模型，moss-moon系列模型具有160億參數(shù)，在FP16精度下可在單張A100/A800或兩張3090顯卡運行，在INT4/8精度下可在單張3090顯卡運行。MOSS基座語言模型在約七千億中英文以及代碼單詞上預(yù)訓(xùn)練得到，后續(xù)經(jīng)過對話指令微調(diào)、插件增強學(xué)習和人類偏好訓(xùn)練具備多輪對話能力及使用多種插件的能力。

17. 訊飛——星火訊飛星火是科大訊飛的大模型，它與ChatGPT的最大不同在于，它不僅是一個文本生成器，而是一個能夠從海量數(shù)據(jù)和大規(guī)模知識中持續(xù)進化，實現(xiàn)從提出、規(guī)劃到解決問題的全流程閉環(huán)的認知智能系統(tǒng)。從外部資料上看，訊飛星火具有七大核心能力，即文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力。

18. 珍島集團大語言模型--教育政策智慧決策大腦建設(shè)教育現(xiàn)代化監(jiān)測評估體系的決策支持大腦，符合新時代加快推進教育現(xiàn)代化建設(shè)教育強國的宏偉藍圖目標，教育政策研究領(lǐng)域存在著迫切的需求，對教育政策的科學(xué)、準確的研究和分析有重要意義?；趯逃哐芯啃袠I(yè)的市場需求分析，珍島集團的大語言模型--教育政策智慧決策大腦擁有自然語言處理和文本分析、數(shù)據(jù)可視化和報告生成、智能決策支持三大功能，能夠提供高效、準確的教育政策文本分析和決策支持，滿足政府機構(gòu)、研究機構(gòu)和決策者的需求。

19. APUS——天燕大模型AiLMeAPUS自研的多模態(tài)人工智能大模型“天燕大模型AiLMe”，參數(shù)規(guī)模為1000億，具備對文本、圖像、視頻、音頻的理解和生成能力。針對具體應(yīng)用場景，APUS從AiLMe內(nèi)蒸餾出文本模型“異雀八”、圖像模型“異雀三”、視頻模型“異雀四”、音頻模型“異雀六”四個垂直領(lǐng)域精煉模型，并基于此創(chuàng)新研發(fā)出“墨染、簡筆成畫、智能問答大師、Daily Astro、Star Night、KJV Bible Now、PicPik”等系列AI產(chǎn)品。

20. 百融云創(chuàng)——百融云創(chuàng)智能語音機器人伴隨著AIGC技術(shù)逐漸走向臺前，百融云創(chuàng)人工智能實驗室基于智能語音識別、NLP、自動化機器學(xué)習（AutoML）、深度學(xué)習、隱私計算等技術(shù)以及Transformer、模型性能調(diào)優(yōu)、復(fù)雜神經(jīng)網(wǎng)絡(luò)等底層算法的研發(fā)布局，將生成式AI賦能到智能客服、智能營銷、貸后管理等業(yè)務(wù)領(lǐng)域，百融云創(chuàng)智能語音機器人在多種技術(shù)的組合下每日能夠進行超過億級規(guī)模的自動交互，交互頻次規(guī)模業(yè)內(nèi)首屈一指。

21. 即時設(shè)計——即時AI

“即時AI”是一款能夠讓用戶體驗到通過自然語言描述快速生成可編輯的UI設(shè)計稿功能的設(shè)計工具。在內(nèi)測期間，即時AI共向用戶發(fā)出超6萬個內(nèi)測碼，產(chǎn)生了上百萬條的生成結(jié)果。在官方的測試報告當中，即時AI的生成能力已經(jīng)相當于初級設(shè)計師水平。而在最近的一次更新當中，JS-UIbotics模型正式上線，用戶只需30秒即可生成4個可編輯頁面，相較于設(shè)計師做一個UI設(shè)計界面需要30分鐘，即時AI將生產(chǎn)速度提升了60倍。

22. 蜜度——“AI小畫家”蜜小豆“AI小畫家”蜜小豆以多模態(tài)融合生成為核心，通過MiduNLP、MiduCMR、MiduCV等自主研發(fā)引擎，根據(jù)用戶輸入的主題文本生成圖像作品，并采用區(qū)塊鏈技術(shù)將用戶與蜜小豆的聯(lián)名作品生成數(shù)字藏品，實現(xiàn)版權(quán)保護。蜜小豆還擁有AI修圖、AI超分、AI修復(fù)3種功能，能夠利用AI技術(shù)對照片進行調(diào)色、合成、明暗修改、彩度和色度的修改、添加特殊效果、編輯、修復(fù)；可以將一幅低分辨率圖像或圖像序列恢復(fù)出高分辨率圖像；還可以增強圖像中的有用信息，對數(shù)字圖像修復(fù)起到良好作用。

23. 硅基智能——炎帝大模型硅基智能發(fā)布將私有域知識用LLM大模型技術(shù)訓(xùn)練而成并疊加硅基AIGC數(shù)字人技術(shù)的多模態(tài)行業(yè)腦炎帝大模型，炎帝大模型加持下的數(shù)字人，支持根據(jù)文本內(nèi)容調(diào)整自己的表演情緒，可以根據(jù)視頻學(xué)習別人的動作。搭載了炎帝大模型的數(shù)字人，已經(jīng)實現(xiàn)了多種場景的商業(yè)化，如短視頻生成、直播生成、電影及電視劇生成等。

24. 金山辦公——WPS AI用戶通過在辦公軟件中接入WPS AI，可快速生成文檔、嵌入多輪對話，并根據(jù)及時滿足用戶更個人的需求，大幅提高辦公效率。WPS AI不僅具備內(nèi)容創(chuàng)作、歸納總結(jié)的能力，還擁有強大的智能助手功能，可以通過對話式交互幫助用戶更好地應(yīng)對辦公中的各種挑戰(zhàn)。這種智慧助手的引入，能夠讓辦公軟件不再只是簡單的工具，而是成為用戶新的智能助手，從而提高工作效率和體驗。

25. 杭州超節(jié)點信息科技——無界AI無界AI一款A(yù)IGC內(nèi)容創(chuàng)作平臺，可以為用戶提供簡潔易用、模型豐富的AIGC繪畫工具。無界AI平臺現(xiàn)已培育出一批優(yōu)秀的AIGC創(chuàng)作者，為實現(xiàn)AIGC產(chǎn)業(yè)化落地，擴大AI藝術(shù)受眾人群，推動AI與藝術(shù)的融合發(fā)展貢獻中堅力量。無界AI在AIGC領(lǐng)域有著成熟的技術(shù)，使用前沿的AI模型，并部署了大量高性能機器持續(xù)優(yōu)化供用戶體驗。

26. 出門問問——序列猴子序列猴子大模型是一個具有長序列、多模態(tài)、單模型、大數(shù)據(jù)等特點的超大規(guī)模語言模型?；谄渫ㄓ玫谋硎灸芰εc推理能力，能夠進行多輪交互，打造更便捷流暢的用戶體驗，極大地提高了生產(chǎn)效率和數(shù)據(jù)處理能力，被廣泛應(yīng)用于問答系統(tǒng)、自然語言處理、機器翻譯、文本摘要等領(lǐng)域。

27.一覽科技——一覽運營寶視頻AIGC工作流一覽運營寶由AI編劇、AI繪圖、AI分鏡、數(shù)字人等構(gòu)成，能夠為內(nèi)容創(chuàng)作者提供一個完整的閉環(huán)生成流程。一覽運營寶以完整的AI創(chuàng)作流程完成了從編劇到分鏡的工作，能夠大大提升導(dǎo)演和制片人判斷他們是否需要繼續(xù)深度創(chuàng)作劇本的效率，這是AI參與創(chuàng)作的一個非常典型的降本增效案例。國外

1. ChatGPTChatGPT 是一款由 OpenAI 開發(fā)的人工智能技術(shù)驅(qū)動的語言模型應(yīng)用。ChatGPT 可以識別和理解自然語言，包括英語、法語、德語、西班牙語等多種語言。它可以回答各種問題、提供各種建議，并與人類進行自然的對話。ChatGPT 是一種基于深度學(xué)習的語言模型，它使用了大量的語言數(shù)據(jù)進行訓(xùn)練，可以生成高質(zhì)量的文本、提供各種各樣的人工智能服務(wù)。ChatGPT 可以根據(jù)用戶的反饋和輸入不斷優(yōu)化自己的表現(xiàn)，并學(xué)習新的知識和技能。ChatGPT 可以應(yīng)用于各種領(lǐng)域，例如智能客服、智能寫作、自動作文、智能翻譯等，為人們提供更多的便利和服務(wù)。

2. MidjourneyMidjourney是一款強大的 AI 圖像生成工具，具有靈活性高、易使用等特點。只需一些簡短的文字描述或相關(guān)提示詞它便可以將你的想象快速轉(zhuǎn)化為現(xiàn)實，不論多么夸張或抽象。與其它 AI 圖像生成器相比，Midjourney 具有更快的生成速度和更低的學(xué)習門檻，它不僅可以生成各種風格的藝術(shù)作品，還可以作為創(chuàng)作靈感的參考來源。

3. Stable DiffusionStable Diffusion 是一種基于擴散過程的圖像生成模型，可以生成高質(zhì)量、高分辨率的圖像。它通過模擬擴散過程，將噪聲圖像逐漸轉(zhuǎn)化為目標圖像。這種模型具有較強的穩(wěn)定性和可控性，可以生成具有多樣化效果和良好視覺效果的圖像。Stable Diffusion 可以通過生成多樣化、高質(zhì)量的圖像、修復(fù)損壞的圖像、提高圖像的分辨率和應(yīng)用特定風格到圖像上等方式，輔助視覺創(chuàng)意的實現(xiàn)。它為視覺藝術(shù)家、設(shè)計師等提供更多的創(chuàng)作工具和素材，促進視覺藝術(shù)領(lǐng)域的創(chuàng)新和發(fā)展。

4. Bing AI幾個月前，微軟更新了 iOS 和 Android 上的 SwiftKey 鍵盤應(yīng)用，提供了一項新功能，可以使用 Bing AI 以各種樣式重寫文本，而類似的功能即將在桌面版 Microsoft Edge 瀏覽器中推出。該功能允許用戶在輸入框中選擇一段文本，并使用 Alt + I 快捷鍵進行重寫。Edge 會彈出一個窗口，顯示 Bing AI 重寫的文本，還有幾個按鈕可以用來替換選中的文本、調(diào)整生成結(jié)果，或者嘗試重新生成文本。用戶可以選擇四種語氣：專業(yè)、隨意、熱情和非正式；更改格式：段落、電子郵件、博客文章和想法；以及選擇長度：短、中和長。然后點擊重寫按鈕，應(yīng)用設(shè)置并重新生成 Bing AI 的回應(yīng)。

5. BardBard 是一款類 ChatGPT 產(chǎn)品，Bard 中使用的模型基于谷歌自己的 LaMDA（對話應(yīng)用程序語言模型）。致力于將廣泛的世界知識與大型語言模型的強大功能和創(chuàng)造力結(jié)合起來，它利用來自網(wǎng)絡(luò)的信息為輸入問題提供最新、高質(zhì)量的回答。在交互上區(qū)別較大的，就是 Bard 在創(chuàng)作完成后，會給出 3 個預(yù)選答案供你選擇。

6. ClaudeClaude 是 Anthropic[1] 新推出的一款類似于 ChatGPT[2] 的 AI 助手，后者是從 OpenAI 出走的前員工們集體創(chuàng)建的 AI 初創(chuàng)公司。雖然目前尚未開放公測，但從曝光的內(nèi)測對比結(jié)果來看，Claude 已經(jīng)可以和 ChatGPT 掰掰手腕：在邏輯和計算方面，Claude 表現(xiàn)出了旗鼓相當?shù)膶嵙?，盡管在代碼生成和推理問題上存在差距，但在無害性方面表現(xiàn)突出，具體表現(xiàn)為能夠更清晰的拒絕不恰當?shù)恼埱?，當面對超出能力范圍的問題，能夠主動坦白，而不是像 ChatGPT 那樣逃避回答。Claude 開創(chuàng)性引入了“憲法人工智能”（Constitutional AI，CAI）的概念。以 ChatGPT 為代表，現(xiàn)有方法主要通過人類反饋的強化學(xué)習（RLHF）算法，即在強化學(xué)習階段，通過擬合大量的人工標注的偏好數(shù)據(jù)，來對齊大規(guī)模語言模型和人類偏好，從而給出令人滿意的有用（Helpful）、可靠（Honest）和無害（Harmless）的回答。Claude 在有用性（有用和可靠）方面沿用人類反饋，但在無害方面開創(chuàng)了一條更低成本且有效的路徑，僅需要制定“憲法“（少量的自然語言準則或指令），AI 系統(tǒng)會自動輸出偏好判斷，指導(dǎo)模型對齊 AI 理解的無害化偏好，從而訓(xùn)練出危害更小的系統(tǒng)。因此這種技術(shù)也叫 AI 反饋的強化學(xué)習（RLAIF）算法。

7. DALL-E2DALL-E2是DALL-E的升級版，能夠根據(jù)自然語言的文本描述生成圖像和藝術(shù)形式。其API可供開發(fā)人員直接使用，按用量收費。DALL-E2的核心競爭力在于精確的AI繪畫能力，增加了組合概念、屬性和樣式的功能，生成更生動、更復(fù)雜的圖像。其圖像分辨率提升了4倍，畫質(zhì)更真實，真實度達到88.8%，識別更精確，語義匹配度達到71.7%。

8. Murf aiMurf ai是一款于2020年10月問世的AI語音生成器，其利用機器學(xué)習和深度學(xué)習技術(shù)，能夠?qū)⑽谋巨D(zhuǎn)換為自然語音。通過使用Murf ai，用戶可以在短時間內(nèi)獲得高質(zhì)量的語音輸出，并且可以使用其AI語音克隆功能來滿足對語言情感更多元化的需求。該功能能夠通過調(diào)整音調(diào)、音量、語言和速度，提供栩栩如生的發(fā)音和全方位的人類情感，從而提供多方位的服務(wù)。此外，Murf ai還擁有可調(diào)用的AI功能，以確保特定術(shù)語能夠準確無誤地傳達。該語音生成器提供多合一的功能，操作界面簡單便捷，能夠與谷歌幻燈片共享編輯，用戶可以在AI語音中選擇最合適的演示文稿語音。

9. AIVAAIVA是一款具備作曲家地位的AI軟件，成立于2016年，旨在通過AI技術(shù)創(chuàng)作個性化的音樂，提升用戶的音樂能力。該軟件接受了數(shù)千份樂譜的訓(xùn)練，具備豐富的音樂素材和數(shù)據(jù)集。AIVA提供兩種音樂創(chuàng)作方式：一種是使用預(yù)先訓(xùn)練的“預(yù)設(shè)樣式”，這些樣式基于內(nèi)部精心制作的各種音樂特征，包括曲調(diào)、節(jié)奏模式、旋律線等，可以為用戶提供多樣化的音樂體驗；另一種是使用上傳的音樂來創(chuàng)作，可以根據(jù)用戶的需求和喜好，創(chuàng)作出具有相似音樂特征但截然不同的曲目。10. ynthesiaSynthesia是由來自倫敦大學(xué)學(xué)院、斯坦福大學(xué)、慕尼黑工業(yè)大學(xué)和劍橋大學(xué)的AI研究人員和企業(yè)家團隊于2017年創(chuàng)建的。該公司推出的AI視頻創(chuàng)作產(chǎn)品“Synthesia”已經(jīng)被數(shù)千家公司廣泛應(yīng)用。該產(chǎn)品利用AI技術(shù)創(chuàng)建和定制數(shù)字孿生模型，從而生成視頻。用戶可以從現(xiàn)有演員庫中選擇或上傳自己的視頻來創(chuàng)建AI形象，并輸入腳本讓AI配音、拼接素材，從而快速輸出視頻，從而節(jié)省高達80%的時間和預(yù)算。Synthesia主要應(yīng)用于企業(yè)傳播、數(shù)字視頻營銷和廣告本地化等領(lǐng)域。該產(chǎn)品大幅減少真人出鏡錄制等環(huán)節(jié)，從而降低制作費用和周期，同時能夠輕松生成多國語言視頻，方便本土化服務(wù)。

11. Wonder StudioWonder Studio是一種AI工具，可以自動將CG角色動畫、打光并組合成真實場景，無需逐個鏡頭進行處理。用戶只需上傳CG角色模型到一個鏡頭或整個場景，系統(tǒng)會自動檢測剪輯并跟蹤演員。此外，Wonder Studio還能根據(jù)單個鏡頭自動檢測演員表演，并將其傳輸?shù)剿xCG角色，自動執(zhí)行動畫、照明和創(chuàng)作。Wonder Studio支持現(xiàn)有流水線，并自動化了80%-90%“客觀”的視覺特效工作，留下剩余的“主觀”工作給藝術(shù)家完成。同時，Wonder Studio還支持導(dǎo)出到其他軟件中使用。

12. Runway Gen-2Runway是一家先行者，成功地將文本轉(zhuǎn)化為視頻。公司成立于2018年，一直在致力于構(gòu)建多模態(tài)人工智能系統(tǒng)，以降低視頻創(chuàng)作門檻，幫助人們輕松制作出內(nèi)容強大且富有創(chuàng)意的視頻內(nèi)容。在2023年2月6日，Runway推出了基于擴散模型的視頻生成模型Gen-1，并在Discord中開啟內(nèi)測。隨后在3月20日，Runway發(fā)布了升級版Gen-2，該模型已經(jīng)能夠?qū)鼍昂蜕{(diào)簡單的幾何體變成酷炫的視頻，但對于復(fù)雜場景的精細化處理還有待提高。不僅如此，Gen-2還支持僅使用文本提示就能合成任意風格的視頻，并且也支持文本+圖像生成視頻。

13. Jasper

Jasper是早期GPT生態(tài)中的最大贏家之一。Dave Rogenmoser、Chris Hull和John Phillip Morgan于2021年創(chuàng)立了Jasper，他們基于GPT-3開發(fā)了生成式AI寫作助手，人們可以用Jasper AI撰寫各類營銷文章、社交媒體播客，后續(xù)也更新了繪畫助手，實際功能與現(xiàn)在的GPT大同小異，只是應(yīng)用界面更加友好。

Jasper 為用戶提供超過 60 個模版，幫助撰寫廣告文案、標語、網(wǎng)頁文案、電子郵件、博客以及社交媒體文章等不同場景的內(nèi)容，并且還集成了 Grammarly 工具來檢查內(nèi)容中涉及的抄襲和錯誤修復(fù)，從廣告工具快速發(fā)展成為了 AI 內(nèi)容平臺，支持 29 種語言。

本文基于公開資料整理，僅作分享使用，如有問題或補充可以留言。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴