0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

千億參數(shù)多模態(tài)大模型,“紫東太初”規(guī)模化應(yīng)用加速

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-12-08 00:09 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/李彎彎)過去近一年時間,國內(nèi)外大模型技術(shù)越來越成熟,并逐步在不同場景中實現(xiàn)實現(xiàn)應(yīng)用。在國內(nèi),作為早早布局多模態(tài)大模型的科研機構(gòu),中國科學(xué)院自動化研究所自2019年開始在語音、文本、圖像等單模態(tài)大模型研究和應(yīng)用的基礎(chǔ)上,向多模態(tài)大模型攻關(guān),并于2021年7月正式發(fā)布了全球首個千億參數(shù)多模態(tài)大模型紫東太初。

2023年6月16日,中國科學(xué)院自動化研究所和武漢人工智能研究院發(fā)布紫東太初2.0。2023年8月,中科院旗下紫東太初的大模型位列首批通過《生成式人工智能服務(wù)管理暫行辦法》備案的名單,可正式上線面向公眾提供服務(wù)。如今,紫東太初已經(jīng)在不同領(lǐng)域?qū)崿F(xiàn)應(yīng)用。

紫東太初多模態(tài)大模型的技術(shù)進展

紫東太初是全球首個圖文音(視覺-文本-語音)三模態(tài)預(yù)訓(xùn)練模型(OPT-Omni-Perception pre-Trainer),同時具備跨模態(tài)理解與跨模態(tài)生成能力。

紫東太初2.0在文本、圖像、語音三模態(tài)的基礎(chǔ)上,融入3D點云、視頻、信號等更多模態(tài)數(shù)據(jù),現(xiàn)已支持多輪問答、文本創(chuàng)作、圖像生成、3D 理解、信號分析等全面問答任務(wù),擁有更強的認知、理解、創(chuàng)作能力,帶來全新互動體驗。

紫東太初多模態(tài)大模型擁有三大關(guān)鍵技術(shù)和六大核心能力。三大關(guān)鍵技術(shù):多模態(tài)理解與生成多任務(wù)統(tǒng)一建模;面向國產(chǎn)化軟硬件的高效訓(xùn)練與部署;多模態(tài)預(yù)訓(xùn)練模型架構(gòu)設(shè)計與優(yōu)化。六大核心能力:多模態(tài)統(tǒng)一表示與語義關(guān)聯(lián);預(yù)訓(xùn)練模型網(wǎng)絡(luò)架構(gòu)合計;模型適配與分布式訓(xùn)練;跨模態(tài)內(nèi)容轉(zhuǎn)化與生成;標注受限自監(jiān)督模型學(xué)習(xí);模型輕量化與推理加速。

近期,為推動數(shù)字技術(shù)與行業(yè)應(yīng)用深度融合,提供更加先進的新一代人工智能解決方案,助力產(chǎn)業(yè)升級和發(fā)展,武漢人工智能研究院基于“紫東太初”全模態(tài)大模型,搭建全棧國產(chǎn)化“紫東太初”大模型開放服務(wù)平臺?!白蠔|太初”跨模態(tài)通用人工智能平臺以多模態(tài)大模型為核心,基于全棧國產(chǎn)化基礎(chǔ)軟硬件平臺,可支撐全場景AI應(yīng)用。

武漢人工智能研究院院長王金橋不久前表示,武漢人工智能研究院是以科技創(chuàng)新與成果轉(zhuǎn)化雙輪驅(qū)動的新型研發(fā)機構(gòu),作為湖北省人工智能產(chǎn)業(yè)鏈“鏈創(chuàng)”平臺,基于“紫東太初”多模態(tài)大模型,在智能制造、智慧醫(yī)療等多個領(lǐng)域打造了典型示范應(yīng)用,并搭建全棧國產(chǎn)化自主可控的紫東太初大模型開放服務(wù)平臺,全力打造湖北省數(shù)字經(jīng)濟智能底座。

“紫東太初”大模型正在賦能千行百業(yè)

據(jù)介紹,目前紫東太初已經(jīng)在各行各業(yè)中實現(xiàn)應(yīng)用。據(jù)武漢人工智能研究院官網(wǎng)介紹,該機構(gòu)基于“紫東太初”多模態(tài)大模型攜手長安歐尚,共同引入了元宇宙的概念,創(chuàng)造出YYDS虛擬數(shù)字人,可以通過復(fù)刻自己或者親人的形象和聲音,捏出專屬的語音助手。

攜手杭州市文廣旅游局、杭州移動,基于“紫東太初”多模態(tài)大模型打造文旅場景首個多模態(tài)AI數(shù)字人“杭小憶”,為杭州文化旅游提供具有親和力、感染力、吸引力的代言人形象。利用AR/VR技術(shù)還原南宋御街歷史風(fēng)貌,包含陶瓷燒制釉變、活字印刷、特色小吃等場景。

在紡織制造領(lǐng)域,該機構(gòu)與魏橋集團合作了布匹缺陷檢測設(shè)備,該設(shè)備通過接入“紫東太初”大模型的質(zhì)檢攝像頭識別70多種布匹瑕疵,能夠在較短時間內(nèi)就滿足生產(chǎn)的精度要求,在驗布檢驗環(huán)節(jié)相比人工實現(xiàn)了質(zhì)的突破,瑕疵識別檢出率高達95%。還能夠基于聲音發(fā)現(xiàn)瑕疵,提升紡織行業(yè)織布、驗布效率,助力紡織工業(yè)質(zhì)檢。

在醫(yī)療領(lǐng)域,“紫東太初-火石數(shù)智燧石醫(yī)療大模型”最新應(yīng)用成果于近期正式發(fā)布,九州通醫(yī)療器械集團項目總監(jiān)徐琳介紹,對于骨科疾病治療場景來說,按照監(jiān)管要求,目前很多醫(yī)院設(shè)備科的工作人員,是拿著放大鏡一顆一顆地去數(shù)骨釘?shù)群牟?,統(tǒng)計使用數(shù)量、類型,驗收器械的批號和實物是否一致,這種核驗過程不夠高效快捷。

她透露,今年3月起,九州通與武漢人工智能研究院聯(lián)合進行技術(shù)研發(fā),歷經(jīng)半年,完成骨科內(nèi)植入耗材系統(tǒng)“骨科嫦娥”智慧系統(tǒng)研發(fā)。系統(tǒng)利用人工智能、深度神經(jīng)卷積以及大模型等技術(shù),在一個完整手術(shù)治療周期內(nèi),對骨科復(fù)雜植入物和工具進行智慧識別、全程追蹤、報表統(tǒng)計、能效分析、數(shù)據(jù)查詢、共享協(xié)同等閉環(huán)式、智慧化高效管理,試行效果良好。

“江城洛神”是基于“紫東太初”大模型打造的人工智能內(nèi)容創(chuàng)作平臺,通過多模態(tài)技術(shù)實現(xiàn)圖像編輯與生成,輔助內(nèi)容生產(chǎn),用戶無需任何專業(yè)技能,只需輕輕一點,便可輕松創(chuàng)造出屬于自己的藝術(shù)作品,可廣泛運用于設(shè)計、影視、游戲等多個領(lǐng)域。

以室內(nèi)裝修設(shè)計領(lǐng)域為例,只需提供一張戶型圖,“江城洛神”就可自動生成多種裝修設(shè)計樣式,提示詞越多、越精細,生成質(zhì)量就越高,還能根據(jù)不同提示自動對結(jié)果進行編輯。

王金橋表示,“紫東太初”大模型正在賦能千行百業(yè),推動數(shù)字經(jīng)濟全面發(fā)展?!白蠔|太初”人工智能開放服務(wù)平臺目前已成功應(yīng)用于汽車制造質(zhì)檢、媒體信息服務(wù)、文化旅游、手語教育、紡織生產(chǎn)質(zhì)檢、醫(yī)療器械等10余個領(lǐng)域,形成規(guī)?;瘧?yīng)用落地。

小結(jié)

人工智能未來的10年將是生成式人工智能的10年,如今國內(nèi)外各大科技巨頭及AI企業(yè)已經(jīng)從初期招兵買馬啟動大模型產(chǎn)品的技術(shù)研發(fā),進入到拓展應(yīng)用場景的階段。如今市面上已經(jīng)發(fā)布的大模型有幾百款。然而,通用大模型就如早期的操作系統(tǒng)一樣,最終只會需要一兩個或者兩三個。未來,就看誰能夠真正了解市場需求,最終脫穎而出了。





聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關(guān)推薦

    云知聲推出山海模態(tài)模型

    在人工智能技術(shù)的浩瀚星海中,模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標。繼OpenAI的GPT-4o掀起滔天巨浪后,云知聲以創(chuàng)新之姿,推出了其匠心獨運的山海模態(tài)
    的頭像 發(fā)表于 08-27 15:20 ?257次閱讀

    依圖模態(tài)模型伙伴CTO精研班圓滿舉辦

    模型在不同行業(yè)領(lǐng)域的應(yīng)用前景;7月19日, “依圖科技模態(tài)模型伙伴CTO精研班”在杭州圓滿舉辦,讓更多的伙伴們深度體驗了依圖
    的頭像 發(fā)表于 07-23 15:16 ?295次閱讀

    IBM陳旭東:攜手IBM加速 AI 規(guī)?;?/b>應(yīng)用,解鎖企業(yè)新質(zhì)生產(chǎn)力

    、總經(jīng)理陳旭東應(yīng)邀參會,并以"加速 AI 規(guī)模化應(yīng)用,解鎖企業(yè)新質(zhì)生產(chǎn)力"為題作主旨演講。 他認為,在企業(yè)規(guī)?;?/b>應(yīng)用AI的路徑中,最關(guān)鍵的是如何把企業(yè)數(shù)據(jù)轉(zhuǎn)化為AI源泉,即用企業(yè)的數(shù)據(jù)去訓(xùn)練大
    的頭像 發(fā)表于 07-15 16:13 ?253次閱讀
    IBM陳旭東:攜手IBM<b class='flag-5'>加速</b> AI <b class='flag-5'>規(guī)?;?/b>應(yīng)用,解鎖企業(yè)新質(zhì)生產(chǎn)力

    李未可科技正式推出WAKE-AI模態(tài)AI大模型

    李未可科技模態(tài) AI 大模型正式發(fā)布,積極推進 AI 在終端的場景應(yīng)用 ? 4月18日,2024中國生成式AI大會上李未可科技正式發(fā)布為眼鏡等未來終端定向優(yōu)化等自研WAKE-AI
    發(fā)表于 04-18 17:01 ?488次閱讀
    李未可科技正式推出WAKE-AI<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大<b class='flag-5'>模型</b>

    蘋果發(fā)布300億參數(shù)MM1模態(tài)模型

    近日,科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中,正式公布了其最新的模態(tài)模型研究成果——MM1。這款具有高達300億參數(shù)
    的頭像 發(fā)表于 03-19 11:19 ?687次閱讀

    武漢人工智能研究院即將發(fā)布“太初 3.0”,助力千行百業(yè)發(fā)展

    湖北日報透露,該項目的負責(zé)人王金橋院長表示:“為了進一步提升自身對各行業(yè)的支持力度,我們計劃在今年上半年發(fā)布‘太初 3.0’版本”。此外,他也提到,該研究所在智能駕駛領(lǐng)域與東風(fēng)汽車、光庭信息的合作正逐步推進。
    的頭像 發(fā)表于 03-05 16:25 ?875次閱讀

    螞蟻集團推出20億參數(shù)模態(tài)遙感基礎(chǔ)模型SkySense

    近日,螞蟻集團聯(lián)合武漢大學(xué)宣布成功研發(fā)出20億參數(shù)模態(tài)遙感基礎(chǔ)模型SkySense。這一創(chuàng)新模型由螞蟻集團的AI創(chuàng)新研發(fā)部門NextEvo
    的頭像 發(fā)表于 03-04 11:22 ?634次閱讀

    螞蟻推出20億參數(shù)模態(tài)遙感模型SkySense

    據(jù)了解,負責(zé)開發(fā)的百靈團隊利用自身擁有的19億遙感影像數(shù)據(jù)集進行了預(yù)訓(xùn)練,從而生成了具有20.6億參數(shù)的SkySense大模型。官方稱其為全球范圍內(nèi)參數(shù)規(guī)模最大、任務(wù)覆蓋最全且識別精度
    的頭像 發(fā)表于 02-28 15:53 ?500次閱讀

    機器人基于開源的模態(tài)語言視覺大模型

    ByteDance Research 基于開源的模態(tài)語言視覺大模型 OpenFlamingo 開發(fā)了開源、易用的 RoboFlamingo 機器人操作模型,只用單機就可以訓(xùn)練。
    發(fā)表于 01-19 11:43 ?287次閱讀
    機器人基于開源的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>語言視覺大<b class='flag-5'>模型</b>

    什么是模態(tài)?模態(tài)的難題是什么?

    模態(tài)模型,通常大于100M~1B參數(shù)。具有較強的通用性,比如對圖片中任意物體進行分割,或者生成任意內(nèi)容的圖片或聲音。極大降低了場景的定制成本。
    的頭像 發(fā)表于 01-17 10:03 ?3734次閱讀
    什么是<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>?<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>的難題是什么?

    從Google模態(tài)模型看后續(xù)大模型應(yīng)該具備哪些能力

    前段時間Google推出Gemini模態(tài)模型,展示了不凡的對話能力和模態(tài)能力,其表現(xiàn)究竟如何呢?
    的頭像 發(fā)表于 12-28 11:19 ?1011次閱讀
    從Google<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>看后續(xù)大<b class='flag-5'>模型</b>應(yīng)該具備哪些能力

    模型+模態(tài)的3種實現(xiàn)方法

    我們知道,預(yù)訓(xùn)練LLM已經(jīng)取得了諸多驚人的成就, 然而其明顯的劣勢是不支持其他模態(tài)(包括圖像、語音、視頻模態(tài))的輸入和輸出,那么如何在預(yù)訓(xùn)練LLM的基礎(chǔ)上引入跨模態(tài)的信息,讓其變得更強大、更通用呢?本節(jié)將介紹“大
    的頭像 發(fā)表于 12-13 13:55 ?1351次閱讀
    大<b class='flag-5'>模型</b>+<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>的3種實現(xiàn)方法

    探究編輯模態(tài)大語言模型的可行性

    不同于單模態(tài)模型編輯,模態(tài)模型編輯需要考慮更多的模態(tài)信息。文章出發(fā)點依然從單
    發(fā)表于 11-09 14:53 ?399次閱讀
    探究編輯<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大語言<b class='flag-5'>模型</b>的可行性

    北大&amp;華為提出:模態(tài)基礎(chǔ)大模型的高效微調(diào)

    深度學(xué)習(xí)的大模型時代已經(jīng)來臨,越來越多的大規(guī)模預(yù)訓(xùn)練模型在文本、視覺和模態(tài)領(lǐng)域展示出杰出的生成和推理能力。然而大
    的頭像 發(fā)表于 11-08 16:20 ?557次閱讀
    北大&amp;華為提出:<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>基礎(chǔ)大<b class='flag-5'>模型</b>的高效微調(diào)

    模態(tài)模型企業(yè),智子引擎全國總部落戶南京江北

    智子引擎主要從事新一代人工智能低層引擎和模態(tài)模型的研究開發(fā)和商業(yè)運營。本項目開發(fā)了應(yīng)用水平模態(tài)
    的頭像 發(fā)表于 10-10 11:03 ?926次閱讀