0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

實(shí)操: 如何在AirBox上跑Stable Diffusion 3

算能開(kāi)發(fā)者社區(qū) ? 2024-07-23 08:34 ? 次閱讀

以下文章來(lái)源于Radxa ,作者瑞莎

Stable Diffusion 3 Medium 是一種多模態(tài)擴(kuò)散變換器 (MMDiT) 文本到圖像模型,在圖像質(zhì)量、排版、復(fù)雜提示理解和資源效率方面具有顯著提升的性能。

目前瑞莎團(tuán)隊(duì)使用 Stable Diffusion 3 Medium 開(kāi)源模型,通過(guò) SOPHON SDK 移植到 SG2300X 處理器系列產(chǎn)品上進(jìn)行本地 TPU 硬件加速推理,實(shí)現(xiàn)在 radxa Airbox 上離線快速生成特色風(fēng)格且?guī)逦谋镜膱D片。

有關(guān) Stable Diffusion 3 Medium 更多技術(shù)細(xì)節(jié),請(qǐng)參閱官方網(wǎng)站和研究論文。

5895cb40-488b-11ef-817b-92fbcf53809c.png

Stable diffusion 3 模型架構(gòu)

環(huán)境準(zhǔn)備

硬件準(zhǔn)備

  • Airbox + 65W的配套電源
  • 網(wǎng)線
  • 在局域網(wǎng)內(nèi)可使用瀏覽器訪問(wèn)PC
  • Type-C 數(shù)據(jù)線(可選)

將網(wǎng)線根據(jù)您的網(wǎng)絡(luò)環(huán)境選擇插入 WAN 口(推薦接入廣域網(wǎng))或者 LAN 口(接入局域網(wǎng)),根據(jù)您的使用習(xí)慣可選將 Type-C 數(shù)據(jù)線 C 口端插入 Airbox Debug 口, A 口端插入至您的 PC,最后插入電源上電自動(dòng)開(kāi)機(jī),更多詳細(xì)關(guān)于硬件準(zhǔn)備工作請(qǐng)參考這里

軟件環(huán)境準(zhǔn)備

針對(duì)熟練度不同的 Linux 開(kāi)發(fā)者,可以選擇兩種方式進(jìn)行環(huán)境準(zhǔn)備。因 Airbox 鏡像已經(jīng)預(yù)裝 CasaOS,所以本文以 CasaOS 命令行模式為例子進(jìn)行部署 Stable Diffusion 3

  • 終端命令行模式
  • CasaOS 命令行模式(新手推薦)

開(kāi)啟終端

待 Airbox 開(kāi)機(jī)后,通過(guò)您的 PC 瀏覽器訪問(wèn) Airbox 的 IP 地址的 81 端口便可登錄 CasaOS,如何獲取 Airbox IP 地址?請(qǐng)參考這里

CasaOS 用戶名和密碼

Username:radxaPassword: radxa

Airbox 系統(tǒng)終端用戶名和密碼

Username: linaroPassword: linaro

點(diǎn)擊 CasaOS 左上角第三個(gè)圖標(biāo)登陸 Airbox 系統(tǒng)終端

58dff940-488b-11ef-817b-92fbcf53809c.pngCasaOS 終端登陸界面

代碼環(huán)境準(zhǔn)備

終端打開(kāi)后,接下來(lái)就直接復(fù)制提供的命令就好

克隆 SD3-Medium-TPU 代碼倉(cāng)庫(kù)

cd /datagit clone https://github.com/zifeng-radxa/SD3-Medium-TPU.git && cd SD3-Medium-TPU

配置運(yùn)行環(huán)境(僅需運(yùn)行一次) 此腳本會(huì)自動(dòng)配置所需運(yùn)行依賴的庫(kù),請(qǐng)耐心等待安裝

source env.sh

下載 radxa 提供好的 Stable Diffusion 3 bmodel 格式模型

如果您可以流暢訪問(wèn) github, 可直接運(yùn)行 run.sh 腳本, 這會(huì)自動(dòng)從 github 上下載模型后并啟動(dòng)程序

bash run.sh

如果你出現(xiàn)下載的壓縮包 md5 比對(duì)不過(guò)可以通過(guò)模型下載腳本重新下載

bash tar_downloader.sh

如果您無(wú)法使用 github 下載,radxa 提供百度云鏈接,請(qǐng)將下載好的 models 文件夾拷貝到 Airbox 上 SD-Medium-TPU/python_demo 文件夾中,您可以直接通過(guò) CasaOS 文件管理器中直接上傳至 Airbox

啟動(dòng) Stable Diffusion 3 Gradio 服務(wù)確保下載好模型好啟動(dòng)服務(wù)

bash run.sh

啟動(dòng)后在您的 PC 瀏覽器訪問(wèn) Airbox IP 的 8999 端口即可訪問(wèn) Stable Diffusion3 Gradio 服務(wù)

58f33438-488b-11ef-817b-92fbcf53809c.png

Stable Diffusion3 Gradio 服務(wù)界面

使用示例

點(diǎn)擊右上角 Load Model 加載模型

因?yàn)槟P徒咏?10G 如果您的模型存放在 emmc 中,加載速度會(huì)比較慢,可以選擇存放在 SSD 中

在 CasaOS 終端中可以看到各個(gè)模型的加載細(xì)節(jié), SSD 中加載模型需要 37 秒

read file models/mmdit.bmodel, size 100000, duration 0.000318, speed 0.292869 GB/s[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/mmdit.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 26[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/clip_g.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 14[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/clip_l.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 34[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/t5.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 26[BMRT][bmcpu_setup:406] INFO:cpu_lib 'libcpuop.so' is loaded.bmcpu init: skip cpu_user_definedopen usercpu.so, init user_cpu_init [BMRT][load_bmodel:1084] INFO:Loading bmodel from [models/vae_decoder.bmodel]. Thanks for your patience...[BMRT][load_bmodel:1023] INFO:pre net num: 0, load net num: 1Youset`add_prefix_space`.Thetokenizerneedstobeconvertedfromtheslowtokenizers

填入Prompt信息

  • 在 Prompt 填入英文提示詞,比如

A cat with a sign text Welcome to radxa!

  • 可選填入 Negative Prompt 反向提示詞(輸入不想出現(xiàn)的物體)

deformed, lowres, bad anatomy, error, extra digit, fewer digits, cropped, worst quality, low quality, jpeg artifacts, signature, watermark, username, blurry, artist name

選擇合理的步數(shù)和 CFG值,可選 clip skip(跳過(guò)模型推理的最后層數(shù),建議為0)和隨機(jī)種子,最后點(diǎn)擊 Submit 按鈕開(kāi)始生成任務(wù),生成的圖片結(jié)果會(huì)直接顯示在右邊,點(diǎn)擊下載圖標(biāo)可自行下載


終端中會(huì)打印運(yùn)行進(jìn)度,可見(jiàn)平均每個(gè) step 需要 2.93s

set seed to: 15>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>100%|████████████████████████████████████████████████████████████████████|28/28[01:22<00:00,??2.93s/it]

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 變換器
    +關(guān)注

    關(guān)注

    17

    文章

    2082

    瀏覽量

    109075
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1078

    瀏覽量

    40375
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3112

    瀏覽量

    48660
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    RK3588開(kāi)發(fā)板(armsom-w3)之PWM實(shí)

    RK3588開(kāi)發(fā)板(armsom-w3) 之 PWM實(shí)
    的頭像 發(fā)表于 06-10 10:38 ?2008次閱讀
    RK3588開(kāi)發(fā)板(armsom-w<b class='flag-5'>3</b>)之PWM<b class='flag-5'>實(shí)</b><b class='flag-5'>操</b>

    Stable Diffusion的完整指南:核心基礎(chǔ)知識(shí)、制作AI數(shù)字人視頻和本地部署要求

    的,其目的是消除對(duì)訓(xùn)練圖像的連續(xù)應(yīng)用高斯噪聲,可以將其視為一系列去噪自編碼器。Stable Diffusion3個(gè)部分組成:變分自編碼器(VAE)、U-Net和一個(gè)文本編碼器。添加和去除高斯噪聲的過(guò)程被
    的頭像 發(fā)表于 09-18 10:06 ?2169次閱讀
    <b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>的完整指南:核心基礎(chǔ)知識(shí)、制作AI數(shù)字人視頻和本地部署要求

    電工操作實(shí)

    ZN-890Q電工操作實(shí)柜(單面雙組型)一、概述ZN-890Q電工操作實(shí)柜(單面雙組型)由鋼板作制作的多功能安裝板(網(wǎng)孔板)實(shí)訓(xùn)臺(tái)和電源
    發(fā)表于 07-02 07:14

    Stability AI開(kāi)源圖像生成模型Stable Diffusion

    Stable Diffusion 的很多用戶已經(jīng)公開(kāi)發(fā)布了生成圖像的樣例,Stability AI 的首席開(kāi)發(fā)者 Katherine Crowson 在推特分享了許多圖像?;?AI 的圖像合成可能會(huì)對(duì)藝術(shù)家和藝術(shù)領(lǐng)域帶來(lái)一定
    的頭像 發(fā)表于 09-21 15:37 ?2893次閱讀

    大腦視覺(jué)信號(hào)被Stable Diffusion復(fù)現(xiàn)圖像!“人類的謀略和謊言不存在了”

    它不需要在復(fù)雜的深度學(xué)習(xí)模型上進(jìn)行訓(xùn)練或做精細(xì)的微調(diào),只需要做好fMRI(功能磁共振成像技術(shù))成像到Stable Diffusion中潛在表征的簡(jiǎn)單線性映射關(guān)系就行。
    的頭像 發(fā)表于 03-08 10:21 ?733次閱讀

    大腦視覺(jué)信號(hào)被Stable Diffusion復(fù)現(xiàn)圖像!

    它不需要在復(fù)雜的深度學(xué)習(xí)模型上進(jìn)行訓(xùn)練或做精細(xì)的微調(diào),只需要做好fMRI(功能磁共振成像技術(shù))成像到Stable Diffusion中潛在表征的簡(jiǎn)單線性映射關(guān)系就行。
    的頭像 發(fā)表于 03-16 10:26 ?784次閱讀

    高性能計(jì)算HPC照亮AIGC未來(lái):PC集群+Stable Diffusion 打造極致游戲體驗(yàn)

    隨著計(jì)算能力和技術(shù)水平的不斷提高,PC集群和Stable Diffusion集成在游戲行業(yè)中的應(yīng)用將會(huì)更加廣泛,可以為游戲開(kāi)發(fā)者和分析師提供更多一流的工具和技術(shù)支持,從而推動(dòng)整個(gè)游戲產(chǎn)業(yè)迎來(lái)新的發(fā)展機(jī)遇。
    的頭像 發(fā)表于 04-20 11:46 ?794次閱讀
    高性能計(jì)算HPC照亮AIGC未來(lái):PC集群+<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> 打造極致游戲體驗(yàn)

    一文讀懂Stable Diffusion教程,搭載高性能PC集群,實(shí)現(xiàn)生成式AI應(yīng)用

    PC Farm、生成式AI和Stable Diffusion模型都是非常有用的工具和技術(shù),可以幫助用戶快速構(gòu)建和管理計(jì)算機(jī)集群,生成高質(zhì)量的數(shù)據(jù)和圖像,提高模型的泛化能力和魯棒性。
    的頭像 發(fā)表于 05-01 07:47 ?2269次閱讀
    一文讀懂<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>教程,搭載高性能PC集群,實(shí)現(xiàn)生成式AI應(yīng)用

    使用OpenVINO?在算力魔方加速stable diffusion模型

    Stable Diffusion 是 stability.ai 開(kāi)源的 AI 圖像生成模型,實(shí)現(xiàn)輸入文字,生成圖像的功能。Stable Diffusion 將 AI 圖像生成提升到了全
    的頭像 發(fā)表于 05-12 09:10 ?1378次閱讀
    使用OpenVINO?在算力魔方<b class='flag-5'>上</b>加速<b class='flag-5'>stable</b> <b class='flag-5'>diffusion</b>模型

    優(yōu)化 Stable Diffusion 在 GKE 的啟動(dòng)體驗(yàn)

    Diffusion 等應(yīng)運(yùn)而生。Stable Diffusion 是一個(gè)文字生成圖像的 Diffusion 模型,它能夠根據(jù)給定任何文本輸入生成逼真的圖像。我們?cè)?GitHub Re
    的頭像 發(fā)表于 06-03 08:35 ?831次閱讀

    iPhone兩秒出圖,目前已知的最快移動(dòng)端Stable Diffusion模型來(lái)了

    近日,Snap 研究院推出最新高性能 Stable Diffusion 模型,通過(guò)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練流程、損失函數(shù)全方位進(jìn)行優(yōu)化,在 iPhone 14 Pro 實(shí)現(xiàn) 2 秒出圖(512x512
    的頭像 發(fā)表于 06-12 15:25 ?734次閱讀
    iPhone兩秒出圖,目前已知的最快移動(dòng)端<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>模型來(lái)了

    使用OpenVINO在Stable Diffusion V2.1實(shí)現(xiàn)AI硬件加速的方法

    隨著 AIGC 模型越來(lái)越強(qiáng)大,并取得了更驚人的結(jié)果,任意運(yùn)行 AIGC 模型, 比如 Stable Diffusion,對(duì)于開(kāi)發(fā)人員來(lái)說(shuō)仍然面臨一些挑戰(zhàn)。首先,GPU 的安裝設(shè)置需要我們處理復(fù)雜
    的頭像 發(fā)表于 07-21 11:47 ?1923次閱讀
    使用OpenVINO在<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> V2.1<b class='flag-5'>上</b>實(shí)現(xiàn)AI硬件加速的方法

    樹(shù)莓派能跑Stable Diffusion了?

    Stable Diffusion是一種文本到圖像生成的大型深度學(xué)習(xí)模型,它可以根據(jù)文本的描述生成詳細(xì)的圖像,也可以用于其他任務(wù),如圖像修復(fù)、圖像擴(kuò)展、圖像翻譯等。
    的頭像 發(fā)表于 07-26 11:46 ?1473次閱讀

    Stable Diffusion的完整指南:核心基礎(chǔ)知識(shí)、制作AI數(shù)字人視頻和本地部署要求

    13400;i3 12100;i7 12700 ;i9 12900? 在當(dāng)今的數(shù)字時(shí)代,人工智能正在逐步改變?nèi)藗兊纳詈凸ぷ鞣绞?。其?Stable Diffusion作為一種深度學(xué)習(xí)技術(shù),受到廣泛關(guān)注。它能夠通過(guò)對(duì)圖像或視頻
    的頭像 發(fā)表于 09-07 14:12 ?2107次閱讀
    <b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b>的完整指南:核心基礎(chǔ)知識(shí)、制作AI數(shù)字人視頻和本地部署要求

    PCB設(shè)計(jì)如何在實(shí)中規(guī)范的布局

    作為PCB設(shè)計(jì)的重點(diǎn),布局是布線的基礎(chǔ),一個(gè)完美的布局開(kāi)端,直接使得布線工作量事半功倍。 本次就來(lái)說(shuō)一下如何在真實(shí)的實(shí)當(dāng)中規(guī)范的布局。 對(duì)于Altium Designer軟件,相比于其他軟件,它
    的頭像 發(fā)表于 11-06 15:24 ?566次閱讀
    PCB設(shè)計(jì)如<b class='flag-5'>何在</b><b class='flag-5'>實(shí)</b><b class='flag-5'>操</b>中規(guī)范的布局