0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI繪圖實(shí)踐-用人工智能生圖助力618大促

京東云 ? 來源:jf_75140285 ? 作者:jf_75140285 ? 2024-07-10 09:39 ? 次閱讀

現(xiàn)在各種AI大模型大行其道,前有GhatGPT顛覆了我們對對話型AI的原有印象,后有Sora文生視頻,讓我們看到了利用AI進(jìn)行創(chuàng)意創(chuàng)作的無限可能性。如今各大公司和團(tuán)隊(duì)都爭相提出自己的大模型,各種網(wǎng)頁端和軟件應(yīng)用也極大地降低了我們使用AI作為生產(chǎn)力的門檻。

我這次就為大家?guī)硎褂肁I進(jìn)行繪圖的入門實(shí)踐,為大促文章配圖,繪制大促廣告宣傳海報,提升促銷圖的畫質(zhì)和精度,探索一下從這方面助力大促的新思路。

平臺

現(xiàn)在的AI繪圖主要用到的模型是SD(Stable Diffusion),它是一種穩(wěn)定擴(kuò)散模型,用于生成高質(zhì)量的圖像。這種模型是在傳統(tǒng)的擴(kuò)散模型DDPMs(Denoising Diffusion Probabilistic models)的基礎(chǔ)上發(fā)展出來的。

wKgZomaNMn2ADWP4AAc73r03Vng910.png

經(jīng)過多個版本的迭代和改進(jìn),這類模型已經(jīng)能很好的執(zhí)行“文生圖”、“圖生圖”、“后期處理”等AI功能,甚至可以在一定程度上代替PhotoShop等圖像處理軟件的工作。

現(xiàn)在許多開發(fā)者都發(fā)布了基于SD模型的改進(jìn)型模型,基本上所有的網(wǎng)頁端和軟件也都是基于此模型搭建的,要使用它進(jìn)行AI繪畫,主要有三種方法:

1.自己搭建基于SD的webui,在gitHub上有項(xiàng)目的源代碼: https://github.com/AUTOMATIC1111/stable-diffusion-webui 。這種方式的優(yōu)點(diǎn)是自由度高,可以根據(jù)自己的需求進(jìn)行客制化改造,更新也最及時,但是要自己進(jìn)行環(huán)境搭建,對于一般用戶來說學(xué)習(xí)門檻較高,國內(nèi)使用的話需要魔法,同時經(jīng)過我的體驗(yàn)穩(wěn)定性不高,經(jīng)常會失敗。

2.使用網(wǎng)頁端應(yīng)用,這類網(wǎng)站是基于stable-diffusion-webui 搭建的第三方平臺,由他們負(fù)責(zé)維護(hù)和更新,并提供穩(wěn)定的連接,用戶只需要選擇需要的模型和參數(shù),輸入提示詞,就可以在線生成圖片。

國內(nèi)有:

Liblib Ai: https://www.liblib.art/

MJ: https://mj.wxcbh.cn/home/?from=AI05&strategy=drawing5&bd_vid=17724435435623318479#/mj

都不需要魔法 。

國外的像:Playground AI: https://playground.com/ ,每天有免費(fèi)的體驗(yàn)次數(shù),速度和質(zhì)量也不錯。

這類網(wǎng)站一般都有自己的模型市場,以供創(chuàng)作者們上傳和下載自定義的模型,并且分享自己的繪圖作品以及相關(guān)生圖的參數(shù),非常方便。但是一般都會收費(fèi),都會收費(fèi),都會收費(fèi),重要的事情說三遍。

3.PC端軟件,這類軟件一般也是基于SD模型進(jìn)行封裝,可以下載模型,設(shè)置參數(shù)并在本地生成圖片,使用體驗(yàn)類似于PS等圖片處理軟件,但是由于整個生成過程在本地執(zhí)行,比較依賴于本機(jī)算力,電腦性能不好的話生成會很慢,但是好處就是自定義程度相對較高,而且一般免費(fèi)。

生圖軟件

我這次主要介紹軟件的途徑,使用的軟件就是這款Draw Things,Mac端App Store免費(fèi)下載,不需要魔法

他的界面是這樣的:

wKgZomaNMn-AbUf4AAdbu8WBjmU532.png

參數(shù)設(shè)置區(qū)用于選擇模型,采集器,步數(shù)和隨機(jī)種子等參數(shù),首次生成圖片首先選擇“文本到圖像”模式。在這里我大致介紹一下涉及到的名詞:

模型

模型是AI繪畫的基礎(chǔ),一般的模型都是基于SD改進(jìn)的,SD模型也有V1.0、V1.5、V2.0、V2.1等不同的迭代版本,不同的模型可以生成不同風(fēng)格的圖片,可以根據(jù)自己的需要進(jìn)行選擇,模型可以在DrawThings里進(jìn)行下載和選擇,當(dāng)然也可以在Liblib Ai等網(wǎng)站上下載然后導(dǎo)入。

wKgZomaNMoCAQynPAAG8l8RyF8k609.png

模型分為幾個主要的種類:

chekpoint(檢查點(diǎn))

它是完整模型的常見格式,模型體積較大,一般真人版的單個模型的大小在7GB左右,動漫版的在2-5個G之間。決定了圖片的整體風(fēng)格。chekpoint的后綴名是safetensors

有寫實(shí),科幻,漫畫,廣告等等風(fēng)格

Lora

是一種體積較小的繪畫模型,是對大模型的微調(diào)。可以添加Lora為圖片創(chuàng)造更豐富的表現(xiàn)形式。與每次作畫只能選擇一個大模型不同,lora模型可以在已選擇大模型的基礎(chǔ)上添加一個甚至多個。一般體積在幾十到幾百兆左右。

Lora的后綴名也是safetensors,所以在安裝的時候要注意,Lora要在規(guī)定的地方導(dǎo)入:

wKgaomaNMoSAJzwNAAEjQzDLYck189.png

Hypernetwork(超網(wǎng)絡(luò))

類似 LoRA ,但模型效果不如 LoRA,不能單獨(dú)使用,需要搭配大模型使用

?

采樣器

采樣器也會在一定程度上影響圖畫風(fēng)格,不同于模型,它一般是基于算法。選擇對的采樣器對于生成圖片的質(zhì)量至關(guān)重要,下面介紹一些主流的采樣器類型:

DDIM和PLMS是早期SD專為擴(kuò)散模型而設(shè)計(jì)的采樣器。DPM和DPM++系列是專為擴(kuò)散模型而設(shè)計(jì)的新型采樣器。DPM++是DPM的改進(jìn)版。

Euler a 比較適用于圖標(biāo)設(shè)計(jì)、二次元圖像、小型場景等簡單的圖像數(shù)據(jù)生成場景。

DPM和DPM++系列非常適用于三維景象和復(fù)雜場景的描繪,例如寫實(shí)人像。

Karras系列是專為擴(kuò)散模型而設(shè)計(jì)的改進(jìn)版采樣器,有效提升了圖片質(zhì)量。

Euler a,DPM2 a, DPM++2S a和DPM++2S a Karras適合給圖片增加創(chuàng)造性,隨著迭代步數(shù)的提升,圖片也會隨之變化。不同的采樣方法可能對不同的模型產(chǎn)生不同的影響,會影響生成圖片的藝術(shù)風(fēng)格,建議結(jié)合模型和迭代步數(shù)多做嘗試。

步數(shù)

生圖時,去噪重復(fù)的步數(shù)被稱為采樣迭代步數(shù)。

測試新的模型或Prompts效果時,迭代步數(shù)推薦使用10~15,可以快速獲得結(jié)果,方便進(jìn)行調(diào)整。當(dāng)?shù)綌?shù)太低時,生成的圖像幾乎無法呈現(xiàn)內(nèi)容。20 ~ 30之間的迭代步數(shù)通常會有不錯的效果。40步以上的迭代步數(shù)會需要更長的生圖時間,但收益可能有限,除非在繪制動物毛發(fā)或皮膚紋理等。

過低或過高的初始分辨率都可能會讓SD生圖時無法正常發(fā)揮,建議參考基礎(chǔ)模型的分辨率,配置合適的初始寬高

隨機(jī)種子

隨機(jī)種子會影響生圖時的初始噪聲圖像。

當(dāng)Seed=-1時,表示每次出圖都會隨機(jī)一個種子,使得每次生成的圖都會不同。其他創(chuàng)作者上傳圖片的時候,一般會附帶此圖片對應(yīng)的隨機(jī)種子,可以參考它來生成類似的圖片。點(diǎn)擊可以生成一個隨機(jī)的種子,長按則可以輸入特定的隨機(jī)種子。

提示詞

提示詞是生成圖片時關(guān)鍵中的關(guān)鍵,它直接決定了圖片內(nèi)容,畫面風(fēng)格,場景,表情動作等一些列內(nèi)容,在生成圖片時,選擇合適的提示詞至關(guān)重要。

wKgZomaNMoSATIFNAAHvdXyuBPk101.png

提示詞分為“正向提示詞”和“反向提示詞”,“正向提示詞”代表你想要在圖片中呈現(xiàn)的內(nèi)容,反之“反向提示詞”則是不想要在圖片里具備的要素。

比如,我想要畫一張“618西瓜大促”相關(guān)的宣傳圖,我就可以這樣描述:

“許多人在湖里流動的水邊吃西瓜,高質(zhì)量的微型攝影”,翻譯成英文:“Many people eat watermelons by the flowing water in the lake, with high-quality miniature photography”

將這段文字輸入DrawThings的文本框,它會自動把整句話拆分成一個個提示詞。

wKgaomaNMoWAKTf2AADXMVPkvIA764.png

當(dāng)然,我們也可以直接填入想要繪制的提示詞:

wKgZomaNMoaAerhTAAEYS8gmm-Y542.png

如上圖所示,如果我們想著重強(qiáng)調(diào)某一個提示詞,讓AI繪制的時候更偏重一這一特征,就可以用括號把它包起來,然后在后面注明權(quán)重,這里我就把西瓜(watermelon)加重到了1.5權(quán)重,以便更加突出這一點(diǎn)。

“反向提示詞”一般有:低質(zhì)量,不適合上班時間瀏覽(NSFW),描繪人物的時候,糟糕的眼睛,多余的手指,扭曲,變形等等

wKgaomaNMoeAeK9-AAF769G_4g8097.png

其他

還有一些其他的參數(shù),比如圖片分辨率和比例,文本指導(dǎo)強(qiáng)度(越高越忠實(shí)呈現(xiàn)文本內(nèi)容),以及一次生成的圖片數(shù)量等等

wKgZomaNMoiAIODUAADZMAaUcI4703.png

設(shè)置好一切,就可以開始生成圖片了,可以多嘗試幾張,從中挑選最合適的進(jìn)行二次處理。

wKgaomaNMouAC4IkAA3qGjmg_io804.png

?

二次處理

如果對生成的圖片有些細(xì)節(jié)不滿意,可以利用“圖像到圖像”模式,然后選擇強(qiáng)度。高分辨率修復(fù)的重繪強(qiáng)度為0時不會改變原圖,30% 以下會基于原圖稍微修正,超過 70% 會對原圖做出較大改變,1 會得到一個完全不同的圖像。

二次處理主要包括以下幾個目的:

重繪圖像元素

如果對圖像中某部分的元素不滿意,可以用“橡皮擦”擦除該部分,然后重新生成,讓模型自動將擦數(shù)的部分重繪,甚至可以消除某部分圖像元素,實(shí)測效果甚至好于PS。

擴(kuò)圖

對于一張圖片,如果想要擴(kuò)展邊界部分,讓模型繪制出額外的內(nèi)容,可以首先重新設(shè)置圖片的寬高。我這里原是圖片是1088*2048,想要擴(kuò)展左側(cè)湖里的景象,就可以先將圖片寬度增加到1536,然后移動圖片到右側(cè)貼緊圖層邊緣。然后最關(guān)鍵的一步,用“橡皮擦”工具,沿著想要擴(kuò)展的那一邊,細(xì)細(xì)的擦一道,這么做的目的是告訴模型,從這一部分開始重繪,風(fēng)格要按照擦除的這部分來進(jìn)行,然后重新生成?

提升畫質(zhì)

最開始生成圖片時,為了提高速度和效率,可以適當(dāng)降低分辨率,的到合適的圖片以后,可以重設(shè)分辨率和清晰度,重繪圖片,達(dá)到提升畫質(zhì)的目的。當(dāng)然,對于已經(jīng)已經(jīng)畫好的第三方圖片,也可以加載進(jìn)來進(jìn)行處理。

好了,本篇利用AI繪圖進(jìn)行實(shí)踐的文章就介紹到這里,希望能夠幫助到大家。在以后大促文章配圖,和大促海報繪制方面為大家提供便利,助力618大促再創(chuàng)新高!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268103
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46652

    瀏覽量

    237073
收藏 人收藏

    評論

    相關(guān)推薦

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這一章詳細(xì)
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個閱讀此書的機(jī)會,感謝平臺。 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    非常高興本周末收到一本新書,也非常感謝平臺提供閱讀機(jī)會。 這是一本挺好的書,包裝精美,內(nèi)容詳實(shí),干活滿滿。 關(guān)于《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章“AI
    發(fā)表于 10-14 09:16

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    。 5. 展望未來 最后,第一章讓我對人工智能驅(qū)動的科學(xué)創(chuàng)新未來充滿了期待。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的拓展,AI將在更多領(lǐng)域發(fā)揮關(guān)鍵作用,從基礎(chǔ)科學(xué)到應(yīng)用科學(xué),從理論研究到實(shí)踐應(yīng)用,都將迎來前所未有
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    、RISC-V在人工智能圖像處理中的應(yīng)用案例 目前,已有多個案例展示了RISC-V在人工智能圖像處理中的應(yīng)用潛力。例如: Esperanto技術(shù)公司 :該公司制造的首款高性能RISC-V AI處理器旨在
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學(xué) 不過好像都是要學(xué)的
    發(fā)表于 09-26 15:24

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本
    發(fā)表于 09-09 15:36

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    ! 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》 這本書便將為讀者徐徐展開AI for Science的美麗圖景,與大家一起去了解: 人工智能究竟幫科學(xué)家做了什么?
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能
    發(fā)表于 08-22 15:00

    阿丘科技成功入選“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃”,AI+工業(yè)視覺實(shí)力再獲肯定

    成式AI技術(shù)、垂直行業(yè)視覺大模型等創(chuàng)新探索,成功入選“應(yīng)用伙伴”。聚焦AI+工業(yè)場景,入選應(yīng)用伙伴“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃”由北京市經(jīng)濟(jì)和信息化局、北京
    的頭像 發(fā)表于 07-16 08:25 ?416次閱讀
    阿丘科技成功入選“北京市通<b class='flag-5'>用人工智能</b>產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃”,<b class='flag-5'>AI</b>+工業(yè)視覺實(shí)力再獲肯定

    大模型應(yīng)用之路:從提示詞到通用人工智能(AGI)

    鋪平道路。 基于AI大模型的推理功能,結(jié)合了RAG(檢索增強(qiáng)生成)、智能體(Agent)、知識庫、向量數(shù)據(jù)庫、知識圖譜等先進(jìn)技術(shù),我們向?qū)崿F(xiàn)真正的AGI(通用人工智能)邁出了重要步伐。 為了方便大家理解,將
    的頭像 發(fā)表于 06-14 10:20 ?2083次閱讀
    大模型應(yīng)用之路:從提示詞到通<b class='flag-5'>用人工智能</b>(AGI)

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    Aidlite-SDK模型推理 https://v2.docs.aidlux.com/sdk-api/aidlite-sdk/aidlite-python 人工智能 5G AIoT技術(shù)實(shí)踐入門與探索_V2 59分
    發(fā)表于 05-10 16:46

    嵌入式人工智能的就業(yè)方向有哪些?

    。 國內(nèi)外科技巨頭紛紛爭先入局,在微軟、谷歌、蘋果、臉書等積極布局人工智能的同時,國內(nèi)的BAT、華為、小米等科技公司也相繼切入到嵌入式人工智能的賽道。那么嵌入式AI可就業(yè)的方向有哪些呢? 嵌入式
    發(fā)表于 02-26 10:17

    NVIDIA 人工智能開講 | 什么是 AI For Science?詳解 AI 助力科學(xué)研究領(lǐng)域的新突破

    ”兩大音頻 APP上搜索“ NVIDIA 人工智能開講 ”專輯,眾多技術(shù)大咖帶你深度剖析核心技術(shù),把脈未來科技發(fā)展方向! AI For Science (亦稱 “AI In Science” ),是
    的頭像 發(fā)表于 12-25 18:30 ?919次閱讀
    NVIDIA <b class='flag-5'>人工智能</b>開講 | 什么是 <b class='flag-5'>AI</b> For Science?詳解 <b class='flag-5'>AI</b> <b class='flag-5'>助力</b>科學(xué)研究領(lǐng)域的新突破

    英特爾、谷歌、英偉達(dá)運(yùn)用人工智能推動處理器設(shè)計(jì)與生產(chǎn)

    兩家著名的芯片設(shè)計(jì)軟件企業(yè),Cadence和Synopsys,均利用人工智能強(qiáng)化設(shè)計(jì)工具。谷歌展示了使用人工智能開發(fā)AI加速度器的方法。英偉達(dá)亦在產(chǎn)品制造過程中運(yùn)用大量人工智能,替代低
    的頭像 發(fā)表于 12-15 10:16 ?563次閱讀