0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用Jina來(lái)構(gòu)建一個(gè)使用Stable Diffusion生成圖像的Executor呢

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:Alex CG ? 2023-03-27 10:25 ? 次閱讀

什么是 Executor

Executor 是一個(gè)獨(dú)立的 gRPC 微服務(wù),它可以在 DocumentArray 上執(zhí)行任務(wù)。Executor Hub 上有大量預(yù)構(gòu)建的 Executor 可供選擇,包含了各種常見(jiàn)的任務(wù),如文本分類,圖像識(shí)別、目標(biāo)檢測(cè)等。

ExecutorHub:cloud.jina.ai/executors

為了讓你能夠更輕松地部署和管理微服務(wù),我們正將 Executor 從 Flow 中分離出來(lái)。同時(shí),也方便你更好地利用 Jina 的其他強(qiáng)大功能,比如:

利用 gRPC 和 protobuf 實(shí)現(xiàn)高效的網(wǎng)絡(luò)傳輸和序列化,更快地處理數(shù)據(jù)和模型之間的通信;

使用 DocArray 更準(zhǔn)確、靈活地表示多模態(tài)數(shù)據(jù),以滿足不同場(chǎng)景下的需求;

“Array-first”概念,將輸入數(shù)據(jù)分批進(jìn)行模型推理,可以大幅提高吞吐量,使你的模型處理更加高效;

輕松地將 ML 模型部署到生產(chǎn)環(huán)境中,享受云原生所帶來(lái)的便利和絲滑。

此外,請(qǐng)密切關(guān)注即將推出的 Jina AI Cloud(cloud.jina.ai),在 Jina Cloud 上免費(fèi)運(yùn)行模型部署。

Jina 吉祥物

前段時(shí)間,我們?cè)谥芪逡黄鸷染屏奶斓臅r(shí)候,突然聊到要不要給 Jina 選一個(gè)可愛(ài)的吉祥物,就像米其林輪胎人一樣。

酒后頭腦風(fēng)暴之后,我們最終的決定是「彩虹獨(dú)角獸蝴蝶小貓」,考慮到基因改造工程的復(fù)雜度,要怎么真正創(chuàng)造出這樣一個(gè)神奇的新生物呢?我們決定先動(dòng)手畫張圖:

但想一想,還有什么比使用 Jina 本身更好的方式來(lái)生成 Jina 的吉祥物呢?考慮到這一點(diǎn),我們立馬開(kāi)發(fā)了一個(gè)圖像生成的 Executor 和 Deployment。因此,在這篇文章中,我們將介紹如何將模型構(gòu)建成 Executor、部署它、擴(kuò)展它以及與全世界共享它。

構(gòu)建 Executor

需要一個(gè) GPU 才能在本地運(yùn)行和部署這個(gè) Executor。但你也可以調(diào)整代碼,使用 Executor Hub Sandbox 版本,托管在 Jina AI Cloud上。

在 Jina 中部署服務(wù)時(shí)總是以 Executor 的形式進(jìn)行。Executor是一個(gè)Python類,用于轉(zhuǎn)換和處理 Document??梢詫⑽谋?圖像編碼為向量、OCR、從 PDF 中提取表格等等,不僅限于圖像生成。

當(dāng)然如果你只是想把它用起來(lái),而不是從頭開(kāi)始構(gòu)建它,可以直接跳到 Executor Hub 部分。

在本教程中,我們將重點(diǎn)關(guān)注 Executor 和 Deployment,而不會(huì)深入研究 Stable Diffusion 模型的復(fù)雜性。我們希望本教程適用于任何微服務(wù)或模型,而不是只適用特定用例。

以下大致就是我們希望 Executor 看起來(lái)的樣子。用戶傳入提示詞,Executor 使用該提示詞生成圖像,然后將該圖像傳回給用戶:

dcc32e40-cb54-11ed-bfe3-dac502259ad0.png

先決條件

您需要安裝 Hugging Face Diffusers,pip install diffusers[torch]。

現(xiàn)在,讓我們從整體上看一下 Executor 代碼,然后逐節(jié)分析:

我們將從創(chuàng)建開(kāi)始 text_to_image.py:

from docarray import DocumentArray
from jina import Executor, requests
import numpy as np

class TextToImage(Executor):
    def __init__(self, **kwargs):
        super().__init__(**kwargs)
        import torch
        from diffusers import StableDiffusionPipeline

        self.pipe = StableDiffusionPipeline.from_pretrained(
            "CompVis/stable-diffusion-v1-4", torch_dtype=torch.float16
        ).to("cuda")

    @requests
    def generate_image(self, docs: DocumentArray, **kwargs):
    # image here is in PIL format
        images = self.pipe(docs.texts).images
        
        for i, doc in enumerate(docs):
            doc.tensor = np.array(images[i])

Imports

from docarray import DocumentArray
from jina import Executor, requests
import numpy as np

注:Documents 和 DocumentArrays 是 Jina 的原生 IO 格式。

Executor 類

class TextToImage(Executor):
    def __init__(self, **kwargs):
        super().__init__(**kwargs)
        import torch
        from diffusers import StableDiffusionPipeline

        self.pipe = StableDiffusionPipeline.from_pretrained(
            "CompVis/stable-diffusion-v1-4", torch_dtype=torch.float16
        ).to("cuda")

所有 Executor 都是從 Jina 的 Executor 類創(chuàng)建的。用戶可定義的參數(shù)是方法中定義的參數(shù)__init__()。

Requests 裝飾器

@requests
def generate_image(self, docs: DocumentArray, **kwargs):
    # image here is in PIL format
    images = self.pipe(docs.texts).images

    for i, doc in enumerate(docs):
        doc.tensor = np.array(images[i])

當(dāng)你在一個(gè) Executor 中定義了一個(gè)方法,并使用了@requests 裝飾器,那么你就可以通過(guò)端點(diǎn)調(diào)用這個(gè)方法。當(dāng)你沒(méi)有指定端點(diǎn)路徑時(shí),那么這個(gè)方法會(huì)成為默認(rèn)處理程序。

這里我們沒(méi)有像@requests(on='/foo') 這樣指定端點(diǎn)路徑,只是使用了裸的@requests,所以當(dāng)調(diào)用 Executor 時(shí),generate_image() 方法會(huì)成為默認(rèn)處理程序。

部署我們的微服務(wù)

那么,現(xiàn)在我們有了 Executor,下一步當(dāng)然就是部署啦!通過(guò) Deployment,你可以運(yùn)行和擴(kuò)展 Executor,添加 replicas(副本), shards(分片) 和 dynamic batching(動(dòng)態(tài)批處理)。此外,部署到 Kubernetes 或 Docker Compose 也很容易,我們將在本文后面介紹。

1. Deploy via Python API

運(yùn)行 python deployment.py

from jina import Deployment
from text_to_image import TextToImage

with Deployment(uses=TextToImage, timeout_ready=-1, install_requirements=True) as dep:
    dep.block()

2. Deploy via YAML

使用 CLI 運(yùn)行 YAML 部署:jina deployment --uses deployment.yml

jtype: Deployment
with:
  port: 12345
  uses: TextToImage
  py_modules:
    - text_to_image.py # name of the module containing Executor
  timeout_ready: -1
install_requirements: True
And run the YAML Deployment with the CLI: jina deployment --uses deployment.yml

無(wú)論您運(yùn)行哪種 Deployment,您都會(huì)看到以下輸出:

────────────────────────────────────────  Deployment is ready to serve! ─────────────────────────────────────────
╭──────────────  Endpoint ───────────────╮
│        Protocol                   GRPC │
│          Local          0.0.0.0:12345  │
│        Private      172.28.0.12:12345  │
│         Public    35.230.97.208:12345  │
╰──────────────────────────────────────────╯

與我們的微服務(wù)通信

我們可以使用 Jina Client 通過(guò) gRPC 向我們的服務(wù)發(fā)送請(qǐng)求。如前所述,我們使用 Document 作為基本的 IO 格式:

運(yùn)行 client.py 獲得我們的夢(mèng)中精靈貓。

from docarray import Document
from jina import Client

image_text = Document(text='rainbow unicorn butterfly kitten')

client = Client(port=12345)  # use port from output above
response = client.post(on='/', inputs=[image_text])

response[0].display()

擴(kuò)展我們的微服務(wù)

Jina 有開(kāi)箱即用的可擴(kuò)展功能,如副本、分片和動(dòng)態(tài)批處理。這使您可以輕松增加應(yīng)用程序的吞吐量。

讓我們部署 Deployment,并使用副本和動(dòng)態(tài)批處理對(duì)其進(jìn)行擴(kuò)展。我們將:

創(chuàng)建兩個(gè)副本,每個(gè)副本分配一個(gè) GPU。

啟用動(dòng)態(tài)批處理以并行處理傳入同一模型的請(qǐng)求。

dda296fc-cb54-11ed-bfe3-dac502259ad0.png

這是 Deployment 的原始(未擴(kuò)展)deployment.yml:

jtype: Deployment
with:
  timeout_ready: -1
  uses: jinaai://jina-ai/TextToImage
  install_requirements: true

現(xiàn)在讓我們擴(kuò)大規(guī)模:

jtype: Deployment
with:
  timeout_ready: -1
  uses: jinaai://jina-ai/TextToImage
  install_requirements: true
  env:
   CUDA_VISIBLE_DEVICES: RR
  replicas: 2
  uses_dynamic_batching: # configure dynamic batching
    /default:
      preferred_batch_size: 10
      timeout: 200

我們通過(guò) CUDA_VISIBLE_DEVICES添加了 GPU 支持,使用了兩個(gè)副本(每個(gè)副本分配一個(gè) GPU)和動(dòng)態(tài)批處理,可以累積并批處理請(qǐng)求,再發(fā)送到 Executor。

假設(shè)您的機(jī)器有兩個(gè) GPU,使用擴(kuò)展后的 Deployment YAML 會(huì)比普通部署獲得更高的吞吐量。

感謝 YAML 語(yǔ)法,你可以直接注入部署配置,不用修改 Executor 代碼。當(dāng)然了,所有這些也可以通過(guò) Python API 完成。

Kubernetes, Docker Compose andOpenTelemetry

使用 Kubernetes 和 Jina 很容易

jina export kubernetes deployment.yml ./my-k8s
kubectl apply -R -f my-k8s

同樣的,Docker Compose 也很容易

jina export docker-compose deployment.yml docker-compose.yml
docker-compose up

甚至,使用 OpenTelemetry 進(jìn)行 tracing(跟蹤) 和 monitoring (監(jiān)視) 也很簡(jiǎn)單。

from docarray import DocumentArray
from jina import Executor, requests

class Encoder(Executor):
    @requests
    def encode(self, docs: DocumentArray, **kwargs):
        with self.tracer.start_as_current_span(
            'encode', context=tracing_context
        ) as span:
            with self.monitor(
                'preprocessing_seconds', 'Time preprocessing the requests'
            ):
                docs.tensors = preprocessing(docs)
            with self.monitor(
                'model_inference_seconds', 'Time doing inference the requests'
            ):
                docs.embedding = model_inference(docs.tensors)

您可以集成 Jaeger 或任何其他分布式跟蹤工具,來(lái)收集和可視化請(qǐng)求級(jí)別和應(yīng)用級(jí)別的服務(wù)操作屬性。這有助于分析請(qǐng)求-響應(yīng)生命周期、應(yīng)用程序行為和性能。要使用 Grafana,你可以下載這個(gè) JSON 文件并導(dǎo)入 Grafana:

ddd1681a-cb54-11ed-bfe3-dac502259ad0.png

共享你的 Executor

使用 Executor Hub 共享你的 Executors 或使用公共/私有 Executors,幾乎不需要擔(dān)心依賴關(guān)系。

ddf4398a-cb54-11ed-bfe3-dac502259ad0.png

創(chuàng)建 Hub-ready Executor:

jina hub new

將其推送到 Executor Hub:

jina hub push

您可以通過(guò) Python 在 Deployment 中使用 Hub Executor:

Deployment(uses='jinaai://jina-ai/TextToImage', install_requirements=True)  # download and run locally
Deployment(uses='jinaai+docker://jina-ai/TextToImage')  # run in Docker container
Deployment(uses='jinaai+sandbox://jina-ai/TextToImage')  # run in hosted sandbox

或者 YAML:

uses: jinaai://jina-ai/TextToImage  # download and run locally
install_requirements: true

uses: jinaai+docker://jina-ai/TextToImage  # run in Docker container
uses: jinaai+sandbox://jina-ai/TextToImage  # run in hosted sandbox

Executor Hub 管理后端的所有內(nèi)容,包括:

云端自動(dòng)構(gòu)建;

高效且經(jīng)濟(jì)地存儲(chǔ)、部署和交付 Executor;

自動(dòng)解決版本沖突和依賴;

通過(guò) Sandbox 即時(shí)交付任何 Executor,而無(wú)需將任何內(nèi)容 pull 到本地;

將微服務(wù)串聯(lián)成pipeline 中

有時(shí)你可能希望將微服務(wù)串聯(lián)成一個(gè) pipeline。這就是 Flow 的用武之地。我們將在以后的博客中更深入地介紹如何構(gòu)建 Flow,目前您可以查看我們的 README。

Readme: get.jina.ai

總結(jié)

正如用 Executor 和 Deployment 包裝微服務(wù)或模型一樣,我們也必須總結(jié)這篇文章??偨Y(jié)一下我們所涵蓋的內(nèi)容:

使用 Jina,你可以將模型包裝為 Executor,通過(guò) Deployment 可以直接部署這些 Executor,或者將他們串聯(lián)成 pipeline 作為 Flow 去部署。

Jina 與 Kubernetes、Docker Compose 和 OpenTelemetry 集成輕而易舉。

你可以在 Executor Hub 輕松找到和共享所有內(nèi)容。

如果您想繼續(xù)深入了解,請(qǐng)查看我們的文檔以獲取有關(guān) Executors 和 Deployments 的更多信息,或者使用 Jina Flows 查看 pipeline。您還可以聯(lián)系我們的 Slack 社區(qū)jina.ai/community。

多多和我們互動(dòng)吧!這樣我們才更加有動(dòng)力分享出更多好文章,未來(lái)我們將發(fā)布更多文章深入探討作為人人可用的多模態(tài)數(shù)據(jù)平臺(tái),如何利用 Jina 地云原生,MLOps 和 LMOps 技術(shù),讓每個(gè)企業(yè)和開(kāi)發(fā)者都能享受到最好的搜索和生成技術(shù)。

Jina 吉祥物之彩虹獨(dú)角獸蝴蝶小貓排行榜

像所有圖像生成一樣,我們花了很長(zhǎng)時(shí)間才生成一只完美的可愛(ài)小貓。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4673

    瀏覽量

    128594
  • 執(zhí)行器
    +關(guān)注

    關(guān)注

    5

    文章

    375

    瀏覽量

    19294
  • CLI
    CLI
    +關(guān)注

    關(guān)注

    1

    文章

    79

    瀏覽量

    8521
  • YAML
    +關(guān)注

    關(guān)注

    0

    文章

    21

    瀏覽量

    2311

原文標(biāo)題:如何用 Jina 部署深度學(xué)習(xí)模型

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Freepik攜手Magnific AI推出AI圖像生成

    近日,設(shè)計(jì)資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這里程碑式的發(fā)布標(biāo)志著AI圖像創(chuàng)作領(lǐng)域邁入了
    的頭像 發(fā)表于 08-30 16:23 ?1051次閱讀

    實(shí)操: 如何在AirBox上跑Stable Diffusion 3

    StableDiffusion3Medium是種多模態(tài)擴(kuò)散變換器(MMDiT)文本到圖像模型,在圖像質(zhì)量、排版、復(fù)雜提示理解和資源效率方面具有顯著提升的性能。目前瑞莎團(tuán)隊(duì)
    的頭像 發(fā)表于 07-23 08:34 ?207次閱讀
    實(shí)操: 如何在AirBox上跑<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> 3

    微信大模型擴(kuò)容并開(kāi)源,推出首個(gè)中英雙語(yǔ)文生圖模型,參數(shù)規(guī)模達(dá)15億

    基于Diffusion Transformer的混元DiT是種文本到圖像生成模塊,具備中英細(xì)粒度理解能力,能與用戶進(jìn)行多輪對(duì)話,根據(jù)上下文生成
    的頭像 發(fā)表于 05-14 17:10 ?651次閱讀

    OpenAI發(fā)布圖像檢測(cè)分類器,可區(qū)分AI生成圖像與實(shí)拍照片

    據(jù)OpenAI介紹,初步測(cè)試結(jié)果表明,該分類器在辨別非AI生成圖像與DALL·E 3生成圖像時(shí),成功率高達(dá)近98%,僅有不到0.5%的非AI圖像
    的頭像 發(fā)表于 05-09 09:57 ?408次閱讀

    UL Procyon AI 發(fā)布圖像生成基準(zhǔn)測(cè)試,基于Stable Diffusion

    UL去年發(fā)布的首個(gè)Windows版Procyon AI推理基準(zhǔn)測(cè)試,以計(jì)算機(jī)視覺(jué)工作負(fù)載評(píng)估AI推理性能。新推出的圖像生成測(cè)試將提供統(tǒng)、精確且易于理解的工作負(fù)載,用以保證各支持硬件間公平、可比的性能表現(xiàn)。
    的頭像 發(fā)表于 03-25 16:16 ?820次閱讀

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨(dú)特的功能吸引了眾多關(guān)注。此模型具備從單張圖像生成多視圖3D視頻的能力,為視頻制作領(lǐng)域帶來(lái)了革命性的突破。
    的頭像 發(fā)表于 03-22 10:30 ?752次閱讀

    KOALA人工智能圖像生成模型問(wèn)世

    近日,韓國(guó)科學(xué)團(tuán)隊(duì)宣布研發(fā)出名為 KOALA 的新型人工智能圖像生成模型,該模型在速度和質(zhì)量上均實(shí)現(xiàn)了顯著突破。KOALA 能夠在短短 2 秒內(nèi)生成高質(zhì)量圖片,同時(shí)大幅降低了對(duì)硬件的需求,為
    的頭像 發(fā)表于 03-05 10:46 ?711次閱讀

    韓國(guó)科研團(tuán)隊(duì)發(fā)布新型AI圖像生成模型KOALA,大幅優(yōu)化硬件需求

    由此模型的核心在于其運(yùn)用了“知識(shí)蒸餾”(knowledge distillation)技術(shù),這使得開(kāi)源圖像生成工具Stable Diffusion XL可大幅縮小其規(guī)模。原
    的頭像 發(fā)表于 03-01 14:10 ?565次閱讀

    聯(lián)發(fā)科天璣又領(lǐng)先步!強(qiáng)悍AI手機(jī)芯片就看天璣!

    應(yīng)用,該演示充分發(fā)揮了天璣 9300和8300芯片的獨(dú)立AI處理器APU,在硬件加速引擎的加持下,可以在終端側(cè)生成文章和摘要。 聯(lián)發(fā)科還重點(diǎn)展出了支持SDXL Turbo(Stable Diffusion
    的頭像 發(fā)表于 02-27 13:46 ?458次閱讀
    聯(lián)發(fā)科天璣又領(lǐng)先<b class='flag-5'>一</b>步!強(qiáng)悍AI手機(jī)芯片就看天璣!

    OpenAI視頻模型Sora的架構(gòu)及應(yīng)用場(chǎng)景

    LDM 就是 Stable Diffusion 使用的模型架構(gòu)。擴(kuò)散模型的大問(wèn)題是計(jì)算需求大,難以擬合高分辨率圖像。為了解決這問(wèn)題,實(shí)現(xiàn)
    發(fā)表于 02-20 15:13 ?591次閱讀
    OpenAI視頻模型Sora的架構(gòu)及應(yīng)用場(chǎng)景

    Stability AI試圖通過(guò)新的圖像生成人工智能模型保持領(lǐng)先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領(lǐng)先的前身Stable Diffusion更快、更強(qiáng)大,而
    的頭像 發(fā)表于 02-19 16:03 ?872次閱讀
    Stability AI試圖通過(guò)新的<b class='flag-5'>圖像</b><b class='flag-5'>生成</b>人工智能模型保持領(lǐng)先地位

    谷歌推出圖像生成新工具ImageFX,提升圖像質(zhì)量

    作為實(shí)驗(yàn)室的新興工具,ImageFX 允許用戶借助簡(jiǎn)潔的文字指令來(lái)創(chuàng)作圖像。經(jīng)過(guò)前期試驗(yàn),該團(tuán)隊(duì)認(rèn)為對(duì)生成型人工智能工具來(lái)說(shuō)最關(guān)鍵的是如何啟發(fā)并鼓勵(lì)用戶挖掘和實(shí)踐創(chuàng)意想法。
    的頭像 發(fā)表于 02-02 14:18 ?597次閱讀

    種新的分割模型Stable-SAM

    SAM、HQ-SAM、Stable-SAM在提供次優(yōu)提示時(shí)的性能比較,Stable-SAM明顯優(yōu)于其他算法。這里也推薦工坊推出的新課程《如何將深度學(xué)習(xí)模型部署到實(shí)際工程中?
    的頭像 發(fā)表于 12-29 14:35 ?607次閱讀
    <b class='flag-5'>一</b>種新的分割模型<b class='flag-5'>Stable</b>-SAM

    免費(fèi)開(kāi)源圖像修復(fù)工具lama-cleaner介紹

    Lama Cleaner 是由 SOTA AI 模型提供支持的免費(fèi)開(kāi)源圖像修復(fù)工具??梢詮膱D片中移除任何不需要的物體、缺陷和人,或者擦除并替換(powered by stable diffusion)圖片上的任何東西。
    的頭像 發(fā)表于 12-04 10:23 ?2655次閱讀
    免費(fèi)開(kāi)源<b class='flag-5'>圖像</b>修復(fù)工具lama-cleaner介紹

    文生圖大型實(shí)踐:揭秘百度搜索AIGC繪畫工具的背后故事!

    AIGC 從去年 9 月到現(xiàn)在,我們能看到各種各樣的模型和公司不斷涌現(xiàn)。從最初大家使用 Stable Diffusion 來(lái)生成簡(jiǎn)單的圖像,到后來(lái)用
    的頭像 發(fā)表于 11-21 16:04 ?694次閱讀
    文生圖大型實(shí)踐:揭秘百度搜索AIGC繪畫工具的背后故事!