0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何為Orca-2-13B創(chuàng)建一個與OpenAI兼容的API服務(wù)呢?

jf_wN0SrCdH ? 來源:Second State ? 2023-11-27 10:46 ? 次閱讀

Orca-2-13B[1] 是微軟最新發(fā)布的 Orca 2 系列中的一款模型,Orca 2 另外還提供 7B 版本。Orca 2系列模型是由 LLAMA 2 基礎(chǔ)模型中微調(diào)而來。Orca 2系列模型擅長推理、文本總結(jié)、數(shù)學(xué)問題解決和理解任務(wù),是在原始 13B Orca 模型的基礎(chǔ)上進一步發(fā)展而來,模仿更強大的 AI 系統(tǒng)推理過程從而提高小型模型在復(fù)雜任務(wù)中的能力。

本文將以 Orca-2-13B 為例,將介紹:

如何在你自己的設(shè)備上運行 Orca-2-13B

如何為 Orca-2-13B 創(chuàng)建一個與 OpenAI 兼容的 API 服務(wù)

你也可以使用同樣的方式運行 Orca-2-7B 模型,只需要替換 Orca-2-7B模型的 GGUF 格式的下載鏈接。

我們將用 Rust + Wasm 技術(shù)棧來開發(fā)和部署這個模型的應(yīng)用程序。無需安裝復(fù)雜的 Python 包或 C++ 工具鏈!了解我們?yōu)槭裁催x擇 Rust+Wasm 技術(shù)棧[2]。

在自己的設(shè)備上運行 Orca-2-13B

步驟 1:通過以下命令行安裝 WasmEdge[3]。

curl-sSfhttps://raw.githubusercontent.com/WasmEdge/WasmEdge/master/utils/install.sh|bash-s----pluginwasi_nn-ggml

步驟 2:下載模型 GGUF 文件[4]。由于模型文件有幾 GB,所以可能需要很長時間。

curl-LOhttps://huggingface.co/second-state/Orca-2-13B-GGUF/resolve/main/Orca-2-13b-ggml-model-q4_0.gguf

步驟 3:下載一個跨平臺的可移植 Wasm 文件,用于聊天應(yīng)用。該應(yīng)用能讓你用命令行與模型進行交流。戳這里[5]查看該應(yīng)用的 Rust 源代碼。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/chat/llama-chat.wasm

就這樣。接下來,可以通過輸入以下命令在終端與模型進行聊天。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13b-ggml-model-q4_0.ggufllama-chat.wasm-pchatml-s'YouareOrca,anAIlanguagemodelcreatedbyMicrosoft.Youareacautiousassistant.Youcarefullyfollowinstructions.Youarehelpfulandharmlessandyoufollowethicalguidelinesandpromotepositivebehavior.'--stream-stdout

這個可移植的 Wasm 應(yīng)用會自動利用你設(shè)備上的硬件加速器(如 GPU)。

在我的 Mac M1 32G 內(nèi)存設(shè)備上,它的速度約為每秒 9.15 個token。

[USER]:What isanOrca?

[ASSISTANT]:
Anorca,orkillerwhale,isalargetoothedpredatorbelongingtotheoceanicdolphinfamily.Theyarehighlyintelligentandsocialanimals,knownfortheircuriosityandplayfulness.

[USER]:

為 Orca-2-13B 創(chuàng)建一個與 OpenAI 兼容的 API 服務(wù)

一個與 OpenAI 兼容的網(wǎng)絡(luò) API 能讓 Orca-2-13B 與大量的 LLM 工具和代理框架(如 flows.network、LangChain 和 LlamaIndex)一起工作。

首先,先下載一個 API 服務(wù)器應(yīng)用。它也是一個可以在許多 CPU 和 GPU 設(shè)備上運行的跨平臺可移植 Wasm 應(yīng)用。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/api-server/llama-api-server.wasm

然后,使用以下命令行啟動模型的 API 服務(wù)器。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13B.Q5_K_M.ggufllama-api-server.wasm-pchatml

從另一個終端,你可以使用 curl 與 API 服務(wù)器進行交互。

curl-XPOSThttp://0.0.0.0:8080/v1/chat/completions-H'accept:application/json'-H'Content-Type:application/json'-d'{"messages":[{"role":"system","content":"YouareahelpfulAIassistant"},{"role":"user","content":"WhatisthecapitalofFrance?"}],"model":"Orca-2-13B"}'

就這樣。WasmEdge 是運行 Orca-2-13B 大模型應(yīng)用程序最簡單、最快、最安全的方式[6]。試試看吧!





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • C++語言
    +關(guān)注

    關(guān)注

    0

    文章

    147

    瀏覽量

    6951
  • python
    +關(guān)注

    關(guān)注

    55

    文章

    4768

    瀏覽量

    84376
  • 硬件加速器
    +關(guān)注

    關(guān)注

    0

    文章

    41

    瀏覽量

    12749
  • Rust
    +關(guān)注

    關(guān)注

    1

    文章

    228

    瀏覽量

    6542
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1034

    瀏覽量

    6378

原文標題:跨設(shè)備運行微軟最新大語言模型 Orca-2-13B,只需4個命令行

文章出處:【微信號:Rust語言中文社區(qū),微信公眾號:Rust語言中文社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    OpenAI斷供API,國產(chǎn)大模型替代方案低成本遷移

    訪問API服務(wù)的國家和地區(qū)列表中總計188國家和地區(qū),不包括中國內(nèi)地與中國香港。 ? 這意味著,OpenAI宣布終止對中國開發(fā)者提供API
    的頭像 發(fā)表于 06-27 09:04 ?3302次閱讀

    ChatGPT服務(wù)中斷,OpenAI正積極恢復(fù)

    近日,據(jù)OpenAI官方報道,他們發(fā)現(xiàn)ChatGPT服務(wù)出現(xiàn)了用戶暫時無法接入的問題。這突發(fā)狀況引發(fā)了廣泛關(guān)注,許多用戶紛紛表達了對服務(wù)中斷的不滿和擔憂。 面對這
    的頭像 發(fā)表于 11-11 13:38 ?79次閱讀

    微軟終止中國大陸人Azure OpenAI服務(wù),為國內(nèi)大模型帶來機遇

    2024年10月17日,微軟公司宣布將在中國大陸地區(qū)停止面向個人用戶的Azure OpenAI服務(wù)。這決定緊隨OpenAI于2024年7月宣布終止對中國大陸提供
    的頭像 發(fā)表于 10-28 14:17 ?470次閱讀

    華納云:使用 WireMock 在開發(fā)和測試中模擬 API 服務(wù)

    是 WireMock 發(fā)揮作用的地方。 WireMock 是開源工具,可以幫助開發(fā)人員創(chuàng)建模擬真實 API 行為的模擬服務(wù)器,為開發(fā)和測
    的頭像 發(fā)表于 10-25 16:46 ?224次閱讀

    怎樣搭建基于 ChatGPT 的聊天系統(tǒng)

    搭建基于ChatGPT的聊天系統(tǒng)是涉及多個步驟的過程,包括理解ChatGPT的API、設(shè)計用戶界面、處理數(shù)據(jù)和集成ChatGPT模型
    的頭像 發(fā)表于 10-25 16:23 ?375次閱讀

    esp32上使用chatGPT做些有意思的事情

    ChatGPT獲得響應(yīng),我們需要進行以下步驟:1、在OpenAI網(wǎng)站上注冊,并在ESP32上安裝必要的庫。 2、在OpenAI API創(chuàng)建
    的頭像 發(fā)表于 10-18 10:04 ?200次閱讀

    OpenAI api key獲取并可調(diào)用GPT-4.0、GPT-4o、GPT-4omini

    OpenAI賬戶 驗證電子郵件 申請API訪問 獲取API Key 配置和使用API Key 1. 注冊OpenAI賬戶 首先,你需要
    的頭像 發(fā)表于 08-06 15:16 ?2346次閱讀
    <b class='flag-5'>OpenAI</b> <b class='flag-5'>api</b> key獲取并可調(diào)用GPT-4.0、GPT-4o、GPT-4omini

    如何使用espconn api實現(xiàn)Web服務(wù)器?

    我正在嘗試使用 espconn api 實現(xiàn) Web 服務(wù)器。 在些請求之后,我收到將此錯誤(err1,超過最大時間值)寫入 uar
    發(fā)表于 07-18 07:46

    OpenAI將終止對中國提供API服務(wù)

    近日,人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI通過官方渠道向全球用戶發(fā)布了則重要通知,引起了業(yè)界的廣泛關(guān)注。自6月24日晚間起,不少中國用戶收到了來自OpenAI的郵件,郵件內(nèi)容明確指出了其服務(wù)
    的頭像 發(fā)表于 06-26 18:18 ?915次閱讀

    OpenAI發(fā)出警告信:多國開發(fā)者面臨API封鎖 OpenAI API解決方案

    事件背景 2024年7月9日,OpenAI宣布將封鎖對不支持國家的API訪問,許多開發(fā)者因此收到了警告信。這決定引起了廣泛的關(guān)注和討論,尤其是在那些受影響的國家和地區(qū)。 警告信的內(nèi)容 Ope
    的頭像 發(fā)表于 06-26 11:29 ?1067次閱讀
    <b class='flag-5'>OpenAI</b>發(fā)出警告信:多國開發(fā)者面臨<b class='flag-5'>API</b>封鎖 <b class='flag-5'>OpenAI</b> <b class='flag-5'>API</b>解決方案

    OpenAI API Key獲?。洪_發(fā)人員申請GPT-4 API Key教程

    ? OpenAI的GPT-4模型因其卓越的自然語言理解和生成能力,成為了許多開發(fā)者的首選工具。獲取GPT-4 API Key并將其應(yīng)用于項目,如開發(fā)ChatGPT聊天應(yīng)用,不僅是實
    的頭像 發(fā)表于 06-24 17:40 ?1956次閱讀
    <b class='flag-5'>OpenAI</b> <b class='flag-5'>API</b> Key獲取:開發(fā)人員申請GPT-4 <b class='flag-5'>API</b> Key教程

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    當?shù)貢r間5月13OpenAI推出ChatGPT-4o,代表了人工智能向前邁出的大步。在GPT-4turbo的強大基礎(chǔ)上,這種迭代擁有顯著的改進。在發(fā)布會的演示中,OpenAI展示
    發(fā)表于 05-27 15:43

    OpenAI API Key獲取與充值教程:助開發(fā)者解鎖GPT-4.0 API

    OpenAIAPI Key,以及如何使用這個 Key 來調(diào)用 GPT-4.0 API。 第步:獲取 OpenAI
    的頭像 發(fā)表于 04-28 16:35 ?9734次閱讀
    <b class='flag-5'>OpenAI</b> <b class='flag-5'>API</b> Key獲取與充值教程:助開發(fā)者解鎖GPT-4.0 <b class='flag-5'>API</b>

    優(yōu)于10倍參數(shù)模型!微軟發(fā)布Orca 2 LLM

    微軟發(fā)布 Orca 2 LLM,這是 Llama 2調(diào)優(yōu)版本,性能與包含 10 倍參數(shù)的模型相當,甚至更好。
    的頭像 發(fā)表于 12-26 14:23 ?584次閱讀

    如何從簡單的數(shù)學(xué)表達式創(chuàng)建Saber模型?

    如何從簡單的數(shù)學(xué)表達式創(chuàng)建Saber模型,將你的輸出描述為輸入的函數(shù)?例如 out=a*in*in+
    的頭像 發(fā)表于 12-05 13:42 ?671次閱讀
    如何從<b class='flag-5'>一</b><b class='flag-5'>個</b>簡單的數(shù)學(xué)表達式<b class='flag-5'>創(chuàng)建</b><b class='flag-5'>一</b><b class='flag-5'>個</b>Saber模型?