0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Dolly 2.0發(fā)布,首個真正開放、可商用的指令調(diào)優(yōu)LLM

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2023-04-14 09:33 ? 次閱讀

Databricks 發(fā)布了 Dolly 2.0,這是該公司于兩周前發(fā)布的一種訓(xùn)練成本不到 30 美元,類似 ChatGPT 的大型語言模型 (LLM) Dolly 的改進(jìn)版本。公告稱,Dolly 2.0 是第一個開源的指令跟隨型語言模型,它在人類生成的指令數(shù)據(jù)集上進(jìn)行了微調(diào),可用于研究和商業(yè)用途。

根據(jù)介紹,Dolly 1.0 使用了斯坦福大學(xué) Alpaca 團(tuán)隊(duì)使用 OpenAI API 創(chuàng)建的數(shù)據(jù)集進(jìn)行訓(xùn)練;該數(shù)據(jù)集包含 ChatGPT 的輸出,而其服務(wù)條款試圖阻止任何人創(chuàng)建與 OpenAI 競爭的模型。因此,Dolly 1.0 并不能用于商業(yè)用途。且據(jù)已知信息,目前所有現(xiàn)有的知名指令跟隨模型 (Alpaca, Koala, GPT4All, Vicuna) 都受到此限制,禁止商業(yè)使用。為了解決這個難題,Databricks 于是決定創(chuàng)建一個沒有商業(yè)用途限制的新數(shù)據(jù)集。

977c4384-d9e7-11ed-bfe3-dac502259ad0.png

Dolly 2.0 是一個基于 EleutherAI pythia 模型系列的 12B 參數(shù)語言模型,并在透明且免費(fèi)提供的數(shù)據(jù)集上進(jìn)行了微調(diào);該數(shù)據(jù)集稱為 databricks-dolly-15k,也已開源發(fā)布。Databricks 表示,他們正在開源整個 Dolly 2.0,包括訓(xùn)練代碼、數(shù)據(jù)集和模型權(quán)重,所有這些都適合商業(yè)使用。這意味著任何組織都可以創(chuàng)建、擁有和定制強(qiáng)大的 LLM,這些 LLM 可以與人們交談,而無需支付 API 訪問費(fèi)用或與第三方共享數(shù)據(jù)。

databricks-dolly-15k 包含來自數(shù)千名 Databricks 員工的 15,000 個高質(zhì)量的人工生成的提示 / 響應(yīng)對,專為指令調(diào)優(yōu)大型語言模型而設(shè)計(jì)。且 databricks-dolly-15k 根據(jù)(Creative Commons Attribution-ShareAlike 3.0 Unported License)的許可條款,任何人都可以出于任何目的使用、修改或擴(kuò)展此數(shù)據(jù)集,包括商業(yè)應(yīng)用程序。

Databricks 稱這是 “第一個開源的、人工生成的指令語料庫,專門設(shè)計(jì)用于讓大型語言能夠展示 ChatGPT 的神奇交互性”。并補(bǔ)充到,雖然 databricks-dolly-15k 比訓(xùn)練 Dolly 1.0 的數(shù)據(jù)集 Alpaca 小得多,但基于 EleutherAI 的 pythia-12b 生成的 Dolly 2.0 模型表現(xiàn)出高質(zhì)量的指令遵循行為。另一方面, databricks-dolly-15k 是由專業(yè)人士生成的、質(zhì)量很高,并且包含對大多數(shù)任務(wù)的長篇答案。

Databricks 表示,他們并沒有期望 Dolly 在有效性方面達(dá)到最先進(jìn)水平。但確實(shí)希望 Dolly 和開源數(shù)據(jù)集將成為大量后續(xù)工作的種子,“這可能有助于引導(dǎo)出更強(qiáng)大的語言模型”。

“我們還認(rèn)為,偏見、問責(zé)制和人工智能安全等重要問題應(yīng)該由不同利益相關(guān)者組成的廣泛社區(qū)來解決,而不僅僅是少數(shù)大公司。開源數(shù)據(jù)集和模型鼓勵評論、研究和創(chuàng)新,這將有助于確保每個人都能從人工智能技術(shù)的進(jìn)步中受益?!?/p>

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46061

    瀏覽量

    235060
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    487

    瀏覽量

    10201
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1197

    瀏覽量

    24538
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    247

    瀏覽量

    279

原文標(biāo)題:Dolly 2.0發(fā)布,首個真正開放、可商用的指令調(diào)優(yōu)LLM

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    MMC SW調(diào)優(yōu)算法

    電子發(fā)燒友網(wǎng)站提供《MMC SW調(diào)優(yōu)算法.pdf》資料免費(fèi)下載
    發(fā)表于 09-20 11:14 ?0次下載
    MMC SW<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>算法

    TAS58xx系列通用調(diào)優(yōu)指南

    電子發(fā)燒友網(wǎng)站提供《TAS58xx系列通用調(diào)優(yōu)指南.pdf》資料免費(fèi)下載
    發(fā)表于 09-14 10:49 ?0次下載
    TAS58xx系列通用<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>指南

    AM6xA ISP調(diào)優(yōu)指南

    電子發(fā)燒友網(wǎng)站提供《AM6xA ISP調(diào)優(yōu)指南.pdf》資料免費(fèi)下載
    發(fā)表于 09-07 09:52 ?0次下載
    AM6xA ISP<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>指南

    OSPI控制器PHY調(diào)優(yōu)算法

    電子發(fā)燒友網(wǎng)站提供《OSPI控制器PHY調(diào)優(yōu)算法.pdf》資料免費(fèi)下載
    發(fā)表于 08-30 11:12 ?0次下載
    OSPI控制器PHY<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>算法

    OpenAI新研究:指令層次結(jié)構(gòu)防御LLM攻擊策略

    為了解決這個問題,這篇研究提出了一種指令層次結(jié)構(gòu)(instruction hierarchy)。它明確定義了不同指令的優(yōu)先級,以及當(dāng)不同優(yōu)先級的指令發(fā)生沖突時,LLM應(yīng)該如何表現(xiàn)。
    發(fā)表于 04-28 10:41 ?207次閱讀
    OpenAI新研究:<b class='flag-5'>指令</b>層次結(jié)構(gòu)防御<b class='flag-5'>LLM</b>攻擊策略

    深度解析JVM調(diào)優(yōu)實(shí)踐應(yīng)用

    Tomcat自身的調(diào)優(yōu)是針對conf/server.xml中的幾個參數(shù)的調(diào)優(yōu)設(shè)置。首先是對這幾個參數(shù)的含義要有深刻而清楚的理解。
    的頭像 發(fā)表于 04-01 10:24 ?342次閱讀
    深度解析JVM<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>實(shí)踐應(yīng)用

    鴻蒙開發(fā)實(shí)戰(zhàn):【性能調(diào)優(yōu)組件】

    性能調(diào)優(yōu)組件包含系統(tǒng)和應(yīng)用調(diào)優(yōu)框架,旨在為開發(fā)者提供一套性能調(diào)優(yōu)平臺,可以用來分析內(nèi)存、性能等問
    的頭像 發(fā)表于 03-13 15:12 ?307次閱讀
    鴻蒙開發(fā)實(shí)戰(zhàn):【性能<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>組件】

    QE for Motor V1.3.0發(fā)布說明

    電子發(fā)燒友網(wǎng)站提供《QE for Motor V1.3.0發(fā)布說明.pdf》資料免費(fèi)下載
    發(fā)表于 02-19 09:35 ?0次下載
    QE for Motor V1.3.0<b class='flag-5'>發(fā)布</b>說明

    e2 studio 2024-01發(fā)布說明

    電子發(fā)燒友網(wǎng)站提供《e2 studio 2024-01發(fā)布說明.pdf》資料免費(fèi)下載
    發(fā)表于 01-30 09:47 ?1次下載
    e2 studio 2024-01<b class='flag-5'>發(fā)布</b>說明

    優(yōu)于10倍參數(shù)模型!微軟發(fā)布Orca 2 LLM

    微軟發(fā)布 Orca 2 LLM,這是 Llama 2 的一個調(diào)優(yōu)版本,性能與包含 10 倍參數(shù)的模型相當(dāng),甚至更好。
    的頭像 發(fā)表于 12-26 14:23 ?518次閱讀

    jvm調(diào)優(yōu)工具有哪些

    JVM調(diào)優(yōu)是提高Java應(yīng)用程序性能的重要手段,而JVM調(diào)優(yōu)工具則是輔助開發(fā)人員進(jìn)行調(diào)優(yōu)工作的利
    的頭像 發(fā)表于 12-05 11:44 ?920次閱讀

    jvm調(diào)優(yōu)主要是調(diào)哪里

    JVM調(diào)優(yōu)主要涉及內(nèi)存管理、垃圾回收、線程管理與鎖優(yōu)化等方面。下面將詳細(xì)介紹每個方面的調(diào)優(yōu)技術(shù)和策略以及如何進(jìn)行優(yōu)化。 內(nèi)存管理 JVM的內(nèi)存管理主要包括堆內(nèi)存、棧內(nèi)存和非堆內(nèi)存。堆內(nèi)
    的頭像 發(fā)表于 12-05 11:37 ?1322次閱讀

    jvm調(diào)優(yōu)參數(shù)

    JVM(Java虛擬機(jī))是Java程序的運(yùn)行環(huán)境,它負(fù)責(zé)解釋Java字節(jié)碼并執(zhí)行相應(yīng)的指令。為了提高應(yīng)用程序的性能和穩(wěn)定性,我們可以調(diào)優(yōu)JVM的參數(shù)。 JVM調(diào)
    的頭像 發(fā)表于 12-05 11:29 ?520次閱讀

    什么場景需要jvm調(diào)優(yōu)

    JVM調(diào)優(yōu)是指對Java虛擬機(jī)進(jìn)行性能優(yōu)化和資源管理,以提高應(yīng)用程序的運(yùn)行效率和吞吐量。JVM調(diào)優(yōu)的場景有很多,下面將詳細(xì)介紹各種不同的場景。 高并發(fā)場景:在高并發(fā)場景下,系統(tǒng)需要處理
    的頭像 發(fā)表于 12-05 11:14 ?1084次閱讀

    javajvm調(diào)優(yōu)有幾種方法

    JVM調(diào)優(yōu)是Java應(yīng)用程序性能優(yōu)化過程中的重要步驟,它通過針對JVM進(jìn)行優(yōu)化來提高應(yīng)用程序的性能和可靠性。JVM調(diào)優(yōu)可以根據(jù)具體的場景和需求,采用不同的方法和策略進(jìn)行。 首先,我們需
    的頭像 發(fā)表于 12-05 11:11 ?1847次閱讀