以下文章來源于谷歌云服務(wù),作者 Google Cloud
Warren Barkley
我們很高興宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,這包括全新的 405B,即 Meta 迄今為止功能最強(qiáng)大、用途最廣泛的模型。這些模型的添加,表明 Google Cloud 一如既往地踐行打造開放、靈活的 AI 生態(tài)系統(tǒng)的承諾,幫助您構(gòu)建最能滿足您需求的解決方案。
Vertex AI 提供一系列精選的第一方、開源和第三方模型,其中許多模型 (包括全新的 Llama 模型) 都能以全托管式模型即服務(wù) (MaaS) 產(chǎn)品的形式提供。借助 MaaS,您可以選擇符合自己需求的基礎(chǔ)模型,通過 API 輕松訪問它,使用強(qiáng)大的開發(fā)工具進(jìn)行定制,并在我們的全托管基礎(chǔ)設(shè)施上進(jìn)行部署,而無需繁瑣的基礎(chǔ)設(shè)施管理。
Meta 的 Llama 3.1 標(biāo)志著開放權(quán)重模型發(fā)生范式轉(zhuǎn)變,與同類模型相比,它們擁有更為卓越的性能和廣泛的用途。此次發(fā)布包含一系列針對不同應(yīng)用場景定制的模型:
Llama 3.1 405B
Llama 3.1 405B 是迄今為止最大的公開可用的基礎(chǔ)模型,在靈活性、控制力和創(chuàng)新方面為開放模型樹立了新標(biāo)桿。該模型開創(chuàng)了各種新的可能性,包括生成合成數(shù)據(jù),為復(fù)雜的推理任務(wù)提供支持,以及通過極少的微調(diào)輕松處理直接推理場景。
Llama 3.1 8B 和 70B
Llama 3 模型的這兩個新版本在理解語言細(xì)微差別、把握上下文以及執(zhí)行翻譯和對話生成等復(fù)雜任務(wù)方面表現(xiàn)出色。
只需點(diǎn)擊幾下,即可使用以模型即服務(wù)形式提供的全新預(yù)覽版 405B 模型,沒有任何設(shè)置或基礎(chǔ)設(shè)施方面的煩擾。正式版將在未來幾周內(nèi)推出。8B 和 70B 模型也將在未來幾周內(nèi)以 MaaS 的形式提供。從現(xiàn)在開始,您可以在 Vertex AI Model Garden 中自助使用這三種模型,從而靈活地選擇您偏好的基礎(chǔ)設(shè)施。
這些模型是預(yù)訓(xùn)練和指令調(diào)優(yōu)版本,可滿足您的特定需求,它們包含長度為 128,000 個詞元 (token) 的擴(kuò)展上下文,與較早的幾代模型相比,能更深入地理解更長、更復(fù)雜的文本。此外,Llama 3.1 模型支持多達(dá)八種語言,進(jìn)一步擴(kuò)大了其覆蓋面和適用性。
在 Google Cloud 中使用 Llama 3.1
Google Cloud 的 Vertex AI 是一個全面的 AI 平臺,可用于試驗(yàn)、自定義、部署和監(jiān)控 Llama 3.1 等基礎(chǔ)模型。Llama 3.1 加入了 Vertex AI Model Garden 上已有的 150 多個精選企業(yè)級模型,為您提供更大的選擇范圍和靈活性,使您可以根據(jù)自己的需求和預(yù)算選擇最合適的模型,跟上飛躍式創(chuàng)新的步伐。
在 Vertex AI 上使用 Llama 3.1,您可以:
信心十足地進(jìn)行實(shí)驗(yàn)
在我們的直觀環(huán)境中,通過簡單的 API 調(diào)用和全面的橫向評估來探索 Llama 3.1 的功能,而無需擔(dān)心復(fù)雜的部署流程。
根據(jù)您的確切需求定制 Llama 3.1
使用自己的數(shù)據(jù)微調(diào)模型,構(gòu)建可滿足您獨(dú)特需求的定制解決方案。如果您在 Vertex AI Model Garden 中通過自助服務(wù)使用 8B 和 70B 模型,可以立即開始微調(diào)。微調(diào) 405B 模型的功能將在未來幾周內(nèi)推出。
讓您的 AI 基于事實(shí)
使用 Vertex AI 的多種接地和 RAG 選項(xiàng),確保您的 AI 輸出可靠、相關(guān)且值得信賴。例如,您可以將模型連接到企業(yè)系統(tǒng),使用 Vertex AI Search 檢索企業(yè)信息,利用 Llama3 進(jìn)行生成等等。
創(chuàng)建 agent
使用 Vertex AI 的全套工具,包括 Vertex AI 上的 LangChain,創(chuàng)建和編排由 Llama 3.1 提供支持的 agent。通過 Genkit 的 Vertex AI 插件將 Llama 3.1 集成到您的 AI 體驗(yàn)中。
無開銷部署
支持靈活的自動擴(kuò)縮,即使是 405B 模型,也能消除部署和擴(kuò)縮的復(fù)雜性。當(dāng)然,您還可以利用專為 AI 工作負(fù)載打造的一流基礎(chǔ)設(shè)施。
為 Llama 3.1 提供安全的工作環(huán)境
不僅支持 Meta 的 Llama Guard,還有 Google Cloud 的內(nèi)置安全、隱私和合規(guī)措施,讓您可以放心部署。
開始在 Google Cloud 上使用 Llama 3.1
隨著 AI 模型的不斷創(chuàng)新,企業(yè) AI 生態(tài)系統(tǒng)變得更加多樣化。我們與 Meta 的合作,證明兩家公司致力于提供由開放且易于使用的 AI 生態(tài)系統(tǒng)支持下的一流創(chuàng)新成果。我們將繼續(xù)與 Meta 和其他合作伙伴密切合作,讓我們的客戶始終能夠享用到前沿的 AI 功能。
-
Google
+關(guān)注
關(guān)注
5文章
1754瀏覽量
57374 -
谷歌
+關(guān)注
關(guān)注
27文章
6128瀏覽量
104946 -
Meta
+關(guān)注
關(guān)注
0文章
258瀏覽量
11330 -
Cloud
+關(guān)注
關(guān)注
0文章
67瀏覽量
5328
原文標(biāo)題:Meta 發(fā)布的 Llama 3.1 現(xiàn)在可在 Google Cloud 上使用
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論