国产GaysexChina男同,免费在线观看a国产种片

【新智元導(dǎo)讀】剛剛，我們經(jīng)歷了LLM劃時(shí)代的一夜。Gemini Ultra發(fā)布還沒幾天，Gemini 1.5就來了。卯足勁和OpenAI微軟一較高下的谷歌，開始進(jìn)入了高產(chǎn)模式。

自家最強(qiáng)的Gemini 1.0 Ultra才發(fā)布沒幾天，谷歌又放大招了。

就在剛剛，谷歌DeepMind首席科學(xué)家Jeff Dean，以及聯(lián)創(chuàng)兼CEO的Demis Hassabis激動(dòng)地宣布了最新一代多模態(tài)大模型——Gemini 1.5系列的誕生。

其中，最高可支持10,000K token超長(zhǎng)上下文的Gemini 1.5 Pro，也是谷歌最強(qiáng)的MoE大模型。

不難想象，在百萬級(jí)token上下文的加持下，我們可以更加輕易地與數(shù)十萬字的超長(zhǎng)文檔、擁有數(shù)百個(gè)文件的數(shù)十萬行代碼庫、一部完整的電影等等進(jìn)行交互。

同時(shí)，為了介紹這款劃時(shí)代的模型，谷歌還發(fā)布了達(dá)58頁的技術(shù)報(bào)告。

毫不夸張地說，大語言模型領(lǐng)域從此將進(jìn)入一個(gè)全新的時(shí)代！

1,000,000 token超超超長(zhǎng)上下文，全面碾壓GPT-4 Turbo

在上下文窗口方面，此前的SOTA模型已經(jīng)「卷」到了200K token（20萬）。

如今，谷歌成功將這個(gè)數(shù)字大幅提升——能夠穩(wěn)定處理高達(dá)100萬token（極限為1000萬token），創(chuàng)下了最長(zhǎng)上下文窗口的紀(jì)錄。

1000萬token極限海底撈針幾乎全綠

首先，我們看看Gemini 1.5 Pro在多模態(tài)海底撈針測(cè)試中的成績(jī)。

對(duì)于文本處理，Gemini 1.5 Pro在處理高達(dá)530,000 token的文本時(shí)，能夠?qū)崿F(xiàn)100%的檢索完整性，在處理1,000,000 token的文本時(shí)達(dá)到99.7%的檢索完整性。

甚至在處理高達(dá)10,000,000 token的文本時(shí)，檢索準(zhǔn)確性仍然高達(dá)99.2%。

在音頻處理方面，Gemini 1.5 Pro能夠在大約11小時(shí)的音頻資料中，100%成功檢索到各種隱藏的音頻片段。

在視頻處理方面，Gemini 1.5 Pro能夠在大約3小時(shí)的視頻內(nèi)容中，100%成功檢索到各種隱藏的視覺元素。

此外，谷歌研究人員還開發(fā)了一個(gè)更通用的版本的「大海撈針」測(cè)試。

在這個(gè)測(cè)試中，模型需要在一定的文本范圍內(nèi)檢索到100個(gè)不同的特定信息片段。

在這個(gè)測(cè)試中，Gemini 1.5 Pro在較短的文本長(zhǎng)度上的性能超過了GPT-4-Turbo，并且在整個(gè)100萬token的范圍內(nèi)保持了相對(duì)穩(wěn)定的表現(xiàn)。

與之對(duì)比鮮明的是，GPT-4 Turbo的性能則飛速下降，且無法處理超過128,000 token的文本，表現(xiàn)慘烈。

大模型視野，被「史詩級(jí)」拓寬

LLM發(fā)展到這個(gè)階段，模型的上下文窗口已經(jīng)成為了關(guān)鍵的掣肘。

模型的上下文窗口由許多token組成，它們是處理單詞、圖像、視頻、音頻、代碼這些信息的基礎(chǔ)構(gòu)建。

模型的上下文窗口越大，它處理給定提示時(shí)能夠接納的信息就越多——這就使得它的輸出更加連貫、相關(guān)和實(shí)用。

而這次，谷歌通過一系列機(jī)器學(xué)習(xí)的創(chuàng)新，大幅提升了1.5 Pro的上下文窗口容量，從Gemini 1.0的原始32,000 token，直接提升到了驚人的1,000,000 token。

這就意味著，1.5 Pro能夠一次性處理海量信息——比如1小時(shí)的視頻、11小時(shí)的音頻、超過30,000行的代碼庫，或是超過700,000個(gè)單詞。

甚至，谷歌曾經(jīng)一度成功測(cè)試了高達(dá)10,000,000的token。

深入理解海量信息

脫胎換骨的Gemini 1.5 Pro，已經(jīng)可以輕松地分析給定提示中的海量?jī)?nèi)容！

它能夠洞察文檔中的對(duì)話、事件和細(xì)節(jié)，展現(xiàn)出對(duì)復(fù)雜信息的深刻理解。

我們甩給它一份阿波羅11號(hào)任務(wù)到月球的402頁飛行記錄，它對(duì)于多復(fù)雜的信息，都能表現(xiàn)出深刻的理解。

讓它從文件中列舉出3個(gè)喜劇性的時(shí)刻，接下來，就是見證奇跡的時(shí)刻——

才過了30秒出頭，答案就已經(jīng)生成了！

接下來，看看它的多模態(tài)功能。

把這張圖輸入進(jìn)去，問它：這是什么時(shí)刻？

它會(huì)回答，這是阿姆斯特朗邁上月球的一小步，也是人類的一大步。

這次，谷歌還新增了一個(gè)功能，允許開發(fā)者上傳多個(gè)文件（比如PDF），并提出問題。

更大的上下文窗口，就讓模型能夠處理更多信息，從而讓輸出結(jié)果更加一致、相關(guān)且實(shí)用。

橫跨各種不同媒介

與此同時(shí)，Gemini 1.5 Pro還能夠在視頻中展現(xiàn)出深度的理解和推理能力！

得益于Gemini的多模態(tài)能力，上傳的視頻會(huì)被拆分成數(shù)千個(gè)畫面（不包括音頻），以便執(zhí)行復(fù)雜的推理和問題解決任務(wù)。

比如，輸入這部44分鐘的無聲電影——Buster Keaton主演的經(jīng)典之作《小神探夏洛克》。

模型不僅能夠精準(zhǔn)地捕捉到電影的各個(gè)情節(jié)和發(fā)展，還能洞察到極易被忽略的細(xì)微之處。

我們可以問它：找到一張紙從主角口袋中被拿出的瞬間，然后告訴我關(guān)于這個(gè)細(xì)節(jié)的信息。

令人驚喜的是，模型大約用了60秒左右就準(zhǔn)確地找出，這個(gè)鏡頭是在電影的12:01，還描述出了相關(guān)細(xì)節(jié)。

果然，模型精準(zhǔn)找出了這個(gè)鏡頭的時(shí)間點(diǎn)，所述細(xì)節(jié)也完全準(zhǔn)確！

輸入一張粗略的涂鴉，要求模型找到電影中的對(duì)應(yīng)場(chǎng)景，模型也在一分鐘內(nèi)找到了答案。

高效處理更長(zhǎng)代碼

不僅如此，Gemini 1.5 Pro在處理長(zhǎng)達(dá)超過100,000行的代碼時(shí)，還具備極強(qiáng)的問題解決能力。

面對(duì)如此龐大的代碼量，它不僅能夠深入分析各個(gè)示例，提出實(shí)用的修改建議，還能詳細(xì)解釋代碼的各個(gè)部分是如何協(xié)同工作的。

開發(fā)者可以直接上傳新的代碼庫，利用這個(gè)模型快速熟悉、理解代碼結(jié)構(gòu)。

高效架構(gòu)的秘密：MoE

Gemini 1.5的設(shè)計(jì)，基于的是谷歌在Transformer和混合專家（MoE）架構(gòu)方面的前沿研究。

不同于傳統(tǒng)的作為一個(gè)龐大的神經(jīng)網(wǎng)絡(luò)運(yùn)行的Transformer，MoE模型由眾多小型的「專家」神經(jīng)網(wǎng)絡(luò)組成。

這些模型可以根據(jù)不同的輸入類型，學(xué)會(huì)僅激活最相關(guān)的專家網(wǎng)絡(luò)路徑。

這樣的專門化，就使得模型效率大幅提升。

而谷歌通過Sparsely-Gated MoE、GShard-Transformer、Switch-Transformer、M4研究，早已成為深度學(xué)習(xí)領(lǐng)域中MoE技術(shù)的領(lǐng)航者。

Gemini 1.5的架構(gòu)創(chuàng)新帶來的，不僅僅是更迅速地掌握復(fù)雜任務(wù)、保持高質(zhì)量輸出，在訓(xùn)練和部署上也變得更加高效。

因此，團(tuán)隊(duì)才能以驚人的速度，不斷迭代和推出更先進(jìn)的Gemini版本。

性能比肩Ultra，大幅超越1.0 Pro

在涵蓋文本、代碼、圖像、音頻和視頻的綜合性測(cè)試中，1.5 Pro在87%的基準(zhǔn)測(cè)試上超越了1.0 Pro。

與1.0 Ultra在相同基準(zhǔn)測(cè)試的比較中，1.5 Pro的表現(xiàn)也相差無幾。

Gemini 1.5 Pro在擴(kuò)大上下文窗口后，依然保持了高水平的性能。在「大海撈針(NIAH)」測(cè)試中，它能夠在長(zhǎng)達(dá)100萬token的文本塊中，在99%的情況下，準(zhǔn)確找出隱藏有特定信息的文本片段。

此外，Gemini 1.5 Pro展現(xiàn)了卓越的「上下文學(xué)習(xí)」能力，能夠僅憑長(zhǎng)提示中提供的信息掌握新技能，無需進(jìn)一步細(xì)化調(diào)整。

這一能力在「從一本書學(xué)習(xí)機(jī)器翻譯 (MTOB)」基準(zhǔn)測(cè)試中得到了驗(yàn)證，該測(cè)試檢驗(yàn)了模型學(xué)習(xí)從未接觸過的信息的能力。

對(duì)于一本關(guān)于全球不足200人使用的Kalamang語的語法手冊(cè)，模型能夠?qū)W會(huì)將英語翻譯成Kalamang，學(xué)習(xí)效果與人類學(xué)習(xí)相似。

谷歌的研究者成功地增強(qiáng)了模型處理長(zhǎng)文本的能力，而且這種增強(qiáng)并沒有影響到模型的其他功能。

雖然這項(xiàng)改進(jìn)只用了Gemini 1.0 Ultra模型訓(xùn)練時(shí)間的一小部分，但1.5 Pro模型在31項(xiàng)性能測(cè)試中的17項(xiàng)上超過了1.0 Ultra模型。

與1.0 Pro模型相比，1.5 Pro在31項(xiàng)測(cè)試中的27項(xiàng)上，表現(xiàn)更佳。

具體結(jié)果如下：

細(xì)節(jié)表現(xiàn)如何？

分析和掌握復(fù)雜代碼庫

這款模型能夠迅速吸收大型代碼庫，并解答復(fù)雜的問題，這一點(diǎn)非常引人注目。

例如，three.js是一個(gè)包含約10萬行代碼、示例和文檔等的3D Javascript庫。

借助這個(gè)代碼庫作為背景，系統(tǒng)能夠幫助用戶深入理解代碼，并能夠根據(jù)人們提出的高層次要求來修改復(fù)雜的示例。

比如：「展示一些代碼，用于添加一個(gè)滑塊控制動(dòng)畫速度。采用和其他演示相同的GUI風(fēng)格。」

或者精確地指出需要修改的代碼部分，以改變另一個(gè)示例中生成的地形的高度。

瀏覽龐大而陌生的代碼庫

并且，模型能夠幫我們理解代碼，或定位某個(gè)特定功能的實(shí)現(xiàn)位置。

在這個(gè)例子中，模型能夠處理整個(gè)包含116個(gè)文件的JAX代碼庫（746k token），并協(xié)助用戶找到實(shí)現(xiàn)自動(dòng)微分反向傳播的確切代碼位置。

顯然，在深入了解一個(gè)陌生的代碼庫或日常工作中使用的代碼庫時(shí)，長(zhǎng)上下文處理能力的價(jià)值不言而喻。

許多Gemini團(tuán)隊(duì)成員已經(jīng)發(fā)現(xiàn)，Gemini 1.5 Pro的長(zhǎng)上下文處理功能，對(duì)于Gemini 代碼庫大有裨益。

長(zhǎng)篇復(fù)雜文檔的推理

同時(shí)，模型在分析長(zhǎng)篇、復(fù)雜的文本文檔方面也非常出色，例如雨果的五卷本小說《悲慘世界》（共1382頁，含732,000個(gè)token）。

下面這個(gè)簡(jiǎn)單的實(shí)驗(yàn)，就展示了模型的多模態(tài)能力：粗略地畫出一個(gè)場(chǎng)景，并詢問「請(qǐng)看這幅圖畫中的事件發(fā)生在書的哪一頁？」

模型就能給出準(zhǔn)確的答案——1099頁！

Kalamang語翻譯

報(bào)告中一個(gè)特別引人注目的例子是關(guān)于Kalamang語的翻譯。

卡拉曼語是新幾內(nèi)亞西部、印度尼西亞巴布亞東部不足200人使用的語言，幾乎未在互聯(lián)網(wǎng)上留下足跡。

Gemini Pro 1.5通過上下文學(xué)習(xí)掌握了Kalamang語的知識(shí)，其翻譯質(zhì)量可與使用相同材料學(xué)習(xí)的人相媲美。

在英語到卡拉曼語的翻譯中，Gemini Pro 1.5的ChrF達(dá)到了58.3，大幅超過了以往最好的模型得分45.8 ChrF，并略高于MTOB論文報(bào)告的57.0 ChrF人類基準(zhǔn)。

這一成就無疑帶來了令人激動(dòng)的可能性，提升稀有語言的翻譯質(zhì)量。

Gemini 1.5的誕生，意味著性能的階段飛躍，標(biāo)志著谷歌在研究和工程創(chuàng)新上，又邁出了登月般的一步。

接下來能跟Gemini 1.5硬剛的，大概就是GPT-5了。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6080

瀏覽量
104347
AI

AI

+關(guān)注

關(guān)注
87

文章
28875

瀏覽量
266201

評(píng)論

相關(guān)推薦

谷歌發(fā)布史上最強(qiáng)大模型Gemini，全方位領(lǐng)先GPT-4，MMLU基準(zhǔn)達(dá)人類專家水平

最新多模態(tài)大模型Gemini 1.0版本正式上線。這次發(fā)布是按照谷歌此前的預(yù)期，但是對(duì)于業(yè)界而言非常突然。因?yàn)榫驮谝恢芮斑€有報(bào)告指出，

發(fā)表于 12-08 00:11 ?3292次閱讀

<b class='flag-5'>谷歌</b>發(fā)布史上<b class='flag-5'>最強(qiáng)</b>大模型<b class='flag-5'>Gemini</b>，全方位領(lǐng)先<b class='flag-5'>GPT</b>-4，MMLU基準(zhǔn)達(dá)人類專家水平

谷歌借助Gemini AI系統(tǒng)深化對(duì)機(jī)器人的訓(xùn)練

了如何利用Gemini 1.5 Pro的強(qiáng)化長(zhǎng)上下文窗口功能，極大地優(yōu)化了用戶通過自然語言指令與RT-2機(jī)器人交互的體驗(yàn)。

發(fā)表于 07-12 16:29 ?503次閱讀

OpenAI CEO: GPT-4o and GPT-5引領(lǐng)未來12個(gè)月編程領(lǐng)域，GPT-5更具潛力

據(jù)報(bào)道，OpenAI首席執(zhí)行官阿萊夫·阿爾特曼在接受Redpoint風(fēng)投公司LoganBartlett的專訪中，透露了最近發(fā)布的GPT-40以及即將面世的GPT-5。

發(fā)表于 05-17 16:25 ?441次閱讀

OpenAI有望在年中推出全新GPT-5模型

近日，人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI傳來了令人振奮的消息。據(jù)悉，他們有望在今年的年中，大約是夏季時(shí)分，推出全新的GPT-5模型。這一消息引發(fā)了業(yè)界的廣泛關(guān)注與期待。

發(fā)表于 03-22 11:29 ?657次閱讀

OpenAI預(yù)計(jì)最快今年夏天發(fā)布GPT-5

OpenAI正計(jì)劃在未來數(shù)月內(nèi)，可能是今年夏季，發(fā)布備受矚目的GPT-5模型。據(jù)悉，部分企業(yè)客戶已提前體驗(yàn)了OpenAI最新模型及其ChatGPT工具的改進(jìn)版Demo。一位CEO在體驗(yàn)后贊不絕口：“它真的令人驚艷，相較于之前的版本，GPT-5帶來了實(shí)質(zhì)性的飛躍?！?/div>

發(fā)表于 03-22 10:40 ?640次閱讀

谷歌升級(jí)Bard AI聊天機(jī)器人為Gemini，新增Python代碼編輯功能

　此外，谷歌表示，接下來數(shù)個(gè)月內(nèi)，Gemini Advanced 計(jì)劃會(huì)加入更多新功能，如支持更為詳盡的上下文信息、增強(qiáng)多模態(tài)交互性以及完善編程功能。據(jù)

發(fā)表于 02-20 15:47 ?422次閱讀

谷歌推出新一代大模型Gemini 1.5

近日，谷歌在無預(yù)警的情況下發(fā)布了其下一代大模型——Gemini 1.5，這款模型在性能上實(shí)現(xiàn)了顯著增強(qiáng)，并在長(zhǎng)上下文理解方面取得了令人矚目的突破。更令人驚嘆的是，

發(fā)表于 02-20 13:55 ?713次閱讀

谷歌發(fā)布AI新版本Gemini 1.5

谷歌近日宣布推出其最新的人工智能（AI）版本——Gemini 1.5，這一新版本在文本處理能力上實(shí)現(xiàn)了重大突破。據(jù)了解，Gemini 1.5

發(fā)表于 02-19 11:05 ?928次閱讀

OpenAI一鍵調(diào)用GPTs功能上線

OpenAI近日宣布，其最新功能GPT Mentions現(xiàn)已上線。這一功能為用戶提供了一個(gè)便捷的方式來調(diào)用不同的GPTs（Generative Pre-trained Transformer），并支持不同GPT之間共享

發(fā)表于 02-04 10:05 ?669次閱讀

ISR的上下文保存和恢復(fù)是如何完成的？

函數(shù)：ifxCPU_enableInterrupts ()；如果我讓更高優(yōu)先級(jí)的 ISR 中斷優(yōu)先級(jí)較低的 ISR，那么 ISR 的上下文保存和恢復(fù)是如何完成的？

發(fā)表于 01-22 06:28

成都匯陽投資關(guān)于多模態(tài)驅(qū)動(dòng)應(yīng)用前景廣闊，上游算力迎機(jī)會(huì)!

“Cloud TPU v5p”, 以及來自谷歌云的人工智能超級(jí)計(jì)算機(jī)。本次谷歌推出的多模態(tài)大模型Ge

發(fā)表于 12-18 13:08 ?386次閱讀

成都匯陽投資關(guān)于谷歌攜 Gemini 王者歸來，AI 算力和應(yīng)用值得期待

“Cloud TPU v5p”, 以及來自谷歌云的人工智能超級(jí)計(jì)算機(jī)。本次谷歌推出的多模態(tài)大模型Ge

發(fā)表于 12-11 14:40 ?800次閱讀

新火種AI|谷歌深夜發(fā)布復(fù)仇神器Gemini，原生多模態(tài)碾壓GPT-4？

谷歌背水一戰(zhàn)，發(fā)布Gemini，狙擊GPT-4

發(fā)表于 12-08 09:09 ?1009次閱讀

谷歌揭秘Gemini，AMD對(duì)峙英偉達(dá)

今天，我們看到谷歌揭開了多模態(tài)AI模型Gemini的神秘面紗，AMD挑戰(zhàn)英偉達(dá)在AI芯片市場(chǎng)的霸主地位，微軟在英國(guó)AI領(lǐng)域的巨額投資，以及3GPP啟動(dòng)6G規(guī)范規(guī)劃。

發(fā)表于 12-07 20:05 ?616次閱讀

FreeRTOS系列技術(shù)文章：上下文切換

嵌入式實(shí)時(shí)操作系統(tǒng)（RTOS）中的上下文切換是指保存和恢復(fù)任務(wù)的狀態(tài)，以使調(diào)度程序能夠切換到另一個(gè)任務(wù)，從而促進(jìn)多任務(wù)處理。

發(fā)表于 11-21 15:48 ?899次閱讀

搜索歷史