0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌Gemini被曝夸大營銷?碾壓GPT4純靠“一張嘴”

新火種 ? 來源:新火種 ? 作者:新火種 ? 2023-12-09 09:09 ? 次閱讀

Gemini對谷歌來說可能走了一大步,但對整個(gè)AI領(lǐng)域而言,并沒有說的那么夸張。

涉嫌虛假宣傳,交互非實(shí)時(shí)感知

才短短一天時(shí)間,谷歌Gemini就被曝涉嫌造假,夸大宣傳。

作為谷歌用來應(yīng)對GPT-4的“殺手锏”,Gemini一經(jīng)亮相就有了兩個(gè)碩大的標(biāo)簽:超過人類專家,碾壓GPT-4。隨便單拎一條出來,都是目前其他大模型所不能比擬的成績。

但也有越來越多的人開始質(zhì)疑它的真實(shí)性,彭博社的Parmy Olsen就是第一個(gè)質(zhì)疑視頻造假的人。

wKgZomVzEneAXXjZAAVz8X4uiIk237.jpg

就在大家震驚于谷歌發(fā)布的6分鐘互動視頻里,他指出,Gemini所有交互都不是實(shí)時(shí)感知的,存在后期制作和剪輯配音的成分。隨后這一說法也得到了谷歌官方的證實(shí),承認(rèn)Gemini的確使用了靜態(tài)圖片和多段提示詞拼湊,才能達(dá)成這樣的效果。

簡單來說就是,Gemini不能直接看懂一段動作視頻,只能看懂多張圖片。像演示視頻里人類在玩石頭剪刀布,實(shí)際上是把“布”“拳頭”“剪刀”三張照片依次傳給Gemini,然后加上良好的提示詞,才能讓Gemini給出回答,然后再由員工配音念出來。

wKgaomVzEneAV8QDAAO13Fe4PyA903.jpg

而且視頻中展示的許多其他功能并不是谷歌獨(dú)有的,GPT Plus3也可以做得到,沃頓商學(xué)院教授伊森·莫里克(Ethan Mollick)就用實(shí)驗(yàn)證實(shí)了這一點(diǎn)。

雖然從技術(shù)原理上來看,能夠讀取圖片和能夠看懂視頻之間,并沒有技術(shù)上的鴻溝。但是從產(chǎn)品實(shí)現(xiàn)落地的角度看,把讀取圖片約等于能實(shí)時(shí)看懂視頻,過于強(qiáng)調(diào)實(shí)時(shí)性而壓縮了交互過程中的延遲,這幾乎已經(jīng)可以理解為虛假宣傳。而是否需要良好的提示詞工程,更是評價(jià)模型能力的關(guān)鍵問題。

混淆跑分,GPT4測試標(biāo)準(zhǔn)不一致

從谷歌對Gemini的宣傳信息來看,它聲稱Gemini在32項(xiàng)標(biāo)準(zhǔn)性能指標(biāo)中,有30 項(xiàng)指標(biāo)都優(yōu)于GPT-4,跑出90%的高分,超過GPT-4。但實(shí)際上,差距微乎其微,而且這種比較并不公平。

Gemini Ultra的90%得分是基于谷歌研究人員開發(fā)的一種基于32個(gè)樣本的思維鏈的方法。對于同一個(gè)問題,Gemini Ultra會生成32個(gè)答案以及這些答案的推理。然后,模型會選擇最常見的答案作為最終答案。

wKgZomVzEniAQXv7AAD_QaiUz00699.jpg

但GPT-4的86.4%分?jǐn)?shù)是基于行業(yè)評估標(biāo)準(zhǔn)5-shot。HuggingFace技術(shù)主管Philipp Schmid特意從Gemini的技術(shù)報(bào)告中提取數(shù)據(jù)重做計(jì)算,在5-shot的標(biāo)準(zhǔn)下,Gemini的得分實(shí)為83.7%,比GPT-4更低。

wKgaomVzEniAay9kAAT7Sd3k3Ts400.jpg

也就是說只有CoT(思維鏈)達(dá)到32個(gè)例子時(shí),Gemini Ultra才能達(dá)到90分超過GPT-4;當(dāng)例子數(shù)量減少到5個(gè),Gemini Ultra得分就不如GPT-4。難怪連谷歌公司高管在之前都回避了關(guān)于該模型比GPT-4 強(qiáng)多少的問題,因?yàn)樗鼈冎皇恰皬?qiáng)”在了不同的標(biāo)準(zhǔn)上。

就像谷歌在5月份發(fā)布Palm-2的時(shí)候,也挑出了兩個(gè)優(yōu)于GPT-4的指標(biāo),但是后來這個(gè)大模型怎么樣,大家都清楚。

斯坦福大學(xué)基礎(chǔ)模型研究中心主任 Percy Liang也談到,雖然Gemini有很好的基準(zhǔn)分?jǐn)?shù),但由于不知道訓(xùn)練數(shù)據(jù)的內(nèi)容,因此很難解釋這些數(shù)據(jù)。華盛頓大學(xué)計(jì)算語言學(xué)教授 Emily Bender也指出,谷歌宣傳Gemini是一臺萬能機(jī)器,是一個(gè)可用于多種不同用途的通用模型。但是谷歌卻在使用狹隘的基準(zhǔn),來評估它期望用于這些不同用途的模型,這意味著它實(shí)際上無法得到徹底評估。

倉促上陣,只為趁OpenAI動蕩搞事?

今年3月,OpenAI發(fā)布GPT人工智能模型,并推出其支持的付費(fèi)聊天AI機(jī)器人ChatGPT,這其實(shí)對谷歌來說壓力很大。

畢竟谷歌已經(jīng)耗費(fèi)了數(shù)年心血,在人工智能領(lǐng)域投入巨資研究,卻沒想到被半路殺出來的OpenAI彎道超車。

所以在4月,谷歌迫于投資方的巨大壓力,將負(fù)責(zé)人工智能研究的Google Brain,與母公司Alphabet位于倫敦的人工智能研究實(shí)驗(yàn)室DeepMind合并,為了在今年接下來的時(shí)間里研發(fā)Gemini模型來回應(yīng)GPT-4的挑戰(zhàn)。

而在兩周前,OpenAI剛剛重新任命了奧特曼為首席執(zhí)行官,并任命了新的董事會成員,勉強(qiáng)給這家初創(chuàng)公司的一段動蕩期畫上了句號。這場內(nèi)斗事件也促使一些客戶開始評估其他AI提供商,谷歌選擇在這個(gè)時(shí)間點(diǎn)推出Gemini的心思不言而喻。

據(jù)報(bào)道,當(dāng)OpenAI董事會暫時(shí)罷免首席執(zhí)行官奧特曼,使公司的未來發(fā)展受到質(zhì)疑時(shí),谷歌迅速發(fā)起了一場營銷活動,說服OpenAI企業(yè)客戶轉(zhuǎn)向谷歌?,F(xiàn)在,隨著Gemini的發(fā)布,谷歌也正是在利用這種不確定性。

然而,目前大多數(shù)人還是不能完整地體驗(yàn)Gemini。最強(qiáng)大的對標(biāo)GPT-4的滿血版Gemini Ultra,還需要等待幾個(gè)月才能和公眾見面。據(jù)谷歌高管的說法,預(yù)計(jì)將于明年初上市。而現(xiàn)在推出的版本是為谷歌基于文本的搜索聊天機(jī)器人Bard的后臺,為其提供更高級的推理、規(guī)劃和理解能力。

在接下來的幾個(gè)月里,新的Gemini增強(qiáng)版Bard會在170多個(gè)國家提供英語版本的首發(fā),不包括歐盟和英國。谷歌負(fù)責(zé)Bard的副總裁Sissie Hsiao表示,這是因?yàn)楣拘枰c當(dāng)?shù)乇O(jiān)管機(jī)構(gòu)“接軌”。除此之外,Gemini還有一個(gè)名為Nano的版本,可以直接在設(shè)備上運(yùn)行的,例如谷歌的新款Pixel手機(jī)。

谷歌VS OpenAI:瑜亮之爭鹿死誰手?

12月7日,隨著Gemini的高調(diào)發(fā)布,谷歌市值一晚就增加逾870億美元,增量相當(dāng)于OpenAI的最新估值。就目前來說,未上市的OpenAI估值在800億至900億美元之間。

要知道,今年以來谷歌的股價(jià)已經(jīng)上漲了逾50%,大幅跑贏了納斯達(dá)克綜合指數(shù),但卻落后于一些科技同行,里面就包括OpenAI最大的投資方微軟。

事實(shí)上,谷歌在過去的發(fā)展歷史中已經(jīng)吃過很多次苦頭,推出有缺陷的產(chǎn)品。這對公司發(fā)展來說,適得其反。就像今年2月為了應(yīng)對ChatGPT急急忙忙推出的Bard,因?yàn)橐淮涡⌒∈д`就導(dǎo)致股價(jià)蒸發(fā)了高達(dá)1000億美元。

wKgZomVzEnqAdrotAADFpBReZXw314.jpg

哪怕是5月,谷歌宣布在大部分產(chǎn)品中植入生成型人工智能,比如谷歌郵箱和其他軟件,試圖用這個(gè)舉動改變市場的看法,但效果卻微乎其微。這也讓谷歌深刻認(rèn)識到,推出有缺陷的產(chǎn)品帶來的反噬。

但在科技行業(yè),只要足夠強(qiáng)大就足以搶占市場。早期的手機(jī)霸主諾基亞和黑莓就經(jīng)歷過慘痛教訓(xùn),蘋果用功能更強(qiáng)大、更直觀的iPhone搶走了它們的市場。在軟件領(lǐng)域,商業(yè)上的成功往往來自于性能最好的系統(tǒng)。

幾乎可以肯定的是,隨著Gemini的發(fā)布,谷歌或許有望逐漸扭轉(zhuǎn)那些不利的局面。摩根大通分析師就表示,“谷歌開始通過結(jié)合 Gemini的不同模型版本,來解決投資者對生成式人工智能創(chuàng)新和GenAI模型運(yùn)行成本過高的擔(dān)憂。”

不過如果Gemini Ultra真如谷歌所說那樣在明年1月初發(fā)布,那么在頂級人工智能模型的頭部就呆不了太久時(shí)間。畢竟在谷歌努力追趕OpenAI的過程中,后者有將近一年的時(shí)間來開發(fā)新一代人工智能模型GPT-5。

但有一點(diǎn)不能否認(rèn),谷歌和OpenAI的這場對決,已是箭在弦上。

審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6080

    瀏覽量

    104353
  • Gemini
    +關(guān)注

    關(guān)注

    0

    文章

    49

    瀏覽量

    7544
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46060

    瀏覽量

    234979
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    347

    瀏覽量

    15179
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    988

    瀏覽量

    6252
收藏 人收藏

    評論

    相關(guān)推薦

    谷歌Gemini用文心言訓(xùn)練,字節(jié)OpenAI封號,大模型互薅羊毛是常態(tài)?

    @闌夕爆料,對谷歌Gemini進(jìn)行測試時(shí),如果用中文詢問Gemini的身份,其回答竟然是百度文心言。 ? 更讓人大跌眼鏡的是,測試人員可以使用“小愛同學(xué)”“小度”等提示詞喚醒
    的頭像 發(fā)表于 12-20 09:03 ?2634次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>自<b class='flag-5'>曝</b>用文心<b class='flag-5'>一</b>言訓(xùn)練,字節(jié)<b class='flag-5'>被</b>OpenAI封號,大模型互薅羊毛是常態(tài)?

    谷歌發(fā)布史上最強(qiáng)大模型Gemini,全方位領(lǐng)先GPT-4,MMLU基準(zhǔn)達(dá)人類專家水平

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)美國當(dāng)?shù)貢r(shí)間周三,谷歌發(fā)布了其新代人工智能模型Gemini(雙子星)。谷歌CEO桑達(dá)爾?皮查伊和Deepmind CEO戴密斯·哈薩比斯在
    的頭像 發(fā)表于 12-08 00:11 ?3294次閱讀
    <b class='flag-5'>谷歌</b>發(fā)布史上最強(qiáng)大模型<b class='flag-5'>Gemini</b>,全方位領(lǐng)先<b class='flag-5'>GPT-4</b>,MMLU基準(zhǔn)達(dá)人類專家水平

    谷歌推出Gemini Live,開啟AI語音聊天新紀(jì)元

    在萬眾矚目的Pixel 9系列手機(jī)發(fā)布會上,谷歌震撼宣布了項(xiàng)創(chuàng)新服務(wù)——Gemini Live,該服務(wù)自今日起,率先向使用英語的Gemini Advanced訂閱用戶敞開大門。這
    的頭像 發(fā)表于 08-15 17:29 ?561次閱讀

    谷歌Gmail將支持Gemini總結(jié)電子郵件內(nèi)容

    谷歌透露,Gemini 將協(xié)助 Workspace 和 Google One AI Premium 的用戶理解和處理電子郵件內(nèi)容。用戶可通過移動應(yīng)用和網(wǎng)頁版 Gmail 使用 Gemini
    的頭像 發(fā)表于 05-15 11:11 ?394次閱讀

    股價(jià)久違飆漲,商湯要用自己的Scaling law挑戰(zhàn)GPT4

    天的“2024年商湯技術(shù)交流日”上,商湯發(fā)布了對標(biāo)GPT4-Turbo的大模型日日新大模型SenseNova5.0,追趕GPT4可能是當(dāng)下中國大模型行業(yè)的集體目
    的頭像 發(fā)表于 05-08 08:05 ?276次閱讀
    股價(jià)久違飆漲,商湯要用自己的Scaling law挑戰(zhàn)<b class='flag-5'>GPT4</b>

    幫忙畫一張詳細(xì)的電路圖,謝謝

    能幫忙畫一張詳細(xì)的電路圖嗎,謝謝了。因?yàn)樯婕暗酵獠挎溄?,?b class='flag-5'>被誤會發(fā)廣告,所以詳細(xì)的需求放在附件里面了 *附件:幫忙謝謝.rar
    發(fā)表于 05-04 22:59

    谷歌推出新代大模型Gemini 1.5

    近日,谷歌在無預(yù)警的情況下發(fā)布了其下代大模型——Gemini 1.5,這款模型在性能上實(shí)現(xiàn)了顯著增強(qiáng),并在長上下文理解方面取得了令人矚目的突破。更令人驚嘆的是,Gemini 1.5甚
    的頭像 發(fā)表于 02-20 13:55 ?715次閱讀

    谷歌最新人工智能模型Gemini Pro已在歐洲上市

    近日,谷歌宣布其最新人工智能模型Gemini Pro已在歐洲市場上市,向歐洲用戶開放。Gemini Pro是谷歌最大的人工智能(AI)模型之
    的頭像 發(fā)表于 02-04 15:10 ?1024次閱讀

    Gemini和ChatGPT有什么不同,Gemini將超越ChatGPT?

    Gemini Ultra是首個(gè)在MMLU測評上超過人類專家的大模型,取得90.0%的成績。作為對比,人類專家的成績?yōu)?9.8%,GPT-4為86.4%。
    發(fā)表于 12-20 11:45 ?457次閱讀
    <b class='flag-5'>Gemini</b>和ChatGPT有什么不同,<b class='flag-5'>Gemini</b>將超越ChatGPT?

    谷歌推出Gemini 希望擊敗GPT-4

    Gemini不僅僅是個(gè)單的人工智能模型。有個(gè)簡單版本叫Gemini Nano,旨在在安卓設(shè)備上離線運(yùn)行。有
    的頭像 發(fā)表于 12-14 17:30 ?683次閱讀

    谷歌聲稱Gemini超越GPT-4,你有何看法呢?

    誰能想到,夜之間,人們對于谷歌 Gemini 的看法竟發(fā)生了 180° 轉(zhuǎn)變。
    的頭像 發(fā)表于 12-14 09:54 ?478次閱讀
    <b class='flag-5'>谷歌</b>聲稱<b class='flag-5'>Gemini</b>超越<b class='flag-5'>GPT-4</b>,你有何看法呢?

    成都匯陽投資關(guān)于谷歌Gemini 王者歸來,AI 算力和應(yīng)用值得期待

    Gemini 大模型主打多模態(tài),性能對標(biāo)GPT-4】 當(dāng)?shù)貢r(shí)間12月6日, 谷歌公司宣布推出其規(guī)模最大、功能最強(qiáng)的多模態(tài)大模型 Gemini, 其最強(qiáng)大的 TPU (張量處理單元)系
    的頭像 發(fā)表于 12-11 14:40 ?801次閱讀
    成都匯陽投資關(guān)于<b class='flag-5'>谷歌</b>攜 <b class='flag-5'>Gemini</b> 王者歸來,AI 算力和應(yīng)用值得期待

    新火種AI|谷歌深夜發(fā)布復(fù)仇神器Gemini,原生多模態(tài)碾壓GPT-4?

    谷歌背水戰(zhàn),發(fā)布Gemini,狙擊GPT-4
    的頭像 發(fā)表于 12-08 09:09 ?1009次閱讀
    新火種AI|<b class='flag-5'>谷歌</b>深夜發(fā)布復(fù)仇神器<b class='flag-5'>Gemini</b>,原生多模態(tài)<b class='flag-5'>碾壓</b><b class='flag-5'>GPT-4</b>?

    一張圖看懂“PCB設(shè)計(jì)考慮的因素”

    一張圖看懂“PCB設(shè)計(jì)考慮的因素”
    的頭像 發(fā)表于 11-23 18:15 ?808次閱讀
    <b class='flag-5'>一張</b>圖看懂“PCB設(shè)計(jì)考慮的因素”

    ChatGPT Plus怎么支付 GPT4得訂閱嗎?

    仍然不透明。OpenAI 尚未與公眾分享有關(guān) GPT-4 的許多細(xì)節(jié),例如模型的大小或訓(xùn)練數(shù)據(jù)的細(xì)節(jié)。訂閱 ChatGPT Plus 尚未授予 對該公司最近預(yù)覽的圖像分析功能的訪問權(quán)限。 考慮到這
    的頭像 發(fā)表于 10-10 12:16 ?1662次閱讀
    ChatGPT Plus怎么支付 <b class='flag-5'>GPT4</b>得訂閱嗎?