0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

截殺ChatGPT-4o,谷歌系A(chǔ)I產(chǎn)品迎來(lái)全面升級(jí)

E4Life ? 來(lái)源:電子發(fā)燒友 ? 作者:周凱揚(yáng) ? 2024-05-16 01:58 ? 次閱讀

電子發(fā)燒友報(bào)道(文/周凱揚(yáng))作為算法巨頭的谷歌,在AI時(shí)代發(fā)布了一系列AI產(chǎn)品,比如Gemini、Bard等。在AI行業(yè)日新月異快速迭代的局面下,即便是谷歌也需要加快開發(fā)速度,不斷更新其AI模型和應(yīng)用。近日舉辦的谷歌I/O大會(huì)上,谷歌宣布全面進(jìn)入Gemini時(shí)代,并發(fā)布了一系列與AI相關(guān)的更新。

對(duì)標(biāo)ChatGPT-4o,谷歌發(fā)布Project Astra

相信本周ChatGPT-4o的演示,已經(jīng)令不少人期待起這個(gè)支持視聽輸入的實(shí)時(shí)AI助手,谷歌也不甘示弱,發(fā)布了Project Astra的演示,展示了他們對(duì)于未來(lái)AI助手的構(gòu)想。Project Astra基于Gemini模型打造,支持視頻和語(yǔ)音的輸入,通過連續(xù)的視頻幀編碼和先進(jìn)的語(yǔ)音模型,谷歌得以更快地處理輸入信息。

相較其ChatGPT-4o更先進(jìn)的是,谷歌的Project Astra還支持實(shí)時(shí)交互,比如在手機(jī)上圈選出實(shí)時(shí)視頻畫面中的一部分,讓AI助手提供描述等。不僅如此,Project Astra將視頻與語(yǔ)音輸入轉(zhuǎn)換成一連串的時(shí)間線事件,并緩存這些信息用于未來(lái)的高效回溯。

谷歌也對(duì)該項(xiàng)目未來(lái)的應(yīng)用場(chǎng)景進(jìn)行了構(gòu)想,這些功能不僅可以用于手機(jī)端,更是可以用于AR眼鏡,為用戶提供交互式的AI助手體驗(yàn)。谷歌在外媒的采訪中也證實(shí),他們正在考慮為Project Astra打造新的AR眼鏡的構(gòu)想。他們認(rèn)為對(duì)于AR設(shè)備來(lái)說,Project Astra很有可能成為新一輪的殺手級(jí)應(yīng)用。

安卓迎來(lái)新一輪AI功能更新

在這個(gè)AI重塑手機(jī)體驗(yàn)的世代,而安卓作為全球用戶技術(shù)最大的智能手機(jī)系統(tǒng),谷歌也希望能用AI帶去全新的設(shè)備交互方式。

wKgaomZEiJiAQaZNAADN-oFe2tg299.png
圈選搜索解題 / 谷歌


自從在三星Unpacked大會(huì)上公布圈選搜索功能,谷歌已經(jīng)為更多Pixel和三星設(shè)備加入了全屏翻譯等功能。在I/O大會(huì)上,谷歌宣布為圈選搜索加入作業(yè)輔助的功能,比如面對(duì)某些物理和數(shù)學(xué)應(yīng)用題,圈選搜索不僅可以給出答案,還可以列出具體的解題過程。

安卓上的Gemini已經(jīng)成為新一代的助手應(yīng)用,借助生成式人工智能來(lái)提供創(chuàng)造力和效率,而未來(lái)幾個(gè)月內(nèi),谷歌將為其推送更新,可以在使用中的應(yīng)用程序中喚醒,并將生成的圖片、文字等拖拽到其他應(yīng)用上。

wKgZomZEiOWAZB8JAADkmdTjAk0881.png
Gemini Nano / 谷歌


至于端側(cè)的Gemini Nano,同樣將在今年年末迎來(lái)升級(jí),引入多模態(tài)支持。為了做到離線使用和保證用戶隱私,谷歌于去年底推出了Gemini Nano,而多模態(tài)的加入將引入對(duì)文本之外的視覺聲音支持。以語(yǔ)音反饋功能為例,對(duì)于盲人或弱視群體,在面對(duì)無(wú)標(biāo)簽的圖片時(shí),Gemini Nano賦能的語(yǔ)音反饋功能將提供更多細(xì)節(jié)的描述。

谷歌同樣借助Gemini Nano對(duì)語(yǔ)音的支持,引入了可選的防詐騙功能。通過在通話過程中檢測(cè)到與詐騙相關(guān)的對(duì)話模式,手機(jī)就會(huì)自動(dòng)發(fā)出實(shí)時(shí)警報(bào),比如要求緊急轉(zhuǎn)賬、提供銀行卡密碼等。因?yàn)檫@些保護(hù)措施都是在端側(cè)完成的,所以此類對(duì)話都是完全保密的,用戶無(wú)需擔(dān)心隱私泄露問題。

第六代TPU Trillium性能與能效雙提升

在本屆I/O大會(huì)上,谷歌也宣布了AI基礎(chǔ)設(shè)施的升級(jí),其TPU將迎來(lái)第六代產(chǎn)品,Trillium。相較TPU v5e,谷歌擴(kuò)大了MXU(矩陣乘法單元)的大小,并提高了時(shí)鐘速度,使得Trillium單芯片的峰值計(jì)算性能實(shí)現(xiàn)了4.7倍的提升,能效提升67%。

同時(shí)谷歌還加倍了HBM內(nèi)存的容量和帶寬,更大的內(nèi)存容量和帶寬允許Trillium可以跑更多權(quán)重、更大KV緩存和更大規(guī)模的模型。谷歌稱下一代的HBM帶來(lái)了帶寬提升和能效提升,改善了大模型的訓(xùn)練時(shí)間以及服務(wù)時(shí)延。

同樣加倍的還有片間互聯(lián)帶寬,這使得Trillium的擴(kuò)展性大大加強(qiáng),單個(gè)服務(wù)器Pod內(nèi)可借助定制的光學(xué)ICI做到256個(gè)芯片互聯(lián),再借助谷歌的Jupiter網(wǎng)絡(luò)擴(kuò)展至數(shù)百個(gè)Pod互聯(lián)。

從第一代TPU開始,谷歌已經(jīng)將這一加速硬件集成到其提供的各種軟件服務(wù)中,比如實(shí)時(shí)語(yǔ)音搜索、照片物體識(shí)別以及交互式語(yǔ)言翻譯等等,當(dāng)然也包括了最新的Gemini、Imagen和Gemma等模型。除此之外,一些行業(yè)模型也將從TPU中受益,比如自動(dòng)駕駛模型、藥物開發(fā)模型等。據(jù)谷歌預(yù)告,Trillium將于今年年末開放給谷歌云客戶。

GeminiGemma迎來(lái)全面迭代升級(jí)

除了上面提到的安卓端Gemini新功能外,Gemini模型本身也將迎來(lái)新一輪升級(jí)。在Gemini 1.5 Pro發(fā)布后不到半年,谷歌就再次對(duì)其進(jìn)行了升級(jí),如今的Gemini 1.5 Pro將支持兩百萬(wàn)Token的上下文窗口。

除此之外,谷歌還加強(qiáng)了Gemini 1.5 Pro的代碼生成、邏輯推理和多輪對(duì)話交互能力。不僅音頻和圖像的理解能力也得到了進(jìn)一步加強(qiáng),不少特殊用例的模型響應(yīng)控制也得到了提升,比如不同的對(duì)話角色和響應(yīng)風(fēng)格。無(wú)論是使用API的開發(fā)者還是谷歌云用戶,現(xiàn)在都可以申請(qǐng)這一升級(jí)。

為了響應(yīng)用戶對(duì)低時(shí)延和低成本模型的要求,谷歌還推出了輕量版的Gemini 1.5 Pro:Gemini 1.5 Flash。Gemini 1.5 Flash專門針對(duì)高流量、高頻率的任務(wù)進(jìn)行了優(yōu)化,支持100萬(wàn)的Token上下文窗口,而且支持文本、圖片、語(yǔ)音和視頻的混合輸入。

開放模型Gemma同樣迎來(lái)了升級(jí),首先是新推出的視覺語(yǔ)言模型PaliGemma,其靈感來(lái)源自PaLI-3,支持圖片和文本作為輸入,可以回答有關(guān)圖片的問題,并提供詳細(xì)信息和上下文,可以用于對(duì)圖片或短視頻添加說明、對(duì)象檢測(cè)等。其主要優(yōu)勢(shì)在于支持多模態(tài)理解,而且可以針對(duì)各種視覺語(yǔ)言任務(wù)進(jìn)行微調(diào),也有專門面向研究的版本PaliGemma-FT,可對(duì)特定的研究數(shù)據(jù)集進(jìn)行微調(diào)。

wKgaomZEiNSAPgoeAAGooyKmAgo448.png
Gemma 2性能測(cè)試對(duì)比 / 谷歌


此外還有下一代Gemma模型的更新,Gemma 2。Gemma 2是一個(gè)270億參數(shù)的大模型,得益于全新的架構(gòu),在性能和效率上均實(shí)現(xiàn)了突破。相較于Meta的Llama 3 70B模型,其規(guī)模只有一半不到,卻可以實(shí)現(xiàn)與之相近的性能。從預(yù)訓(xùn)練階段的測(cè)試成績(jī)來(lái)看,Gemma 2僅僅略微遜色于Llama 3,快于Grok-1。除了針對(duì)英偉達(dá)GPU做了優(yōu)化外,Gemma 2還可以高效地運(yùn)行在單個(gè)TPU主機(jī)上,進(jìn)一步降低了用戶的部署成本。目前Gemma 2依然還在預(yù)訓(xùn)練階段,預(yù)計(jì)將于今年六月推出。

寫在最后

谷歌通常會(huì)將年度I/O開發(fā)者大會(huì)的舞臺(tái)用于發(fā)布Android系統(tǒng),以及Pixel智能手機(jī)的下一代更新。但從今年的發(fā)布內(nèi)容來(lái)看,谷歌已經(jīng)全面轉(zhuǎn)向了AI產(chǎn)品的開發(fā)。無(wú)論是Android 15的下一個(gè)Beta版本,還是Pixel 8a,都只是被短短提及而已。由此可以看出,谷歌已經(jīng)將下一輪軟硬件的革新全面押注在了AI上,未來(lái)我們將見證一個(gè)圍繞AI開發(fā)產(chǎn)品矩陣的新谷歌崛起。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6128

    瀏覽量

    104948
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268105
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1546

    瀏覽量

    7358
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    解鎖 GPT-4o!2024 ChatGPT Plus 代升級(jí)全攻略(附國(guó)內(nèi)支付方法)

    Plus 的實(shí)際使用體驗(yàn),并提供國(guó)內(nèi)支付方案,助您做出明智的訂閱決策。 ChatGPT Plus 核心優(yōu)勢(shì) 最新 AI 模型: 體驗(yàn) GPT-4o、o1-preview 和
    的頭像 發(fā)表于 10-29 18:17 ?343次閱讀

    螞蟻數(shù)科以AI全面升級(jí)產(chǎn)品

    螞蟻數(shù)科近期宣布了一項(xiàng)重大戰(zhàn)略決策,即以AI技術(shù)全面升級(jí)其云服務(wù)產(chǎn)品矩陣,并推出“四新”戰(zhàn)略。螞蟻數(shù)科副總裁余濱在公開場(chǎng)合表示,公司將從底層技術(shù)平臺(tái)到上層運(yùn)營(yíng)工具進(jìn)行
    的頭像 發(fā)表于 10-18 17:20 ?641次閱讀

    華納云:ChatGPT 登陸 Windows

    ChatGPT 現(xiàn)已在 Windows 上推出。 今天,OpenAI宣布已開始預(yù)覽其 AI 聊天機(jī)器人平臺(tái)ChatGPT的專用 Windows 應(yīng)用程序。 OpenAI 表示, ChatGPT
    的頭像 發(fā)表于 10-18 15:50 ?180次閱讀

    谷歌推出旗下AI智能體管理項(xiàng)目Project Oscar

    在近日于印度班加羅爾盛大舉行的2024 I/O Connect開發(fā)者活動(dòng)上,谷歌公司隆重推出了Project Oscar項(xiàng)目,這一創(chuàng)新舉措標(biāo)志著開源軟件項(xiàng)目管理領(lǐng)域迎來(lái)AI智能體的
    的頭像 發(fā)表于 07-19 16:07 ?547次閱讀

    啟明智顯:深度融合AI技術(shù),引領(lǐng)硬件產(chǎn)品全面智能化升級(jí)

    啟明智顯,作為AI領(lǐng)域的先行者,正以前所未有的決心和行動(dòng)力,深度融合先進(jìn)的人工智能技術(shù),引領(lǐng)硬件產(chǎn)品全面智能化升級(jí)
    的頭像 發(fā)表于 07-18 16:11 ?341次閱讀
    啟明智顯:深度融合<b class='flag-5'>AI</b>技術(shù),引領(lǐng)硬件<b class='flag-5'>產(chǎn)品</b><b class='flag-5'>全面</b>智能化<b class='flag-5'>升級(jí)</b>

    ChatGPT-4o,國(guó)產(chǎn)大模型竟然更懂翻譯,8款大模型深度測(cè)評(píng)|AI 橫評(píng)

    隨著AI工具的不斷增多,各家模型的能力也日益提升,現(xiàn)在無(wú)論哪款大模型幾乎都能夠處理各種翻譯難題。在AI浪潮當(dāng)下,越來(lái)越多的論文和前沿信息需要快速翻譯和解讀,依賴傳統(tǒng)的翻譯工具依舊面臨“翻譯質(zhì)量不穩(wěn)定
    的頭像 發(fā)表于 07-14 08:04 ?128次閱讀
    超<b class='flag-5'>ChatGPT-4o</b>,國(guó)產(chǎn)大模型竟然更懂翻譯,8款大模型深度測(cè)評(píng)|<b class='flag-5'>AI</b> 橫評(píng)

    國(guó)內(nèi)直聯(lián)使用ChatGPT 4.0 API Key使用和多模態(tài)GPT4o API調(diào)用開發(fā)教程!

    1. 前言 ChatGPT-4o API 是 OpenAI 提供的強(qiáng)大工具,可用于自然語(yǔ)言處理和多模態(tài)任務(wù)。在國(guó)內(nèi)直聯(lián)使用這些服務(wù)需要一些配置和技巧。本文將詳細(xì)介紹GPT-4o模型以及如何獲取
    的頭像 發(fā)表于 06-08 00:33 ?4299次閱讀
    國(guó)內(nèi)直聯(lián)使用<b class='flag-5'>ChatGPT</b> 4.0 API Key使用和多模態(tài)GPT<b class='flag-5'>4o</b> API調(diào)用開發(fā)教程!

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來(lái)了

    功能和實(shí)際應(yīng)用。 GPT-4 turbo****的增強(qiáng)功能 ChatGPT-4o帶來(lái)了幾個(gè)值得注意的升級(jí),增強(qiáng)了性能和可用性: · 更快的響應(yīng)時(shí)間和更高的準(zhǔn)確性: 是客戶服務(wù)和其他快節(jié)奏環(huán)境中所
    發(fā)表于 05-27 15:43

    兩小時(shí)“吼出”121次AI,谷歌背后埋伏著Open AI的幽靈

    谷歌AI依舊不痛不癢谷歌和OpenAI的又一次對(duì)陣,剛剛落幕了。北京時(shí)間5月14日凌晨,OpenAI發(fā)布端到端多模態(tài)AI大模型GPT-4o
    的頭像 發(fā)表于 05-19 08:05 ?391次閱讀
    兩小時(shí)“吼出”121次<b class='flag-5'>AI</b>,<b class='flag-5'>谷歌</b>背后埋伏著Open <b class='flag-5'>AI</b>的幽靈

    谷歌發(fā)布多模態(tài)AI新品,加劇AI巨頭競(jìng)爭(zhēng)

    在全球AI競(jìng)技場(chǎng)上,谷歌與OpenAI一直穩(wěn)居領(lǐng)先地位。近日,谷歌在I/O開發(fā)者大會(huì)上掀起了一股新的技術(shù)浪潮,發(fā)布了多款全新升級(jí)的多模態(tài)
    的頭像 發(fā)表于 05-16 09:28 ?409次閱讀

    OpenAI推出面向所有用戶的AI模型GPT-4o

    在周一的直播盛會(huì)上,OpenAI揭開了其最新的人工智能模型GPT-4o的神秘面紗。這款新模型旨在為其著名的聊天機(jī)器人ChatGPT提供更強(qiáng)大、更經(jīng)濟(jì)的支持。GPT-4o是此前備受矚目的GPT-
    的頭像 發(fā)表于 05-15 09:23 ?357次閱讀

    新火種AI|挑戰(zhàn)谷歌,OpenAI要推出搜索引擎?

    作者:一號(hào) 編輯:美美 在AI革新的浪潮下,谷歌搜索迎來(lái)了越來(lái)越多的“挑戰(zhàn)者”。 最近,據(jù)多家外媒的消息,有知情人士透露,OpenAI正計(jì)劃上線一款基于ChatGPT的大型
    的頭像 發(fā)表于 05-07 22:06 ?330次閱讀
    新火種<b class='flag-5'>AI</b>|挑戰(zhàn)<b class='flag-5'>谷歌</b>,OpenAI要推出搜索引擎?

    在FPGA設(shè)計(jì)中是否可以應(yīng)用ChatGPT生成想要的程序呢

    當(dāng)下AI人工智能崛起,很多開發(fā)領(lǐng)域都可看到ChatGPT的身影,F(xiàn)PGA設(shè)計(jì)中,是否也可以用ChatGPT輔助設(shè)計(jì)呢?
    發(fā)表于 03-28 23:41

    【國(guó)產(chǎn)FPGA+OMAPL138開發(fā)板體驗(yàn)】(原創(chuàng))6.FPGA連接ChatGPT 4

    訪問ChatGPT 4這樣的AI模型是非常復(fù)雜的,因?yàn)檫@涉及到大量的數(shù)據(jù)傳輸、協(xié)議實(shí)現(xiàn)、并行處理、優(yōu)化等等。更重要的是,ChatGPT 4
    發(fā)表于 02-14 21:58

    詳細(xì)圖文解說輕松注冊(cè)ChatGPT-驗(yàn)證谷歌賬號(hào)教程,沒有海外手機(jī)號(hào)谷歌怎么驗(yàn)證注冊(cè)?

    谷歌Gmail注冊(cè)ChatGPT詳細(xì)教程分享
    的頭像 發(fā)表于 12-04 18:32 ?5219次閱讀
    詳細(xì)圖文解說輕松注冊(cè)<b class='flag-5'>ChatGPT</b>-驗(yàn)證<b class='flag-5'>谷歌</b>賬號(hào)教程,沒有海外手機(jī)號(hào)<b class='flag-5'>谷歌</b>怎么驗(yàn)證注冊(cè)?