人妻少妇偷人精品视频,Aⅴ色中文字幕无码首页

作者：一號(hào)

編輯：小迪

谷歌過于心急，Gemini推出不到半月，就遭遇兩次“危機(jī)”。

美東時(shí)間12月6日，谷歌推出了迄今為止規(guī)模最大，能力最強(qiáng)的大模型Gemini。其原生多模態(tài)的能力，通過一條約6分鐘的演示視頻，展現(xiàn)得淋漓盡致，讓人不得不感慨它的強(qiáng)大，就連馬斯克都評(píng)論說，“（Gemini）令人印象深刻”。

谷歌在AI領(lǐng)域的成就有目共睹，盡管之前推出的Bard表現(xiàn)不盡人意，讓谷歌市值一夜蒸發(fā)了1000億美元。但經(jīng)過一年沉淀，加上和DeepMind聯(lián)合研發(fā)，所以Gemini（雙子星）可是被寄予了厚望。

但是，Gemini發(fā)布后僅一天，就有人指控谷歌“造假”。除了在數(shù)據(jù)對(duì)比上沒有使用相同條件，演示視頻效果也是經(jīng)過剪輯的。逼得谷歌不得不給出文檔承認(rèn)視頻是經(jīng)過加工的。

12月14日，視頻“造假”事件還沒降溫，谷歌就宣布對(duì)外免費(fèi)開放Gemini Pro的API。讓不少人高興得奔走相告。因?yàn)橄噍^于GPT-4收費(fèi)版才能擁有的視覺模型，Gemini Pro可以直接給平民AI玩家體驗(yàn)AI視覺能力的機(jī)會(huì)。

但就在API開放后不久，就有用戶發(fā)現(xiàn)，在Poe上使用Gemini Pro時(shí)，如果用簡(jiǎn)體中文連續(xù)詢問“你好”和“你是誰”這兩個(gè)問題時(shí)，Gemini Pro會(huì)直接說出“我是百度文心大模型”這樣的回答，給網(wǎng)友都看“呆”了。

谷歌Gemini被百度文心一眼“奪舍”了？

微博大V闌夕就發(fā)博展示了這樣的效果，就連進(jìn)一步詢問“你的創(chuàng)始人是誰”時(shí)，它也很干脆地回答：李彥宏。

難道Gemini被百度“奪舍”了？不少人懷疑這是因?yàn)椴┲髟趯?duì)話前面設(shè)置了提示詞，讓Gemini扮演文心一言，但這位博主強(qiáng)調(diào)，沒有任何前置對(duì)話。

本著求真的態(tài)度，我們也去Poe上試用了一下，結(jié)果真的可以復(fù)現(xiàn)。

會(huì)不會(huì)是Poe平臺(tái)上的接口用錯(cuò)了？不過Poe平臺(tái)可不是什么野雞套殼網(wǎng)站，它是美版知乎Quora推出的AI聊天機(jī)器人平臺(tái)，你所熟知的ChatGPT、Claude等知名AI都可以在上面使用。而且如果你使用英文提問Gemini，它就會(huì)立刻恢復(fù)正常。并且單就從“作案動(dòng)機(jī)”上來講，Poe也沒有必要這么做。

除此之外，還有用戶在谷歌自己的Vertex AI平臺(tái)上，使用中文對(duì)話，也出現(xiàn)了這種情況。因此，Poe的接口使用出錯(cuò)，這個(gè)可能基本可以被排除，問題應(yīng)該出在Gemini本身。

使用AI生成的數(shù)據(jù)進(jìn)行訓(xùn)練已不新鮮

這樣看下來，要么就是谷歌使用了百度文心一言的語料進(jìn)行訓(xùn)練，要么就是它所使用的語料已經(jīng)被AI“污染”了。

其實(shí)大模型訓(xùn)練使用其他大模型生成的語料這件事情已經(jīng)不是第一次發(fā)生，并且谷歌還是有“前科”的。在上一代Bard時(shí)，谷歌就曾被曝出使用ChatGPT的數(shù)據(jù)進(jìn)行訓(xùn)練，并且根據(jù)The Information報(bào)道，這件事情還造成了Jacob Devlin從谷歌離職。

就在上周末，字節(jié)跳動(dòng)也被OpenAI禁止使用API接口，原因也是因?yàn)檎f字節(jié)在使用GPT訓(xùn)練自己的AI，違反了使用條例。

如果按照現(xiàn)在每個(gè)模型堆“訓(xùn)練數(shù)據(jù)量”的操作來看，互聯(lián)網(wǎng)上的人類原生的數(shù)據(jù)很快就會(huì)用完，并且各個(gè)模型之間也將會(huì)很相似。因此，獲取一些未被別人拿去訓(xùn)練的數(shù)據(jù)，是模型之間保持差異化的一種方法。因此，有些AI公司會(huì)向一些擁有專屬數(shù)據(jù)的公司購(gòu)買數(shù)據(jù)。例如OpenAI就曾表示愿意每年支付高達(dá)八位數(shù)的費(fèi)用，用以獲取彭博社自有的歷史和持續(xù)的金融文件數(shù)據(jù)訪問權(quán)限。

另一個(gè)思路，就是選擇使用AI合成的數(shù)據(jù)來進(jìn)行訓(xùn)練。香港大學(xué)、牛津大學(xué)和字節(jié)跳動(dòng)的幾名研究院就曾嘗試過使用高質(zhì)量AI合成圖片，來提升圖像分類模型的性能，結(jié)果發(fā)現(xiàn)效果還不錯(cuò)，甚至比真實(shí)數(shù)據(jù)訓(xùn)練還要好。

AI生成的內(nèi)容正在“污染”互聯(lián)網(wǎng)

而從另一方面來看，AI生成的內(nèi)容污染互聯(lián)網(wǎng)也是一個(gè)不得不重視的問題了。尤其是生成式AI大爆發(fā)的今年。在文字、圖像、視頻還有音頻等領(lǐng)域，AI生成的內(nèi)容都正在“污染”互聯(lián)網(wǎng)上數(shù)據(jù)內(nèi)容。

就在上個(gè)月，一些網(wǎng)友發(fā)現(xiàn)，在谷歌搜索上輸入已故夏威夷歌手Israel Kamakawiwo’ole的名字是，得到的搜索結(jié)果，前幾張圖片都是有AI生成的，而并非真實(shí)照片，并且這是一位以彈奏尤克里里而聞名的音樂家，但圖片里的他卻在彈吉他。

在文字方面也是，隨著百家號(hào)等媒體平臺(tái)上出現(xiàn)的AI幫寫等功能，AI生成的文章已經(jīng)開始在互聯(lián)網(wǎng)上“蔓延”，這讓普通人在互聯(lián)網(wǎng)上篩選真實(shí)且有效的信息的效率反而降低了?？梢哉f，AI生成內(nèi)容對(duì)互聯(lián)網(wǎng)語料的“污染”，可能會(huì)導(dǎo)致產(chǎn)生一個(gè)新的需求，那就是幫人們分辨內(nèi)容是否由AI生成的AI。

畢竟，目前訓(xùn)練AI所需要的數(shù)據(jù)還是人類所生產(chǎn)的，在數(shù)據(jù)清洗過程中，需要注意清除一些由其他AI生成的內(nèi)容。一旦互聯(lián)網(wǎng)上AI生成的內(nèi)容越多，越能以假亂真，那么數(shù)據(jù)篩選的難度將越大。并且在大模型出現(xiàn)“幻覺”以及AI如何產(chǎn)生“智能涌現(xiàn)”這兩個(gè)問題沒有得到徹底解決之前，我想我們都無法做到徹底信賴AI生成的內(nèi)容。

畢竟一旦AI生成了錯(cuò)誤的內(nèi)容，而另一個(gè)AI拿著這個(gè)內(nèi)容去訓(xùn)練，然后再另一個(gè)AI拿到新的錯(cuò)誤內(nèi)容......這樣“滾雪球”下去，AI最終會(huì)生成什么樣的逆天垃圾，我們真的無法想象。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴