0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌研究人員發(fā)現(xiàn)了機器學習模型常見失敗的一個主要原因

ss ? 來源:OFweek物聯(lián)網(wǎng) ? 作者:OFweek物聯(lián)網(wǎng) ? 2020-11-30 17:44 ? 次閱讀

機器學習模型在實驗室中調(diào)整和調(diào)整到近乎完美的性能,但在現(xiàn)實環(huán)境中往往會失敗,這已經(jīng)不是什么秘密了。這通常被歸結(jié)為人工智能接受訓練和測試的數(shù)據(jù)與它在現(xiàn)實中遇到的數(shù)據(jù)不匹配,這個問題被稱為數(shù)據(jù)轉(zhuǎn)移。例如,經(jīng)過訓練,能夠在高質(zhì)量的醫(yī)學圖像中發(fā)現(xiàn)疾病跡象的人工智能,將難以識別繁忙的診所中廉價相機捕捉到的模糊或裁剪的圖像。

現(xiàn)在,谷歌的7個不同團隊的40名研究人員發(fā)現(xiàn)了機器學習模型常見失敗的另一個主要原因。這被稱為“不規(guī)范”,它可能是一個比數(shù)據(jù)轉(zhuǎn)移更大的問題。領導這項研究的Alex D‘a(chǎn)mour說:“我們對機器學習模型的要求比我們目前的方法所能保證的要多?!?/p>

D’amour最初的調(diào)查如同滾雪球般滾來滾去,數(shù)十名谷歌研究人員最終著眼于一系列不同的人工智能應用,從圖像識別到自然語言處理(NLP)再到疾病預測。他們發(fā)現(xiàn),不規(guī)范的要求是所有這些項目表現(xiàn)不佳的原因。問題在于機器學習模型的訓練和測試方式,沒有簡單的解決辦法。

粗略地說,建立一個機器學習模型需要在大量的例子上訓練它,然后在一堆它還沒有見過的類似的例子上測試它。當模型通過測試時,就完成了。

谷歌的研究人員指出,這個標準太低了。訓練過程可以產(chǎn)生許多不同的全部通過測試的模型,但是這些模型會有一些小差異,取決于諸如在培訓開始之前隨機值的神經(jīng)網(wǎng)絡中的節(jié)點、訓練數(shù)據(jù)、被選中或者代表的方式、培訓運行的數(shù)量等等。如果這些微小的、隨機的差異不影響模型在測試中的表現(xiàn),它們通常會被忽視。但事實證明,在現(xiàn)實世界中,它們會導致巨大的表現(xiàn)差異。

換句話說,如今用來構(gòu)建大多數(shù)機器學習模型的過程無法區(qū)分哪些模型在現(xiàn)實世界中可行,哪些模型不可行。

為了解決這一問題,一種選擇是在培訓和測試過程中設計一個額外的階段,在這個階段中可以同時生產(chǎn)多個模型,而不是只生產(chǎn)一個。然后,這些相互競爭的模型可以在具體的現(xiàn)實任務中再次進行測試,以選擇最適合這項工作的模型。

那需要做很多工作。蘇黎世聯(lián)邦理工學院的機器學習研究員Yannic Kilcher說,但是對于像谷歌這樣建造和部署大型模型的公司來說,這樣做是值得的。谷歌可以提供50種不同版本的NLP模型,應用程序開發(fā)人員可以選擇最適合他們的一個,他說。

D ‘Amour和他的同事們還沒有解決這個問題,但正在探索改進培訓過程的方法。他表示:“我們需要更好地明確我們對模型的要求?!薄耙驗樽罱K的結(jié)果往往是,我們只是在模型在實際應用中失敗之后才發(fā)現(xiàn)這些要求?!?/p>

如果人工智能想要在實驗室之外產(chǎn)生和在實驗室內(nèi)部一樣大的影響,那么進行修復是至關重要的。在谷歌從事醫(yī)療人工智能領域工作的合著者凱瑟琳海勒(Katherine Heller)表示,當人工智能在現(xiàn)實世界中表現(xiàn)不佳時,人們就不太愿意使用它了:“在殺手級應用方面,我們已經(jīng)失去了很多信任,這是我們希望重新獲得的重要信任?!?/p>

責任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6128

    瀏覽量

    104949
  • AI
    AI
    +關注

    關注

    87

    文章

    29806

    瀏覽量

    268106
  • 機器學習
    +關注

    關注

    66

    文章

    8349

    瀏覽量

    132315
  • nlp
    nlp
    +關注

    關注

    1

    文章

    484

    瀏覽量

    21987
收藏 人收藏

    評論

    相關推薦

    華納云:企業(yè)遷移到云端的主要原因是什么?

    企業(yè)遷移到云端的主要原因是什么?原因不止。削減成本通常被認為是主要原因——但盡管通過云遷移降低成本無疑是
    的頭像 發(fā)表于 09-14 17:38 ?233次閱讀

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    簡單評價這本書。 是這樣,在閱讀與實踐過程中,我也發(fā)現(xiàn)了些可以進步提升用戶體驗的細節(jié)之處。 例如,書中大量的代碼示例對于學習者來說無疑是寶貴的資源,但在快速復制粘貼的過程中,偶爾會
    發(fā)表于 08-12 11:21

    人臉識別模型訓練失敗原因有哪些

    人臉識別模型訓練失敗原因有很多,以下是常見原因及其解決方案: 數(shù)據(jù)集質(zhì)量問題 數(shù)據(jù)集是訓
    的頭像 發(fā)表于 07-04 09:17 ?508次閱讀

    谷歌發(fā)布新型大語言模型Gemma 2

    在人工智能領域,大語言模型直是研究的熱點。近日,全球科技巨頭谷歌宣布,面向全球研究人員和開發(fā)人員
    的頭像 發(fā)表于 06-29 09:48 ?391次閱讀

    焊接質(zhì)量缺陷產(chǎn)生的主要原因

    創(chuàng)想焊縫跟蹤小編將與大家起探討焊接質(zhì)量缺陷產(chǎn)生的主要原因。 材料選擇不當 焊接質(zhì)量缺陷的主要原因之一是材料選擇不當。焊接材料包括焊條、電極、焊絲、焊劑等,如果選擇的焊接材料與基材不匹配,或者焊接材料的質(zhì)量
    的頭像 發(fā)表于 05-15 09:41 ?547次閱讀
    焊接質(zhì)量缺陷產(chǎn)生的<b class='flag-5'>主要原因</b>

    諧波引起電纜損壞的主要原因

    諧波是指在電力系統(tǒng)中出現(xiàn)的頻率為整數(shù)倍于基波頻率的波動現(xiàn)象。在電纜中傳輸?shù)碾娔苤?,諧波存在的情況是很常見的。然而,諧波也是導致電纜損壞的主要原因之一。
    的頭像 發(fā)表于 03-14 14:20 ?606次閱讀
    諧波引起電纜損壞的<b class='flag-5'>主要原因</b>

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開發(fā)的用于機器學習和人工智能的軟件框架,其中最著名的是TensorFlow。TensorFlow是
    的頭像 發(fā)表于 03-01 16:25 ?771次閱讀

    谷歌模型框架是什么?有哪些功能和應用?

    谷歌模型框架(Google Model Framework)并不是特定的框架,而是指谷歌開發(fā)的
    的頭像 發(fā)表于 02-29 18:11 ?1380次閱讀

    谷歌發(fā)布輕量級開源人工智能模型Gemma

    谷歌近日宣布推出開源人工智能(AI)模型系列Gemma,旨在為開發(fā)人員研究人員提供負責任的
    的頭像 發(fā)表于 02-23 11:38 ?775次閱讀

    谷歌宣布Gemma大模型全球開放使用

    使用標志著谷歌在AI領域的新里程碑,為全球的開發(fā)者、研究人員和企業(yè)提供強大的工具,以推動人工智能技術的進步和應用。
    的頭像 發(fā)表于 02-23 10:41 ?715次閱讀

    現(xiàn)代獨立顯卡電力消耗的主要原因

    現(xiàn)代獨立顯卡電力消耗的主要原因 近年來,隨著科技的不斷發(fā)展和人們對高畫質(zhì)游戲和圖形處理需求的增加,獨立顯卡已經(jīng)成為電腦的必備硬件之。然而,獨立顯卡的電力消耗問題也逐漸浮出水面。本文將詳細探討現(xiàn)代
    的頭像 發(fā)表于 01-09 13:52 ?484次閱讀

    【飛騰派4G版免費試用】仙女姐姐的嵌入式實驗室之五~LLaMA.cpp及3B“小模型”O(jiān)penBuddy-StableLM-3B

    訓練是MetaAI研究人員認為的種降低模型使用成本的方式。為了更好的效果,即便是LLaMA最小的70億參數(shù)的版本,其訓練使用的tokens數(shù)量也有1萬億(1 trillion to
    發(fā)表于 12-22 10:18

    LabVIEW進行癌癥預測模型研究

    效果。 LabVIEW在此研究中的應用展示其在處理復雜醫(yī)學數(shù)據(jù)和開發(fā)高效預測模型方面的獨特優(yōu)勢,特別是在癌癥早期診斷和治療策略的研究中。通過使用LabVIEW,
    發(fā)表于 12-13 19:04

    7種光纜故障的主要原因

    7種光纜故障的主要原因? 光纜故障是指光纜在傳輸信息過程中出現(xiàn)的問題,影響著光信號的傳輸質(zhì)量和速度。這些故障可能由多種原因引起,下面將詳細介紹7種光纜故障的主要原因。 1. 光纜折斷 光纜折斷是最
    的頭像 發(fā)表于 12-07 09:40 ?2157次閱讀

    為什么共模電流是EMI的主要原因

    為什么共模電流是EMI的主要原因
    的頭像 發(fā)表于 12-05 15:56 ?428次閱讀
    為什么共模電流是EMI的<b class='flag-5'>主要原因</b>