0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Reddit上掀起機(jī)器學(xué)習(xí)論文也要實(shí)行“預(yù)注冊”的大討論

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-10-27 09:57 ? 次閱讀

近日,關(guān)于“預(yù)注冊”(Pre-registered)的研究方式在Reddit論壇上引發(fā)了熱烈討論?!邦A(yù)注冊”是先向期刊提交理論研究和實(shí)驗(yàn)設(shè)計(jì)方案,在評審并接受后,再展開進(jìn)一步工作的一種方式。Reddit用戶呼吁在機(jī)器學(xué)習(xí)領(lǐng)域中也采用這種方式,引發(fā)了網(wǎng)友們的熱議。

所謂“預(yù)注冊”研究,通俗點(diǎn)說就是,在實(shí)際著手開始研究之前,先將研究假設(shè)和實(shí)驗(yàn)設(shè)計(jì)方案等前期重要信息,向欲投稿的學(xué)術(shù)期刊進(jìn)行事先注冊,由期刊先行組織專家進(jìn)行同行評議。

如果評議通過,則期刊一般原則性承諾同意發(fā)表。然后再進(jìn)入正式研究和論文撰寫、投稿等后續(xù)環(huán)節(jié)。

顯然,這一方式與現(xiàn)行的研究和論文發(fā)表流程有很大不同。

英國卡迪夫大學(xué)的研究人員特別對“預(yù)注冊”制度及其影響做了首次分析研究。

研究結(jié)果表明,采用這種模式,最終產(chǎn)生無效結(jié)果(即研究結(jié)果無法證明假設(shè))的情形會大大增高,尤其是在心理學(xué)領(lǐng)域。這表明“預(yù)注冊”制度對一些“削足適履”的假結(jié)果起到了明顯的過濾作用。

傳統(tǒng)研究流程中,研究人員為了獲得“優(yōu)質(zhì)結(jié)果”,易產(chǎn)生發(fā)表偏見、p值作弊、可重復(fù)性低的嚴(yán)重問題

于是,Reddit上今天也掀起機(jī)器學(xué)習(xí)論文也要實(shí)行“預(yù)注冊”的大討論。

預(yù)注冊有多好?能夠避免“發(fā)表偏見”

研究人員指出,在傳統(tǒng)的提出假設(shè)——設(shè)計(jì)實(shí)驗(yàn)——驗(yàn)證結(jié)果——投稿發(fā)表的研究流程中,研究人員容易為獲得正面結(jié)果而產(chǎn)生“發(fā)表偏見”,可能會對不利于證明研究假設(shè)的結(jié)論有意隱瞞,甚至對數(shù)據(jù)進(jìn)行篡改等造假作弊手段。

他們認(rèn)為,在進(jìn)行研究之前記錄下研究假設(shè)和實(shí)驗(yàn)方案,確實(shí)可以取得預(yù)期的結(jié)果,能夠減少為獲得正面結(jié)果而產(chǎn)生的“發(fā)表偏見”。

日前,《Nature》網(wǎng)站也撰文稱,“預(yù)注冊”制度確實(shí)可以起到預(yù)期的“去偽存真”的作用,提高科學(xué)研究的可信度和可重復(fù)性。

在開始收集數(shù)據(jù)之前,先將研究方案進(jìn)行登記和記錄,可能會改變研究結(jié)果。圖片來源:Ariana Lindquist / Bloomberg / Getty

文中提到,沒有獲得正面結(jié)果的研究往往被歸檔,從此不見天日,這會導(dǎo)致為獲取正面結(jié)果而產(chǎn)生的“發(fā)表偏見”,損害科學(xué)文獻(xiàn)的可信度。

現(xiàn)有分析表明,在進(jìn)行研究之前,對研究方案進(jìn)行登記和同行評議,可以改善這個問題,并有助于糾正為獲取正面結(jié)果而產(chǎn)生的發(fā)表偏見問題。

來自英國卡迪夫大學(xué)的研究人員稱,他們的這一研究是對“預(yù)注冊”研究方式是否有效的第一次分析。結(jié)果發(fā)現(xiàn),事先將研究方案進(jìn)行登記的研究更有可能報告無效的結(jié)果。該分析于10月17日發(fā)表在PsyArXiv資源庫上。

預(yù)注冊去偽存真:真的能提高研究結(jié)果質(zhì)量

在“預(yù)注冊”制度下,研究人員需要在研究開始前就向相應(yīng)期刊提交研究方案。如果研究方案通過了同行評議,該期刊會暫時承諾在研究完成時將論文發(fā)表,無論研究結(jié)果如何。

這種做法在過去幾年中已經(jīng)開始在科學(xué)界出現(xiàn),這一制度起源于美國法律強(qiáng)制要求的臨床試驗(yàn)中的“預(yù)登記”制度。目前約有140種期刊使用這種方式,有130份進(jìn)行預(yù)注冊的研究報告,其最終研究結(jié)果已經(jīng)發(fā)表。

“預(yù)注冊”制度的支持者希望,該方式能夠打擊那些可疑的研究活動,比如先看結(jié)果,或根本不報告負(fù)面結(jié)果,然后再回頭提出研究假設(shè)。

為了考察“預(yù)注冊”方式是否會增加研究報告無效結(jié)果的頻率,心理學(xué)家Chris Allen和David Mehler分析了生物醫(yī)學(xué)和心理學(xué)中113份預(yù)登記報告的結(jié)果。

在這些研究中,他們考察了296個彼此獨(dú)立的研究假設(shè),結(jié)果發(fā)現(xiàn),總體而言,這些研究后來發(fā)表的結(jié)果中,有61%不支持最初的假設(shè)。對于考察可重復(fù)性研究的驗(yàn)證研究,這個數(shù)字比例要更高一些,為66%,對于原始研究,這一比例為55%。

來源:PsyArXiv,https://psyarxiv.com/3czyt(2018)。

這些數(shù)字遠(yuǎn)遠(yuǎn)高于一般科學(xué)文獻(xiàn)中提出的無效結(jié)果的比例,以前的研究表明,研究人員估計(jì)該比例在5%到20%之間。

預(yù)注冊報告的數(shù)量呈指數(shù)級增長,但研究的代表性還有待提升

不過,荷蘭埃因霍溫科技大學(xué)的心理學(xué)研究人員Anne Scheel表示,這項(xiàng)研究可能仍然低估了無效研究結(jié)果的真實(shí)比例。

據(jù)其他研究估計(jì),在心理學(xué)中測試中的假設(shè)實(shí)際上為假的比例可能高達(dá)90%,Scheel說。這表明當(dāng)前科學(xué)文獻(xiàn)中的實(shí)際上的無效結(jié)果“與我們期望中不存在任何發(fā)表偏見的情況”大不相同。

她表示,這一分析是探索性的,而且研究結(jié)果也可以有其他解釋。

比如Scheel說,由于采用“預(yù)注冊”可以或多或少地保證論文發(fā)表,人們可能會策略性地使用這種制度,提出一些預(yù)期可能無法通過驗(yàn)證的研究假設(shè)。

她補(bǔ)充說,“預(yù)注冊”制度誕生不久,有可能迄今為止發(fā)表的研究并不能更廣泛地代表心理學(xué)領(lǐng)域的情況。 “目前還有很多未知因素,”Scheel說。 “但對于科學(xué)家來說,這也是一個非常激動人心的時刻。”

目前,預(yù)注冊報告的數(shù)量正呈指數(shù)級增長,Allen現(xiàn)在希望能夠進(jìn)行樣本量更大的另一項(xiàng)研究,以便回答之前研究提出的一些問題,而且計(jì)劃將這項(xiàng)研究也進(jìn)行“預(yù)注冊”。

Reddit呼吁ML中采用“預(yù)注冊”:無效結(jié)果會比其他領(lǐng)域有用得多

Reddit上便有位用戶拋出了一個討論:

若是能在機(jī)器學(xué)習(xí)領(lǐng)域中召開預(yù)登記實(shí)驗(yàn)的會議/期刊就好了。你只要提交理論部分的論文以及實(shí)驗(yàn)的設(shè)計(jì),然后讓評審們進(jìn)行評估,若是他們覺得OK,你再繼續(xù)做實(shí)驗(yàn)。而且,無論實(shí)驗(yàn)結(jié)果如何,這篇論文都算是被接受了。

此貼一出,便得到了眾多網(wǎng)友的圍觀與評論,網(wǎng)友Flag_Red評論到:

目前很多機(jī)器學(xué)習(xí)的研究都屬于工程學(xué),我覺得在這種情況下,無效結(jié)果會比其他領(lǐng)域有用得多。我認(rèn)為這主要?dú)w結(jié)于機(jī)器學(xué)習(xí)在工程方面要比理論方面超前很多。

在其他領(lǐng)域中,他們會說:“這是我的假設(shè)”,然后再對其進(jìn)行測試。若結(jié)果無效,仍然是一件非常有意思的事情,“我的假設(shè)”本應(yīng)該有效,卻不知什么原因變得無效了。

然而,在機(jī)器學(xué)習(xí)中,幾乎沒有人在測試假設(shè)之前就說,“我認(rèn)為這將會因?yàn)槟衬吃蚨鹱饔谩?。許多的發(fā)現(xiàn)都是來自簡單的實(shí)驗(yàn)。

如果我們能在ML學(xué)術(shù)界培養(yǎng)一種更傳統(tǒng)的科學(xué)文化,那么發(fā)表無效結(jié)果論文數(shù)的增加,也未嘗不是一件好事。但就目前的狀況而言,我認(rèn)為并不會有多大幫助。

另一位網(wǎng)友表示:

這可能為時過早。無效結(jié)果在物理學(xué)領(lǐng)域中非常有用,并且具有完善的理論框架。

現(xiàn)在大多數(shù)的深度學(xué)習(xí)是由研究生根據(jù)直覺和實(shí)證結(jié)果結(jié)合在一起的。 無效結(jié)果可能是一個很好的啟發(fā)式方法,但如果沒有一個堅(jiān)實(shí)的理論框架,這個假設(shè)期刊中的信噪比會非常高。

當(dāng)然,這甚至還沒有解決大規(guī)模超參數(shù)搜索和隨機(jī)初始化的問題,我認(rèn)為這才是真正的問題。你的方法失敗是因?yàn)槟愕脑几拍畈唤∪?,還是因?yàn)槟銦o法找到超參數(shù)和/或隨機(jī)初始化的正確組合呢?

那么對于在機(jī)器學(xué)習(xí)領(lǐng)域也采用“預(yù)注冊”制度,你怎么看呢?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8306

    瀏覽量

    131855
  • Reddit
    +關(guān)注

    關(guān)注

    0

    文章

    32

    瀏覽量

    5285

原文標(biāo)題:機(jī)器學(xué)習(xí)論文呼吁“預(yù)注冊”,事先評審專治“注水研究”!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    蘋果揭示AI新動向:Apple Intelligence模型在谷歌云端芯片預(yù)訓(xùn)練

    蘋果公司在最新的技術(shù)論文中披露了一項(xiàng)重要信息,其全新的人工智能系統(tǒng)Apple Intelligence所依賴的模型并非傳統(tǒng)大型科技公司首選的NVIDIA GPU,而是選擇了在谷歌設(shè)計(jì)的云端芯片上進(jìn)行預(yù)訓(xùn)練。這一決定不僅打破了行
    的頭像 發(fā)表于 07-30 15:00 ?391次閱讀

    預(yù)訓(xùn)練和遷移學(xué)習(xí)的區(qū)別和聯(lián)系

    預(yù)訓(xùn)練和遷移學(xué)習(xí)是深度學(xué)習(xí)機(jī)器學(xué)習(xí)領(lǐng)域中的兩個重要概念,它們在提高模型性能、減少訓(xùn)練時間和降低對數(shù)據(jù)量的需求方面發(fā)揮著關(guān)鍵作用。本文將從定
    的頭像 發(fā)表于 07-11 10:12 ?365次閱讀

    預(yù)訓(xùn)練模型的基本原理和應(yīng)用

    預(yù)訓(xùn)練模型(Pre-trained Model)是深度學(xué)習(xí)機(jī)器學(xué)習(xí)領(lǐng)域中的一個重要概念,尤其是在自然語言處理(NLP)和計(jì)算機(jī)視覺(CV)等領(lǐng)域中得到了廣泛應(yīng)用。
    的頭像 發(fā)表于 07-03 18:20 ?1445次閱讀

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個重要分支,其目標(biāo)是通過讓計(jì)算機(jī)自動從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無需進(jìn)行明確的編程。本文將深入解讀幾種常見的機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-02 11:25 ?401次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動力。它們各自以其獨(dú)特的方式推動著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?633次閱讀

    OpenAI與Reddit達(dá)成合作,共同推進(jìn)AI技術(shù)發(fā)展

    近日,OpenAI與知名社交媒體平臺Reddit宣布構(gòu)建全新合作伙伴關(guān)系,旨在將Reddit的內(nèi)容引入OpenAI的ChatGPT中。
    的頭像 發(fā)表于 05-20 09:36 ?294次閱讀

    OpenAI與Reddit建立合作伙伴關(guān)系

    近日,OpenAI與知名社交網(wǎng)絡(luò)Reddit宣布建立合作伙伴關(guān)系,共同推動人工智能技術(shù)在社交網(wǎng)絡(luò)領(lǐng)域的應(yīng)用。根據(jù)周四發(fā)布的聯(lián)合聲明,OpenAI將把Reddit的內(nèi)容引入其聊天機(jī)器人ChatGPT及其他產(chǎn)品中,增強(qiáng)對最新話題的理
    的頭像 發(fā)表于 05-17 11:45 ?387次閱讀

    Reddit與OpenAI達(dá)成合作,引入問答內(nèi)容及AI功能

    消息指出,Reddit 與 OpenAI今日宣布建立“戰(zhàn)略聯(lián)盟”,共同推動Reddit問答內(nèi)容在OpenAI旗下產(chǎn)品中的應(yīng)用,OpenAI亦將成為Reddit的廣告合作商。
    的頭像 發(fā)表于 05-17 10:58 ?215次閱讀

    【大語言模型:原理與工程實(shí)踐】大語言模型的預(yù)訓(xùn)練

    大語言模型的核心特點(diǎn)在于其龐大的參數(shù)量,這賦予了模型強(qiáng)大的學(xué)習(xí)容量,使其無需依賴微調(diào)即可適應(yīng)各種下游任務(wù),而更傾向于培養(yǎng)通用的處理能力。然而,隨著學(xué)習(xí)容量的增加,對預(yù)訓(xùn)練數(shù)據(jù)的需求也相應(yīng)
    發(fā)表于 05-07 17:10

    Reddit擬赴紐交所首次公開發(fā)行股票,CEO關(guān)注平臺數(shù)據(jù)和

     按注冊聲明,Reddit擁有超過10萬個活躍社群,每日活躍用戶數(shù)達(dá)7300萬/每周活躍用戶數(shù)達(dá)2.67億,用戶總發(fā)帖量十億,2023年度營收高達(dá)8.04億美元,但其中廣告收入占比頗重,凈虧損額則達(dá)9080萬美元。
    的頭像 發(fā)表于 02-23 14:26 ?490次閱讀

    消息稱Reddit與谷歌達(dá)成協(xié)議

    近日,知名社交媒體平臺Reddit宣布與全球科技巨頭谷歌達(dá)成一項(xiàng)價值約6000萬美元的合作協(xié)議。根據(jù)協(xié)議內(nèi)容,谷歌將獲得使用Reddit發(fā)表的帖子來訓(xùn)練其人工智能模型的權(quán)限,旨在改進(jìn)谷歌搜索和其他
    的頭像 發(fā)表于 02-23 11:12 ?575次閱讀

    如何使用TensorFlow構(gòu)建機(jī)器學(xué)習(xí)模型

    在這篇文章中,我將逐步講解如何使用 TensorFlow 創(chuàng)建一個簡單的機(jī)器學(xué)習(xí)模型。
    的頭像 發(fā)表于 01-08 09:25 ?808次閱讀
    如何使用TensorFlow構(gòu)建<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>模型

    MAC地址注冊的原理和應(yīng)用

    MAC地址注冊是指在網(wǎng)絡(luò)設(shè)備中,將設(shè)備的物理地址(即MAC地址)與設(shè)備的IP地址進(jìn)行關(guān)聯(lián)和注冊的過程。MAC地址是以太網(wǎng)卡硬件的獨(dú)特標(biāo)識符,用于在局域網(wǎng)中標(biāo)識網(wǎng)絡(luò)設(shè)備。MAC地址注冊
    的頭像 發(fā)表于 11-13 16:07 ?828次閱讀
    MAC地址<b class='flag-5'>注冊</b>的原理和應(yīng)用

    代碼規(guī)范化如何學(xué)習(xí),單片機(jī)也要求規(guī)范化嗎?

    代碼規(guī)范化如何學(xué)習(xí),單片機(jī)也要求規(guī)范化么?
    發(fā)表于 10-12 07:19

    機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘方法和應(yīng)用

    機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘方法和應(yīng)用(經(jīng)典)
    發(fā)表于 09-26 07:56