0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)算法的實(shí)現(xiàn)時(shí)所面臨的問(wèn)題及相關(guān)開(kāi)源軟件

如意 ? 來(lái)源:CSDN ? 作者:Soren Sonnenburg等 ? 2020-08-17 16:57 ? 次閱讀

開(kāi)源工具已經(jīng)趨于成熟,這使其能構(gòu)建大規(guī)模的自然場(chǎng)景下的系統(tǒng)。與此同時(shí),機(jī)器學(xué)習(xí)領(lǐng)域?yàn)楦鞣N應(yīng)用開(kāi)發(fā)了大量強(qiáng)大的學(xué)習(xí)算法。但是,由于沒(méi)有公開(kāi)共享現(xiàn)有的實(shí)現(xiàn)方式,去真正的利用這些方法,從而導(dǎo)致軟件的可用性和互操性較弱。

本文作者認(rèn)為,可以通過(guò)提高研究人員在源代碼模型下發(fā)布軟件的動(dòng)機(jī)來(lái)明顯改善這種情況。此外,本文概述了作者在嘗試發(fā)布機(jī)器學(xué)習(xí)算法的實(shí)現(xiàn)時(shí)所面臨的問(wèn)題。作者認(rèn)為,經(jīng)過(guò)同行評(píng)審的軟件資源以及簡(jiǎn)短的文檔對(duì)機(jī)器學(xué)習(xí)和整個(gè)科學(xué)界非常有價(jià)值。

概述

機(jī)器學(xué)習(xí)領(lǐng)域發(fā)展迅速,為不同的應(yīng)用提供了各種各樣的學(xué)習(xí)算法。這些算法的最終價(jià)值在很大程度上取決于它們?cè)诮鉀Q實(shí)際問(wèn)題中的成功。因此,將算法進(jìn)行復(fù)制并應(yīng)用于新任務(wù)對(duì)于該領(lǐng)域的進(jìn)步至關(guān)重要。

但是,目前很少有機(jī)器學(xué)習(xí)研究人員發(fā)布與其論文相關(guān)的軟件和/或源代碼。這與生物信息學(xué)界的做法形成了鮮明對(duì)比,后者的開(kāi)源軟件已經(jīng)成為進(jìn)一步研究的基礎(chǔ)。缺少公開(kāi)可用的算法實(shí)現(xiàn)是我們這一學(xué)科進(jìn)步的主要障礙。

我們相信,機(jī)器學(xué)習(xí)軟件的開(kāi)源共享可以在消除障礙方面發(fā)揮非常重要的作用。

開(kāi)源模型具有許多優(yōu)勢(shì),這些優(yōu)勢(shì)將帶來(lái)更好的實(shí)驗(yàn)結(jié)果重現(xiàn)性:更快地檢測(cè)錯(cuò)誤,創(chuàng)新性應(yīng)用以及在其他學(xué)科和行業(yè)中更快地采用機(jī)器學(xué)習(xí)方法。但是,目前缺乏完善和發(fā)布軟件的動(dòng)機(jī)。已發(fā)布的軟件本身在我們領(lǐng)域中沒(méi)有標(biāo)準(zhǔn)的,可接受的引用方式。

目前引用它的唯一方法是引用與代碼相關(guān)聯(lián)的論文,或者通過(guò)引用以某種技術(shù)報(bào)告的形式發(fā)布的用戶手冊(cè)。為了解決這一難題,本文提出了一種正式發(fā)布機(jī)器學(xué)習(xí)軟件的方法,類似于ACM Transactions on Mathematical Software提供的用于數(shù)值分析的方法。

注:本文作者隨后簡(jiǎn)要解釋了開(kāi)源軟件背后的思想,然后介紹了廣泛采用開(kāi)源的模型將產(chǎn)生的一些積極影響。接下來(lái),本文討論了當(dāng)前主要的阻礙,并提出可能的改變以改善這種情況。最后,作者為JMLR(JMLR-MLOSS)中的機(jī)器學(xué)習(xí)開(kāi)源軟件提出了一個(gè)新的、單獨(dú)的track。

開(kāi)源背后的思想

開(kāi)源軟件的基本思想非常簡(jiǎn)單;程序員或用戶可以閱讀,修改和重新分發(fā)軟件的源代碼。盡管有各種開(kāi)源軟件許可,但它們都有一個(gè)共同的出發(fā)點(diǎn),那就是允許自由交換和使用信息。開(kāi)源模型更注重貢獻(xiàn)者的協(xié)作。每個(gè)貢獻(xiàn)者都可以利用網(wǎng)絡(luò)中其他人所做的工作,從而最大程度地減少“重新造輪子”所花費(fèi)的時(shí)間。

開(kāi)源的軟件主要有下面的10個(gè)屬性:

1.免費(fèi)重新使用

2.源代碼

3.衍生作品

4.作者源代碼的完整性

5.不歧視個(gè)人或群體

6.不歧視工作領(lǐng)域

7.許可證的分配

8.許可不得用于特定產(chǎn)品

9.許可不得限制其他軟件

10.許可必須是技術(shù)中立的

開(kāi)源的積極影響

這一部分主要是簡(jiǎn)要概述開(kāi)源軟件及其與科學(xué)活動(dòng)(特別是機(jī)器學(xué)習(xí))的關(guān)系。讀者可能會(huì)認(rèn)為我們對(duì)開(kāi)源的好處過(guò)于樂(lè)觀,而沒(méi)有討論負(fù)面影響。事實(shí)是,要獲得專有系統(tǒng)與開(kāi)源軟件之間抄襲的確鑿證據(jù)是極其困難的。

本文從道德,倫理和社會(huì)基礎(chǔ)三個(gè)方面進(jìn)行闡釋,開(kāi)源應(yīng)該是機(jī)器學(xué)習(xí)研究的首選軟件發(fā)布選項(xiàng),并向讀者介紹開(kāi)源軟件的許多優(yōu)點(diǎn)。在這里,本文將重點(diǎn)放在用于機(jī)器學(xué)習(xí)研究的開(kāi)源軟件的特定優(yōu)勢(shì)上,該優(yōu)勢(shì)結(jié)合了科學(xué)進(jìn)步以及軟件生產(chǎn)者和消費(fèi)者的需求和要求。作者從以下7點(diǎn)說(shuō)明了開(kāi)源的優(yōu)勢(shì):

1.科學(xué)結(jié)果的可重復(fù)性和算法的合理比較;

2.發(fā)現(xiàn)問(wèn)題;

3.利用已有資源(而不是重新實(shí)現(xiàn));

4.不斷獲得科學(xué)的工具;

5.優(yōu)勢(shì)結(jié)合;

6.在不同學(xué)科和行業(yè)中更快地適用某方法;

7.出現(xiàn)協(xié)同標(biāo)準(zhǔn)。

最后,作者使用一個(gè)表格總結(jié)了開(kāi)源會(huì)帶來(lái)的優(yōu)點(diǎn),一共有11條,分別如下:

1.提高了科學(xué)研究的可復(fù)現(xiàn)性

2.有助于公平比較在相同框架中實(shí)施的算法

3.可以更快地發(fā)現(xiàn)問(wèn)題

4.可以修復(fù)bug和擴(kuò)展外部來(lái)源的錯(cuò)誤

5.方法可以被其他人更快地采用

6.可以使用高效的算法

7.能利用現(xiàn)有資源來(lái)幫助新研究

8.廣泛的使用算法會(huì)使其得到廣泛的認(rèn)可

9.可以開(kāi)發(fā)更復(fù)雜的機(jī)器學(xué)習(xí)算法

10.可以加速研究進(jìn)展

11.對(duì)新研究者和較小的研究小組非常有幫助

開(kāi)源社區(qū)當(dāng)前主要的障礙

盡管根據(jù)開(kāi)源模型發(fā)布實(shí)現(xiàn)方式具有許多優(yōu)點(diǎn),但是當(dāng)前很少采用此選項(xiàng)。作者認(rèn)為,有六個(gè)主要的原因,總結(jié)起來(lái)概括如下:

1、發(fā)布軟件不能夠被視為一種科學(xué)貢獻(xiàn)

2、公開(kāi)與商業(yè)利益存在根源上的沖突

3、發(fā)布開(kāi)源軟件的激勵(lì)措施沒(méi)有足夠高

4、機(jī)器學(xué)習(xí)研究人員不是一個(gè)優(yōu)秀的程序員

5、這種松懈能掩蓋新方法的問(wèn)題,并降低會(huì)議和期刊的接收難度

6、存在一種習(xí)慣,對(duì)質(zhì)量相似的論文采用相同的處理方法

建議

作者給出了提交高質(zhì)量機(jī)器學(xué)習(xí)開(kāi)源軟件實(shí)現(xiàn)的描述。提交的內(nèi)容至少應(yīng)包括:

1、一封書(shū)面信,說(shuō)明該提交內(nèi)容適用于機(jī)器學(xué)習(xí)開(kāi)源軟件部分,發(fā)布該軟件的開(kāi)源許可證,項(xiàng)目的網(wǎng)址以及要查看的軟件版本。

2、最多四頁(yè)基于JMLR格式的描述。

3、包含源代碼和文檔的zip或tar壓縮的歸檔文件。

結(jié)論

綜上,作者認(rèn)為,采用共享信息的開(kāi)源模型來(lái)實(shí)現(xiàn)機(jī)器學(xué)習(xí)軟件對(duì)整個(gè)領(lǐng)域都非常有幫助。開(kāi)源模型具有許多優(yōu)勢(shì),例如提高了實(shí)驗(yàn)結(jié)果的可重復(fù)性,更快地檢測(cè)錯(cuò)誤,加速科學(xué)進(jìn)步以及在其他學(xué)科和行業(yè)中更快地采用了機(jī)器學(xué)習(xí)方法。由于當(dāng)前發(fā)布開(kāi)源軟件的動(dòng)機(jī)不足,本文概述了一個(gè)發(fā)布用于機(jī)器學(xué)習(xí)的軟件平臺(tái)。

此外,本文討論了機(jī)器學(xué)習(xí)軟件的理想功能,這些功能最終將產(chǎn)生一個(gè)高度可用,靈活和可擴(kuò)展的軟件。本文邀請(qǐng)所有開(kāi)發(fā)機(jī)器學(xué)習(xí)算法的機(jī)器學(xué)習(xí)研究人員提交機(jī)器學(xué)習(xí)軟件的JMLR track。定義精心設(shè)計(jì)的界面對(duì)于提高交互操作至關(guān)重要,這將使社區(qū)能構(gòu)建一套高質(zhì)量的機(jī)器學(xué)習(xí)軟件。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4587

    瀏覽量

    92503
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46652

    瀏覽量

    237085
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8349

    瀏覽量

    132315
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    “0元購(gòu)”智元靈犀X1機(jī)器人,軟硬件全套圖紙和代碼全公開(kāi)!資料免費(fèi)下載!

    軟件算法代碼+高性能關(guān)節(jié)電機(jī),讓“人形機(jī)器人人人造”的理想真正成為現(xiàn)實(shí),不管是愛(ài)好者還是科技達(dá)人,都能夠迅速搭建機(jī)器人并實(shí)現(xiàn)基本的行走功能
    發(fā)表于 10-25 15:20

    基于機(jī)器學(xué)習(xí)的IWR6843AOP跌倒和姿態(tài)檢測(cè)實(shí)現(xiàn)

    電子發(fā)燒友網(wǎng)站提供《基于機(jī)器學(xué)習(xí)的IWR6843AOP跌倒和姿態(tài)檢測(cè)實(shí)現(xiàn).pdf》資料免費(fèi)下載
    發(fā)表于 09-03 10:02 ?1次下載
    基于<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的IWR6843AOP跌倒和姿態(tài)檢測(cè)<b class='flag-5'>實(shí)現(xiàn)</b>

    深度學(xué)習(xí)算法在嵌入式平臺(tái)上的部署

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)算法在各個(gè)領(lǐng)域的應(yīng)用日益廣泛。然而,將深度學(xué)習(xí)算法部署到資源受限的嵌入式平臺(tái)上,仍然是一個(gè)具有挑戰(zhàn)性的任務(wù)。本文將從嵌入式平臺(tái)的特點(diǎn)、深度
    的頭像 發(fā)表于 07-15 10:03 ?1097次閱讀

    利用Matlab函數(shù)實(shí)現(xiàn)深度學(xué)習(xí)算法

    在Matlab中實(shí)現(xiàn)深度學(xué)習(xí)算法是一個(gè)復(fù)雜但強(qiáng)大的過(guò)程,可以應(yīng)用于各種領(lǐng)域,如圖像識(shí)別、自然語(yǔ)言處理、時(shí)間序列預(yù)測(cè)等。這里,我將概述一個(gè)基本的流程,包括環(huán)境設(shè)置、數(shù)據(jù)準(zhǔn)備、模型設(shè)計(jì)、訓(xùn)練過(guò)程、以及測(cè)試和評(píng)估,并提供一個(gè)基于Mat
    的頭像 發(fā)表于 07-14 14:21 ?1795次閱讀

    開(kāi)啟開(kāi)源布道新篇章 — LF開(kāi)源軟件學(xué)園誠(chéng)邀開(kāi)源精英加入成為OSPO講師

    OSPO——企業(yè)開(kāi)源戰(zhàn)略的引擎在當(dāng)今數(shù)字化時(shí)代,開(kāi)源軟件已成為推動(dòng)全球技術(shù)創(chuàng)新的加速器。它不僅重塑了軟件開(kāi)發(fā)的模式,更成為企業(yè)構(gòu)建競(jìng)爭(zhēng)優(yōu)勢(shì)的關(guān)鍵。然而,隨著
    的頭像 發(fā)表于 07-04 08:36 ?259次閱讀
    開(kāi)啟<b class='flag-5'>開(kāi)源</b>布道新篇章 — LF<b class='flag-5'>開(kāi)源</b><b class='flag-5'>軟件</b>學(xué)園誠(chéng)邀<b class='flag-5'>開(kāi)源</b>精英加入成為OSPO講師

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支,其目標(biāo)是通過(guò)讓計(jì)算機(jī)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無(wú)需進(jìn)行明確的編程。本文將深入解讀幾種常見(jiàn)的機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-02 11:25 ?672次閱讀

    機(jī)器學(xué)習(xí)的經(jīng)典算法與應(yīng)用

    關(guān)于數(shù)據(jù)機(jī)器學(xué)習(xí)就是喂入算法和數(shù)據(jù),讓算法從數(shù)據(jù)中尋找一種相應(yīng)的關(guān)系。Iris鳶尾花數(shù)據(jù)集是一個(gè)經(jīng)典數(shù)據(jù)集,在統(tǒng)計(jì)學(xué)習(xí)
    的頭像 發(fā)表于 06-27 08:27 ?1545次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的經(jīng)典<b class='flag-5'>算法</b>與應(yīng)用

    機(jī)器學(xué)習(xí)8大調(diào)參技巧

    今天給大家一篇關(guān)于機(jī)器學(xué)習(xí)調(diào)參技巧的文章。超參數(shù)調(diào)優(yōu)是機(jī)器學(xué)習(xí)例程中的基本步驟之一。該方法也稱為超參數(shù)優(yōu)化,需要搜索超參數(shù)的最佳配置以實(shí)現(xiàn)
    的頭像 發(fā)表于 03-23 08:26 ?550次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>8大調(diào)參技巧

    人工智能和機(jī)器學(xué)習(xí)的頂級(jí)開(kāi)發(fā)板有哪些?

    機(jī)器學(xué)習(xí)(ML)和人工智能(AI)不再局限于高端服務(wù)器或云平臺(tái)。得益于集成電路(IC)和軟件技術(shù)的新發(fā)展,在微型控制器和微型計(jì)算機(jī)上實(shí)現(xiàn)機(jī)器
    的頭像 發(fā)表于 02-29 18:59 ?723次閱讀
    人工智能和<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的頂級(jí)開(kāi)發(fā)板有哪些?

    AI算法的本質(zhì)是模擬人類智能,讓機(jī)器實(shí)現(xiàn)智能化

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)AI算法是人工智能領(lǐng)域中使用的算法,用于模擬、延伸和擴(kuò)展人的智能。這些算法可以通過(guò)機(jī)器學(xué)習(xí)、深度
    的頭像 發(fā)表于 02-07 00:07 ?5535次閱讀

    機(jī)器視覺(jué)軟件有哪些 機(jī)器視覺(jué)軟件的優(yōu)點(diǎn)

    機(jī)器視覺(jué)軟件是一種利用計(jì)算機(jī)視覺(jué)技術(shù)來(lái)模擬和彌補(bǔ)人眼視覺(jué)功能的軟件系統(tǒng)。它可以通過(guò)對(duì)圖像和視頻進(jìn)行分析,識(shí)別和理解目標(biāo)物體,以實(shí)現(xiàn)自動(dòng)化和智能化的任務(wù)。
    的頭像 發(fā)表于 02-02 10:53 ?1426次閱讀

    開(kāi)源項(xiàng)目!教你如何復(fù)刻自平衡賽車機(jī)器人、智能家居中控、競(jìng)技機(jī)器人先進(jìn)模糊控制器等

    開(kāi)源項(xiàng)目作品 為了方便大家更好提升自己,電子發(fā)燒友小編為大家整理了一些工程師大佬設(shè)計(jì)的開(kāi)源項(xiàng)目作品,供大家可以參考學(xué)習(xí),希望對(duì)廣大工程師有所幫助。 1.用全志R128復(fù)刻自平衡賽車機(jī)器
    發(fā)表于 12-26 09:17

    開(kāi)源作品!稚暉君超迷你低成本開(kāi)發(fā)板、超酷機(jī)器人、智能手環(huán)等參考方案

    開(kāi)源項(xiàng)目作品秀 為了方便大家更好提升自己,電子發(fā)燒友小編為大家整理了一些工程師大佬設(shè)計(jì)的開(kāi)源項(xiàng)目作品,供大家可以參考學(xué)習(xí),希望對(duì)廣大工程師有所幫助。 1.基于NRF51822的開(kāi)源
    發(fā)表于 12-12 10:28

    解鎖未來(lái)軟件安全的利器——華為云 CodeArts 開(kāi)源治理服務(wù)

    在當(dāng)今數(shù)字化時(shí)代,軟件安全問(wèn)題愈發(fā)突顯,而開(kāi)源軟件的廣泛應(yīng)用更是為安全挑戰(zhàn)蒙上了一層陰影。開(kāi)源軟件漏洞的逐年增多成為
    的頭像 發(fā)表于 12-10 21:01 ?877次閱讀
    解鎖未來(lái)<b class='flag-5'>軟件</b>安全的利器——華為云 CodeArts <b class='flag-5'>開(kāi)源</b>治理服務(wù)