0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

非技術(shù)專家如何利用機(jī)器學(xué)習(xí)解決問題?

電子工程師 ? 來源:lp ? 2019-03-05 17:11 ? 次閱讀

機(jī)器學(xué)習(xí)是現(xiàn)在大家都打了雞血想用的技術(shù)。

但是,多數(shù)人認(rèn)為只有那些懂技術(shù)的專家才能用好它。其實(shí),現(xiàn)在機(jī)器學(xué)習(xí)已經(jīng)集成到了各個領(lǐng)域,并且對用戶非常友好。一些非技術(shù)的小白完全能夠使用現(xiàn)成的軟件解決自己領(lǐng)域的專業(yè)問題。

這次,我們?yōu)榇蠹規(guī)砹薌oogle研究主管 Peter Norvig在O'Reilly和Intel共同舉辦的AI Conference舊金山站所做的演講——《AI的應(yīng)用廣度:正在擴(kuò)展中》,來看看那些非計(jì)算機(jī)領(lǐng)域的專家如何利用機(jī)器學(xué)習(xí)解決問題。

首先講一個熟悉的故事,這個故事是關(guān)于人工智能和機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展的,具體來說時候發(fā)生在2010年。

那時理論學(xué)家,數(shù)學(xué)家,和計(jì)算機(jī)科學(xué)家開始重新關(guān)注神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)技術(shù),并且在這些方面取得了一些進(jìn)展,并且讓一些應(yīng)用的性能有了很高的提升。

就拿熟悉的計(jì)算機(jī)視覺來說,2010年ImageNet比賽的競賽成績和錯誤率,已經(jīng)取得不錯的成績,而且在那之后我們很快達(dá)到并且超過人類水平。

在自然語言方面我們也有相似的故事,上圖里表示的是我們在機(jī)器翻譯方面的進(jìn)展,縱軸是翻譯質(zhì)量,越高代表結(jié)果越好,橫軸代表不同語言的翻譯任務(wù)。藍(lán)色是傳統(tǒng)統(tǒng)計(jì)模型的最好成績,綠色是新一代的端到端神經(jīng)網(wǎng)絡(luò)模型。

注:端到端指的是輸入是原始數(shù)據(jù),輸出是最后的結(jié)果,特征提取這一步融入到算法當(dāng)中,不需要人為干預(yù)。

通過這兩個“故事”,我們可以知道傳統(tǒng)模型和人類間的差距,已經(jīng)被新一代技術(shù)追上了一半甚至90%,可以說機(jī)器翻譯幾乎已經(jīng)發(fā)展到人類翻譯的水平了。

技術(shù)進(jìn)步的背后

對于這些偉大的技術(shù)突破,我們要感謝人工智能領(lǐng)域內(nèi)的幾位大師,比如Feifei,Jeff和Quoc 等。他們已經(jīng)在相關(guān)領(lǐng)域鉆研多年,提出創(chuàng)新的理論并把這些創(chuàng)新應(yīng)用到實(shí)踐。

同時另外一些專家也在這方面做出了貢獻(xiàn)。Bengio說: 哎 我覺得激活方程不應(yīng)該這么彎彎曲曲的,我覺得它應(yīng)該是條直線。Goodfellow說:我們不應(yīng)該只訓(xùn)練一個網(wǎng)絡(luò),我們應(yīng)該同時訓(xùn)練兩個然后讓他們倆打架。然后Sergey說:我們不應(yīng)該只隨機(jī)打亂數(shù)據(jù)一次,因?yàn)槲覀冇锌梢圆⑿杏?jì)算的機(jī)器,我們應(yīng)該優(yōu)化數(shù)據(jù)隨機(jī)化方式,我們把各種技術(shù)都融合在一起。

正是因?yàn)檫@些學(xué)者的努力,才能建立了我們今天的機(jī)制,才達(dá)到了今天取得的技術(shù)進(jìn)展。

非專家也能用機(jī)器學(xué)習(xí)解決問題

我們現(xiàn)在更需要的是各個領(lǐng)域的從業(yè)者主動參與進(jìn)來。雖然我們不是機(jī)器學(xué)習(xí)專家,但是我們知道該如何解決我們領(lǐng)域中需要解決的問題。

可能你的疑問是機(jī)器學(xué)習(xí)工具能幫助我們解決這些問題么?下面有幾個很棒的案例將會回答你。

機(jī)器學(xué)習(xí)破解引力透鏡效應(yīng)

斯坦福大學(xué)的一些天體物理學(xué)家希望探索引力透鏡效應(yīng)。

引力透鏡效應(yīng):愛因斯坦的廣義相對論所預(yù)言的一種現(xiàn)象。由于時空在大質(zhì)量天體附近會發(fā)生畸變,使得光線經(jīng)過大質(zhì)量天體附近時發(fā)生彎曲。如果在觀測者到光源的直線上有一個大質(zhì)量的天體,則觀測者會看到由于光線彎曲而形成的一個或多個像,這種現(xiàn)象稱之為引力透鏡現(xiàn)象。

如果我們能弄清楚這個過程,我們就完全可以測量出第二個星系的質(zhì)量,甚至能幫助我們研究更有趣的事情,比如暗物質(zhì)等等。

一直以來物理學(xué)家是這么解決這個問題的呢?通過光向前傳播的物理公式,如果我們也知道這些星系的質(zhì)量,我們就可以用超級計(jì)算機(jī)來模擬出這些光到達(dá)地球時的樣子,然后我們比較模擬結(jié)果和望遠(yuǎn)鏡觀測到的真實(shí)結(jié)果。如果這兩個結(jié)果有差異,我們就回去把星系質(zhì)量的參數(shù)調(diào)整一下。但是這個過程非常容易出錯。

顯然機(jī)器學(xué)習(xí)技術(shù)能夠求微分,并且可以從模型的結(jié)果反向推導(dǎo)出模型的參數(shù),如果從光線的結(jié)果出發(fā)來反向推導(dǎo),機(jī)器學(xué)習(xí)技術(shù)似乎能幫助我們解決引力透鏡效應(yīng)。

幾個月后這些物理學(xué)家成功地完成了這項(xiàng)工作,新模型的計(jì)算效率比傳統(tǒng)方法要快一千萬倍。這可以說是個很大的進(jìn)展。

深度學(xué)習(xí)能夠回溯數(shù)據(jù),揭露以往未被發(fā)現(xiàn)的行星

科學(xué)家們試圖用開普勒望遠(yuǎn)鏡尋找系外行星。當(dāng)行星圍繞恒星運(yùn)行時,一顆行星圍繞著另一顆恒星運(yùn)行,就形成了光蝕(類似月蝕),來自恒星的光線也就減弱了。如果這個行星夠大,接近太陽大小,它會遮擋掉大量的光線。我們也就能探測到它了,實(shí)際上,我們也就是這么找星星的,并且使用這種方法我們發(fā)現(xiàn)了前幾百顆太陽系外的行星。

但是一旦我們挖掘了所有這些數(shù)據(jù),我們可能知道的更多,例如隱藏在太陽系外的小行星還有多少。這種情況下,傳統(tǒng)的統(tǒng)計(jì)模型精度就不夠了。需要更精確的模型去探測星空中的其他事情。恒星發(fā)出的光線有變化嗎?中間是否有一個小行星場呢?將深度學(xué)習(xí)應(yīng)用到這個場景中,我們可以回溯數(shù)據(jù),揭露以往未被發(fā)現(xiàn)的行星。

預(yù)測植物是否得病

對于有些人,你甚至都不用太多的背景知識,就可以通過機(jī)器學(xué)習(xí)直接解決這些問題。這些技術(shù)不僅可用于人,也可以用于植物。對于熱帶木薯植物,它們?nèi)菀谆几鞣N疾病,如果你是個有經(jīng)驗(yàn)的農(nóng)民,你大概知道出現(xiàn)上圖這種棕色的東西意味著植物得了這種疾病。

因?yàn)槲覀冃枰皶r治療這些植物,但不是所有農(nóng)民都那么有經(jīng)驗(yàn)呀。而且,隨著氣候變化,又出現(xiàn)了新的疾病類型。因此在AI時代,農(nóng)民可以通過手機(jī)給植物拍照上傳到云實(shí)時獲取植物的診斷結(jié)果。

視頻自動生成字幕

另外還有視頻自動生成字幕的案例,從某種意義上說,這只是語音識別,但是由于某些原因,它們也不完全相同,對于語音識別當(dāng)你對著麥克風(fēng)說話時,一次只有一個說話人。而字幕生成時,有不同的聲音在響,像撞車聲啊,爆炸聲啊,等等這些。

而字幕生成的任務(wù)也不僅僅是把視頻中的聽到的詞語組合在一起,你得判斷出哪些是需要出現(xiàn)在字幕中的詞語。哪些是應(yīng)該忽略的詞語,你還得考慮何時需要加上一些備注。比如用括弧添加“音樂響起”之類的說明??梢姡帜簧墒潜戎v話識別復(fù)雜得多的問題。而這類問題正是機(jī)器學(xué)習(xí)的用武之地。機(jī)器學(xué)習(xí)可以告訴你:雖然無法提前預(yù)知要發(fā)生的一切,但根據(jù)以往的案例,我們?nèi)匀挥锌赡茏龀瞿承┡袛唷?/p>

拍照不再依賴專業(yè)的相機(jī)

很多人喜歡用專業(yè)的相機(jī)來拍照,不僅是因?yàn)楦逦?,而且專業(yè)相機(jī)的鏡頭可以把背景虛化,拍出的照片更加有美感。

機(jī)器學(xué)習(xí)背景下,軟件做到這一點(diǎn)。雖然我們不能用軟件處理相機(jī)上的鏡頭,但我們可以剖析一張圖片,找到前景是什么,背景又是什么,然后將背景進(jìn)行適度的虛化,上圖展示的每一張圖片,都顯示了機(jī)器學(xué)習(xí)能做的工作。

分析偏見

偏見普遍存在,例如性別偏見和社會上的各種其他偏見。最明顯體現(xiàn)在電影當(dāng)中。在電影中我們可以剖析每部電影的角色畫面時間和角色發(fā)聲時間,然后用機(jī)器學(xué)習(xí)技術(shù)自動分析,誰在畫面當(dāng)中,在做什么,誰是主要角色,誰是發(fā)聲的角色等等

然后可以展示數(shù)據(jù),結(jié)果可能稍微有點(diǎn)復(fù)雜,不過基本上數(shù)據(jù)確實(shí)顯示偏見的存在

當(dāng)女性做電影主角的時候,她的畫面時間要多于男性角色,但只多一點(diǎn)。而當(dāng)男性做主角的時候他們的畫面時間要多得多,這說明偏見確實(shí)存在。

機(jī)器學(xué)習(xí)大幅度提高工作效率

上面的例子說明:機(jī)器學(xué)習(xí)用數(shù)據(jù)能夠告訴我們很多,但并不是機(jī)器學(xué)習(xí)專家才能使用。只要有一個想要探索的目標(biāo)和探索的方向,并且想要簡單的過程,想要直接告訴技術(shù)人員,希望他們當(dāng)天提供分析的結(jié)果,而不是進(jìn)行復(fù)雜建模然后在一年以后給出答案,機(jī)器學(xué)習(xí)顯然能夠幫大忙。

作為實(shí)踐者我們可以說,我們不需要在每個環(huán)節(jié)都咨詢專家,我們可以提出任何想要解決的問題,使用更快、更好、更經(jīng)濟(jì)和更新的方法,利用機(jī)器學(xué)習(xí)的各種應(yīng)用來解決這些問題。因?yàn)闄C(jī)器學(xué)習(xí)現(xiàn)在已經(jīng)給我們提供了可以輕松使用的工具。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:Google研究主管:非技術(shù)專家如何利用機(jī)器學(xué)習(xí)解決問題

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    專家的人工智能、機(jī)器學(xué)習(xí)預(yù)測與看法

    在上周舉辦的硅谷論壇(Silicon Valley Forum; SVForum)會議上,業(yè)界專家針對未來的人工智能(AI)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)發(fā)表預(yù)測與看法。
    發(fā)表于 12-15 10:51 ?992次閱讀

    教你如何利用二位交互圖理解機(jī)器學(xué)習(xí)

    其實(shí)機(jī)器學(xué)習(xí)的基本算法都很簡單,下面我們就利用二維數(shù)據(jù)和交互圖形來看看機(jī)器學(xué)習(xí)中的一些基本算法以及它們的原理。
    的頭像 發(fā)表于 11-11 08:29 ?5415次閱讀
    教你如何<b class='flag-5'>利用</b>二位交互圖理解<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>

    【下載】《機(jī)器學(xué)習(xí)》+《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》

    、謀發(fā)展的決定性手段,這使得這一過去為分析師和數(shù)學(xué)家所專屬的研究領(lǐng)域越來越為人們所矚目。本書第一部分主要介紹機(jī)器學(xué)習(xí)基礎(chǔ),以及如何利用算法進(jìn)行分類,并逐步介紹了多種經(jīng)典的監(jiān)督學(xué)習(xí)算法,
    發(fā)表于 06-01 15:49

    射頻頻譜+機(jī)器學(xué)習(xí)=無線電技術(shù)新浪潮

    [據(jù)DARPA官網(wǎng)2017年8月11日報(bào)道]為解決無線電頻譜擁擠日益嚴(yán)重的問題,美國設(shè)立新項(xiàng)目檢驗(yàn)先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)如何輔助理解擁擠頻譜上的所有信號。在機(jī)器
    發(fā)表于 09-02 09:04

    MATLAB機(jī)器學(xué)習(xí)與深度學(xué)習(xí)核心技術(shù)應(yīng)用培訓(xùn)班

    MATLAB機(jī)器學(xué)習(xí)與深度學(xué)習(xí)核心技術(shù)應(yīng)用培訓(xùn)班備十余年MATLAB編程開發(fā)經(jīng)驗(yàn),機(jī)器學(xué)習(xí)、深度
    發(fā)表于 10-23 16:51

    大數(shù)據(jù)技術(shù)專家學(xué)習(xí)歷程分享

    從小白到大數(shù)據(jù)技術(shù)專家學(xué)習(xí)歷程,你準(zhǔn)備好了嗎
    發(fā)表于 04-22 14:37

    機(jī)器技術(shù)機(jī)器學(xué)習(xí)

    機(jī)器技術(shù)機(jī)器學(xué)習(xí)正成為嵌入式系統(tǒng)硬件和軟件供應(yīng)商的下一個重大事件。嵌入式系統(tǒng)可以通過網(wǎng)絡(luò)連接和物聯(lián)網(wǎng)(IoT)來傳遞信息、共享資源。無論是智能,低能耗,邊緣設(shè)備,中間網(wǎng)關(guān)還是計(jì)算節(jié)
    發(fā)表于 12-20 06:03

    機(jī)器學(xué)習(xí)簡介與經(jīng)典機(jī)器學(xué)習(xí)算法人才培養(yǎng)

    。遷移效果的可視化,利用機(jī)器學(xué)習(xí)庫scikit-learn中的t-SNE對遷移過后的高維數(shù)據(jù)進(jìn)行可視化。十、實(shí)驗(yàn)實(shí)操之圖片與視頻風(fēng)格遷移實(shí)踐掌握基于生成對抗網(wǎng)絡(luò)的風(fēng)格遷移技術(shù)。圖像/視
    發(fā)表于 04-28 18:56

    什么是機(jī)器學(xué)習(xí)? 機(jī)器學(xué)習(xí)基礎(chǔ)入門

    中,我將概述機(jī)器學(xué)習(xí),它是如何工作的,以及為什么它對嵌入式工程師很重要。什么是機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)
    發(fā)表于 06-21 11:06

    燒錄程序的時候,哪些非技術(shù)因素會影響燒錄結(jié)果?

    燒錄程序的時候,哪些非技術(shù)因素會影響燒錄結(jié)果
    發(fā)表于 11-08 07:04

    什么是機(jī)器學(xué)習(xí)?機(jī)器學(xué)習(xí)能解決什么問題?(案例分析)

    隨著大數(shù)據(jù)時代的到來,機(jī)器學(xué)習(xí)成為解決問題的一種重要且關(guān)鍵的工具。不管是工業(yè)界還是學(xué)術(shù)界,機(jī)器學(xué)習(xí)都是一個炙手可熱的方向,但是學(xué)術(shù)界和工 業(yè)
    發(fā)表于 05-18 13:13 ?1.6w次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>能解決什么問題?(案例分析)

    機(jī)器學(xué)習(xí)專家們每天都在做什么?如何讓機(jī)器學(xué)習(xí)自動化

    在思考我們?nèi)绾巫?b class='flag-5'>機(jī)器學(xué)習(xí)自動化,以及如何讓它普及到更多領(lǐng)域的人時,首先要思考的是,機(jī)器學(xué)習(xí)專家們都要做什么?任何能解決
    的頭像 發(fā)表于 07-19 16:01 ?5042次閱讀

    Google與NASA合作 將利用模擬和機(jī)器學(xué)習(xí)技術(shù)搜索外星生命

    Google Cloud與NASA的前沿開發(fā)實(shí)驗(yàn)室合作,利用模擬和機(jī)器學(xué)習(xí)技術(shù)搜索外星生命。
    發(fā)表于 10-22 16:47 ?937次閱讀

    機(jī)器學(xué)習(xí)技術(shù)是什么?機(jī)器學(xué)習(xí)技術(shù)在新型電力系統(tǒng)安全穩(wěn)定中的應(yīng)用

    機(jī)器學(xué)習(xí)技術(shù)是什么?機(jī)器學(xué)習(xí)技術(shù)在新型電力系統(tǒng)安全穩(wěn)定中的應(yīng)用
    的頭像 發(fā)表于 08-17 16:30 ?988次閱讀

    深入探討機(jī)器學(xué)習(xí)的可視化技術(shù)

    機(jī)器學(xué)習(xí)可視化(簡稱ML可視化)一般是指通過圖形或交互方式表示機(jī)器學(xué)習(xí)模型、數(shù)據(jù)及其關(guān)系的過程。目標(biāo)是使理解模型的復(fù)雜算法和數(shù)據(jù)模式更容易,使技術(shù)
    發(fā)表于 04-25 11:17 ?294次閱讀
    深入探討<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的可視化<b class='flag-5'>技術(shù)</b>