0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詳細(xì)闡述機(jī)器學(xué)習(xí)及基本概念

電子工程師 ? 來(lái)源:網(wǎng)絡(luò)整理 ? 作者:工程師姚遠(yuǎn)香 ? 2018-07-07 09:05 ? 次閱讀

機(jī)器學(xué)習(xí)導(dǎo)論》第1章緒論,本章詳細(xì)地討論一些應(yīng)用領(lǐng)域的例子,以進(jìn)一步深入了解機(jī)器學(xué)習(xí)的類(lèi)型和用途。本節(jié)為大家介紹什么是機(jī)器學(xué)習(xí)。

什么是機(jī)器學(xué)習(xí)

隨著計(jì)算機(jī)技術(shù)的發(fā)展,我們現(xiàn)在已經(jīng)擁有存儲(chǔ)和處理海量數(shù)據(jù)以及通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)從遠(yuǎn)程站點(diǎn)訪問(wèn)數(shù)據(jù)的能力。目前大多數(shù)的數(shù)據(jù)存取設(shè)備都是數(shù)字設(shè)備,記錄的數(shù)據(jù)也很可靠。以一家連鎖超市為例,它擁有遍布全國(guó)各地的數(shù)百家分店,并且在為數(shù)百萬(wàn)顧客提供數(shù)千種商品的零售服務(wù)。銷(xiāo)售點(diǎn)的終端設(shè)備記錄每筆交易的詳細(xì)資料,包括日期、顧客識(shí)別碼、購(gòu)買(mǎi)商品和數(shù)量、消費(fèi)總額等。這是典型的每日幾個(gè)G字節(jié)的數(shù)據(jù)。只有分析這些數(shù)據(jù),并且將它轉(zhuǎn)換為可以利用的信息時(shí),這些存儲(chǔ)的數(shù)據(jù)才能變得有用,例如做預(yù)測(cè)。

1我們不能確切地知道哪些人比較傾向于購(gòu)買(mǎi)哪種特定的商品,也不知道應(yīng)該向喜歡讀海明威作品的人推薦哪位作者。如果我們知道,我們就不需要任何數(shù)據(jù)分析;我們只管供貨并記錄下編碼就可以了。但是,正因?yàn)槲覀儾恢溃圆胖荒苁占瘮?shù)據(jù),并期望從數(shù)據(jù)中提取這些問(wèn)題或相似問(wèn)題的答案。

Glühwein是一種溫?zé)?、有點(diǎn)甜味、加香料的葡萄酒。圣誕節(jié)期間,在歐洲很受歡迎。--譯者注我們確信存在某種過(guò)程,可以解釋我們所觀測(cè)到的數(shù)據(jù)。盡管我們不清楚數(shù)據(jù)產(chǎn)生過(guò)程(例如顧客行為)的細(xì)節(jié),但是,我們知道數(shù)據(jù)產(chǎn)生不是完全隨機(jī)的。人們并不是去超市隨機(jī)購(gòu)買(mǎi)商品。當(dāng)人們買(mǎi)啤酒時(shí),也會(huì)買(mǎi)薯片;夏天買(mǎi)冰淇淋,而冬天則為Glühwein?買(mǎi)香料。數(shù)據(jù)中存在確定的模式。

我們也許不能夠完全識(shí)別該過(guò)程,但是我們相信,我們能夠構(gòu)造一個(gè)好的并且有用的近似(good and useful approximation)。盡管這樣的近似還不可能解釋一切,但其仍然可以解釋數(shù)據(jù)的某些部分。我們相信,盡管識(shí)別全部過(guò)程也許是不可能的,但是我們?nèi)匀荒軌虬l(fā)現(xiàn)某些模式或規(guī)律。這正是機(jī)器學(xué)習(xí)的定位。這些模式可以幫助我們理解該過(guò)程,或者我們可以使用這些模式進(jìn)行預(yù)測(cè):假定將來(lái),至少是不遠(yuǎn)的將來(lái),情況不會(huì)與收集樣本數(shù)據(jù)時(shí)有很大的不同,則未來(lái)的預(yù)測(cè)也將有望是正確的。

機(jī)器學(xué)習(xí)方法在大型數(shù)據(jù)庫(kù)中的應(yīng)用稱(chēng)為數(shù)據(jù)挖掘(data mining)。類(lèi)似的情況如大量的金屬氧化物以及原料從礦山中開(kāi)采出來(lái),處理后產(chǎn)生少量非常珍貴的物質(zhì)。同樣地,在數(shù)據(jù)挖掘中,需要處理大量的數(shù)據(jù)以構(gòu)建簡(jiǎn)單有用的模型,例如具有高精度的預(yù)測(cè)模型。數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域非常廣泛:除零售業(yè)以外,在金融業(yè),銀行分析他們的歷史數(shù)據(jù),構(gòu)建用于信用分析、詐騙檢測(cè)、股票市場(chǎng)等方面的應(yīng)用模型;在制造業(yè),學(xué)習(xí)模型可以用于優(yōu)化、控制以及故障檢測(cè)等;在醫(yī)學(xué)領(lǐng)域,學(xué)習(xí)程序可以用于醫(yī)療診斷等;在電信領(lǐng)域,通話模式的分析可用于網(wǎng)絡(luò)優(yōu)化和提高服務(wù)質(zhì)量;在科學(xué)研究領(lǐng)域,比如物理學(xué)、天文學(xué)以及生物學(xué)的大量數(shù)據(jù)只有用計(jì)算機(jī)才可能得到足夠快的分析。萬(wàn)維網(wǎng)(World Wide Web)是巨大的,并且在不斷地增長(zhǎng),因此在萬(wàn)維網(wǎng)上檢索相關(guān)信息不可能依靠人工完成。

然而,機(jī)器學(xué)習(xí)不僅僅是數(shù)據(jù)庫(kù)方面的問(wèn)題,它也是人工智能的組成部分。為了智能化,處于變化環(huán)境中的系統(tǒng)必須具備學(xué)習(xí)的能力。如果系統(tǒng)能夠?qū)W習(xí)并且適應(yīng)這些變化,那么系統(tǒng)的設(shè)計(jì)者就不必預(yù)見(jiàn)所有的情況,并為它們提供解決方案了。

機(jī)器學(xué)習(xí)還可以幫助我們解決視覺(jué)、語(yǔ)音識(shí)別以及機(jī)器人方面的許多問(wèn)題。以人臉識(shí)別問(wèn)題為例:我們做這件事毫不費(fèi)力;即使姿勢(shì)、光線、發(fā)型等不同,我們每天還是可以通過(guò)看真實(shí)的面孔或其照片來(lái)認(rèn)出我們的家人和朋友。但是我們做這件事是下意識(shí)的,而且無(wú)法解釋我們是如何做的。因?yàn)槲覀儾荒軌蚪忉屛覀兯邆涞倪@種技能,我們也就不可能編寫(xiě)相應(yīng)的計(jì)算機(jī)程序。但是我們知道,臉部圖像并非只是像素點(diǎn)的隨機(jī)組合;人臉是有結(jié)構(gòu)的、對(duì)稱(chēng)的。臉上有眼睛、鼻子和嘴巴,并且它們都位于臉的特定部位。每個(gè)人的臉都有各自的眼睛、鼻子和嘴巴的特定組合模式。通過(guò)分析一個(gè)人臉部圖像的多個(gè)樣本,學(xué)習(xí)程序可以捕捉到那個(gè)人特有的模式,然后在所給的圖像中檢測(cè)這種模式,從而進(jìn)行辨認(rèn)。這就是模式識(shí)別(pattern recognition)的一個(gè)例子。

機(jī)器學(xué)習(xí)使用實(shí)例數(shù)據(jù)或過(guò)去的經(jīng)驗(yàn)訓(xùn)練計(jì)算機(jī),以?xún)?yōu)化某種性能標(biāo)準(zhǔn)。我們有依賴(lài)于某些參數(shù)的模型,而學(xué)習(xí)就是執(zhí)行計(jì)算機(jī)程序,利用訓(xùn)練數(shù)據(jù)或以往經(jīng)驗(yàn)來(lái)優(yōu)化該模型的參數(shù)的。模型可以是預(yù)測(cè)性的(predictive),用于未來(lái)的預(yù)測(cè),或者是描述性的(descriptive),用于從數(shù)據(jù)中獲取知識(shí),也可以二者兼?zhèn)洹?/p>

機(jī)器學(xué)習(xí)在構(gòu)建數(shù)學(xué)模型時(shí)利用了統(tǒng)計(jì)學(xué)理論,因?yàn)槠浜诵娜蝿?wù)就是從樣本中推理。計(jì)算機(jī)科學(xué)的角色是雙重的:第一,在訓(xùn)練時(shí),我們需要求解優(yōu)化問(wèn)題以及存儲(chǔ)和處理通常所面對(duì)的海量數(shù)據(jù)的高效算法。第二,一旦學(xué)習(xí)得到了一個(gè)模型,它的表示和用于推理的算法解也必須是高效的。在特定的應(yīng)用中,學(xué)習(xí)或推理算法的效率,即它的空間復(fù)雜度和時(shí)間復(fù)雜度,可能與其預(yù)測(cè)精確度同樣重要。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Linux應(yīng)用編程的基本概念

    Linux應(yīng)用編程涉及到在Linux環(huán)境下開(kāi)發(fā)和運(yùn)行應(yīng)用程序的一系列概念。以下是一些涵蓋Linux應(yīng)用編程的基本概念。
    的頭像 發(fā)表于 10-24 17:19 ?161次閱讀

    DDR4的基本概念和特性

    里程碑。自2011年面世以來(lái),DDR4憑借其顯著的性能提升和能效優(yōu)化,迅速成為市場(chǎng)主流。以下將從DDR4的基本概念、技術(shù)特性、性能優(yōu)勢(shì)以及市場(chǎng)應(yīng)用等方面進(jìn)行詳細(xì)闡述。
    的頭像 發(fā)表于 09-04 11:43 ?1378次閱讀

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 鳥(niǎo)瞰這本書(shū)

    清晰,從時(shí)間序列分析的基礎(chǔ)理論出發(fā),逐步深入到機(jī)器學(xué)習(xí)算法在時(shí)間序列預(yù)測(cè)中的應(yīng)用,內(nèi)容全面,循序漸進(jìn)。每一章都經(jīng)過(guò)精心設(shè)計(jì),對(duì)理論知識(shí)進(jìn)行了詳細(xì)闡述,對(duì)實(shí)際案例進(jìn)行了生動(dòng)的展示,使讀
    發(fā)表于 08-12 11:28

    BP網(wǎng)絡(luò)的基本概念和訓(xùn)練原理

    )的多層前饋神經(jīng)網(wǎng)絡(luò)。BP網(wǎng)絡(luò)自1985年提出以來(lái),因其強(qiáng)大的學(xué)習(xí)和適應(yīng)能力,在機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、模式識(shí)別等領(lǐng)域得到了廣泛應(yīng)用。以下將對(duì)BP網(wǎng)絡(luò)的基本概念、訓(xùn)練原理及其優(yōu)缺點(diǎn)進(jìn)行
    的頭像 發(fā)表于 07-19 17:24 ?1213次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本概念、原理及特點(diǎn)

    基本概念、原理、特點(diǎn)以及在不同領(lǐng)域的應(yīng)用情況。 一、卷積神經(jīng)網(wǎng)絡(luò)的基本概念 卷積神經(jīng)網(wǎng)絡(luò)是一種深度學(xué)習(xí)算法,它由多層卷積層和池化層堆疊而成。卷積層負(fù)責(zé)提取圖像中的局部特征,而池化層則負(fù)責(zé)降低特征的空間維度,同時(shí)增加對(duì)圖像位移的
    的頭像 發(fā)表于 07-11 14:38 ?715次閱讀

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)預(yù)處理與特征工程

    機(jī)器學(xué)習(xí)的整個(gè)流程中,數(shù)據(jù)預(yù)處理與特征工程是兩個(gè)至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量,進(jìn)而影響模型的訓(xùn)練效果和泛化能力。本文將從數(shù)據(jù)預(yù)處理和特征工程的基本概念出發(fā),詳細(xì)探討這
    的頭像 發(fā)表于 07-09 15:57 ?273次閱讀

    遷移學(xué)習(xí)基本概念和實(shí)現(xiàn)方法

    遷移學(xué)習(xí)(Transfer Learning)是機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)重要概念,其核心思想是利用在一個(gè)任務(wù)或領(lǐng)域中學(xué)到的知識(shí)來(lái)加速或改進(jìn)另一個(gè)相關(guān)任務(wù)或領(lǐng)域的
    的頭像 發(fā)表于 07-04 17:30 ?1201次閱讀

    串口通信的基本概念

    串口通信(Serial Communications)的基本概念可以歸納為以下幾個(gè)方面:
    的頭像 發(fā)表于 06-12 09:28 ?512次閱讀
    串口通信的<b class='flag-5'>基本概念</b>

    RTC實(shí)時(shí)時(shí)鐘的基本概念和工作原理

    精確的實(shí)時(shí)時(shí)間,并為電子系統(tǒng)提供精確的時(shí)間基準(zhǔn)。本文將詳細(xì)闡述RTC實(shí)時(shí)時(shí)鐘的基本概念、工作原理以及其在現(xiàn)代電子設(shè)備中的應(yīng)用。
    的頭像 發(fā)表于 05-27 15:43 ?3251次閱讀

    機(jī)器學(xué)習(xí)入門(mén):基本概念介紹

    機(jī)器學(xué)習(xí)(GraphMachineLearning,簡(jiǎn)稱(chēng)GraphML)是機(jī)器學(xué)習(xí)的一個(gè)分支,專(zhuān)注于利用圖形結(jié)構(gòu)的數(shù)據(jù)。在圖形結(jié)構(gòu)中,數(shù)據(jù)以圖的形式表示,其中的節(jié)點(diǎn)(或頂點(diǎn))表示實(shí)體
    的頭像 發(fā)表于 05-16 08:27 ?463次閱讀
    圖<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>入門(mén):<b class='flag-5'>基本概念</b>介紹

    數(shù)字視音頻技術(shù)的基本概念

    技術(shù)的應(yīng)用范圍廣泛,涵蓋了廣播電視、影視制作、多媒體通信、遠(yuǎn)程教育等多個(gè)領(lǐng)域。本文將詳細(xì)介紹數(shù)字視音頻技術(shù)的基本概念、技術(shù)原理和應(yīng)用現(xiàn)狀等方面。 數(shù)字視音頻技術(shù)的基本概念 數(shù)字信號(hào):數(shù)字信號(hào)是一種離散的、不
    的頭像 發(fā)表于 12-14 15:00 ?1451次閱讀

    接地裝置的基本概念

    接地裝置的基本概念
    的頭像 發(fā)表于 12-05 15:49 ?530次閱讀
    接地裝置的<b class='flag-5'>基本概念</b>

    工程師必看!電路基本概念有哪些?

    工程師必看!電路基本概念有哪些?
    的頭像 發(fā)表于 11-30 09:31 ?632次閱讀
    工程師必看!電路<b class='flag-5'>基本概念</b>有哪些?

    MMU相關(guān)的基本概念

    1-MMU相關(guān)的基本概念 (1)虛擬地址相關(guān)基本概念 ? 虛擬內(nèi)存(Virtual Memory,VM):為每個(gè)進(jìn)程提供了一致的、連續(xù)的、私有的內(nèi)存空間,簡(jiǎn)化了內(nèi)存管理。將主存看成是一個(gè)存儲(chǔ)在磁盤(pán)
    的頭像 發(fā)表于 11-26 16:11 ?647次閱讀

    C語(yǔ)言的基本概念和編程技術(shù)

    電子發(fā)燒友網(wǎng)站提供《C語(yǔ)言的基本概念和編程技術(shù).pdf》資料免費(fèi)下載
    發(fā)表于 11-20 10:18 ?0次下載
    C語(yǔ)言的<b class='flag-5'>基本概念</b>和編程技術(shù)