0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用機(jī)器學(xué)習(xí)(CART)來預(yù)測合格率

MinitabUG ? 來源:MinitabUG ? 作者:MinitabUG ? 2022-06-01 14:57 ? 次閱讀

人類一直試圖讓機(jī)器具有智能,也就是人工智能(Artificial Intelligence)。從上世紀(jì)50年代,人工智能的發(fā)展經(jīng)歷了“推理期”,通過賦予機(jī)器邏輯推理能力使機(jī)器獲得智能,當(dāng)時(shí)的AI程序能夠證明一些著名的數(shù)學(xué)定理,但由于機(jī)器缺乏知識(shí),遠(yuǎn)不能實(shí)現(xiàn)真正的智能。因此,70年代,人工智能的發(fā)展進(jìn)入“知識(shí)期”,即將人類的知識(shí)總結(jié)出來教給機(jī)器,使機(jī)器獲得智能。 無論是“推理期”還是“知識(shí)期”,機(jī)器都是按照人類設(shè)定的規(guī)則和總結(jié)的知識(shí)運(yùn)作,永遠(yuǎn)無法超越其創(chuàng)造者,其次人力成本太高。于是,一些學(xué)者就想到,如果機(jī)器能夠自我學(xué)習(xí)問題不就迎刃而解了嗎!機(jī)器學(xué)習(xí)(Machine Learning)方法應(yīng)運(yùn)而生,人工智能進(jìn)入“機(jī)器學(xué)習(xí)時(shí)期”。機(jī)器學(xué)習(xí)的核心是“使用算法解析數(shù)據(jù),從中學(xué)習(xí),然后對(duì)世界上的某件事情做出決定或預(yù)測”。機(jī)器學(xué)習(xí)最大的突破是2006年的深度學(xué)習(xí)。深度學(xué)習(xí)是一類機(jī)器學(xué)習(xí),目的是模仿人腦的思維過程,經(jīng)常用于圖像和語音識(shí)別。深度學(xué)習(xí)的出現(xiàn)導(dǎo)致了我們今天使用的(可能是理所當(dāng)然的)許多技術(shù)。當(dāng)你問你的iPhone關(guān)于今天的天氣時(shí),你的話語會(huì)用一種復(fù)雜的語音解析算法進(jìn)行分析。如果沒有深度學(xué)習(xí),這一切都是不可能的。

機(jī)器學(xué)習(xí)與統(tǒng)計(jì)區(qū)別

pYYBAGKXDWKACMKNAAA4bACKLDA711.png

poYBAGKXDWWAQAX6AAA5Z5bbFYg105.png

機(jī)器學(xué)習(xí)是一類算法的總稱,這些算法企圖從大量歷史數(shù)據(jù)中挖掘出其中隱含的規(guī)律,并用于預(yù)測或者分類,更具體的說,機(jī)器學(xué)習(xí)可以看作是尋找一個(gè)函數(shù),輸入是樣本數(shù)據(jù),輸出是期望的結(jié)果,只是這個(gè)函數(shù)過于復(fù)雜,以至于不太方便形式化表達(dá)。
通常學(xué)習(xí)一個(gè)好的函數(shù),分為以下三步:
1、選擇一個(gè)合適的模型,這通常需要依據(jù)實(shí)際問題而定,針對(duì)不同的問題和任務(wù)需要選取恰當(dāng)?shù)哪P汀?br /> 2、判斷一個(gè)函數(shù)的好壞,這需要確定一個(gè)衡量標(biāo)準(zhǔn),如回歸問題一般采用歐式距離,分類問題一般采用交叉驗(yàn)證函數(shù)。
3、找出“最好”的函數(shù),如何從眾多函數(shù)中最快的找出“最好”的那一個(gè),學(xué)習(xí)得到“最好”的函數(shù)后,需要在新樣本上進(jìn)行測試,只有在新樣本上表現(xiàn)很好,才算是一個(gè)“好”的函數(shù)。
機(jī)器學(xué)習(xí)的核心是“使用算法解析數(shù)據(jù),從中學(xué)習(xí),然后對(duì)世界上的某件事情做出決定或預(yù)測”。這意味著,與其顯式地編寫程序來執(zhí)行某些任務(wù),不如教計(jì)算機(jī)如何開發(fā)一個(gè)算法來完成任務(wù)。有三種主要類型的機(jī)器學(xué)習(xí):監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。

pYYBAGKXDW6ADHLpAABfld12yy8326.png

poYBAGKXDXOAD3JYAAB2N-WRkBM572.png


【案例分享】為了預(yù)測過程輸出性能,提高客戶滿意度及產(chǎn)品質(zhì)量,現(xiàn)從數(shù)據(jù)庫中批量導(dǎo)入了2019年5月份生產(chǎn)報(bào)表,檢測產(chǎn)品能否滿足規(guī)格要求及相關(guān)生產(chǎn)環(huán)境,試分析影響產(chǎn)品質(zhì)量的相關(guān)原因及預(yù)測結(jié)果。
本例共有9個(gè)變量,近5000個(gè)測試數(shù)據(jù),其數(shù)據(jù)表如下:

poYBAGKXDXyAOiVTAAFW-HVv7y4985.png

在Minitab最新發(fā)布的版本Minitab19.2020中,除了可以將Python的腳本可以導(dǎo)入Minitab加載分析之外,還增加了機(jī)器學(xué)習(xí)的CART分析法。我們將上述案例用CART分析步驟如下:
1、統(tǒng)計(jì)---預(yù)測分析---CART分類,將響應(yīng)和影響因子分別填入對(duì)應(yīng)位置

pYYBAGKXDYSAY9L2AAB5JPyPozw611.png

2、點(diǎn)擊 先驗(yàn)/成本,設(shè)置誤分類成本

poYBAGKXDYqAYpQmAABYxWzMidc554.png

誤分類成本就是判斷錯(cuò)誤的風(fēng)險(xiǎn),例如,在醫(yī)學(xué)影像檢測中,把健康的人誤診為病人還不是最糟的情況,只要醫(yī)生能對(duì)診斷結(jié)果進(jìn)行復(fù)查,并把健康的這個(gè)人找出來就可以了。但反過來,未能診斷出真正的病人而不提供給他任何治療,則就非常危險(xiǎn)了。默認(rèn)情況下,Minitab 使用相等的成本 1。
3、點(diǎn)擊 驗(yàn)證,選擇驗(yàn)證方法

pYYBAGKXDY-ATIAGAABmK-smvtA744.png

設(shè)置模型驗(yàn)證:數(shù)據(jù)通常被分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)
訓(xùn)練數(shù)據(jù)(學(xué)習(xí)數(shù)據(jù))通常被用來創(chuàng)建模型及評(píng)估模型的系數(shù);測試數(shù)據(jù)通常檢模型性能,通過測試數(shù)據(jù)得到擬合值,在用訓(xùn)練數(shù)據(jù)的數(shù)據(jù)和對(duì)應(yīng)的擬合值進(jìn)行比較來檢驗(yàn)?zāi)P偷念A(yù)測性能通過驗(yàn)證,防止模型過度擬合若用同一組數(shù)據(jù)來擬合模型并評(píng)估模型的擬合優(yōu)度,會(huì)導(dǎo)致過度擬合,過度擬合的模型并不能用于很好的預(yù)測…..

pYYBAGKXDZSAaRnaAAAi3Ku8Ckg631.png

poYBAGKXDZmAUIZrAABqBExbbyo262.png

4、點(diǎn)擊 選項(xiàng),設(shè)置節(jié)點(diǎn)分裂方式

poYBAGKXDaCAS7HaAAB89bjVzsY333.png

默認(rèn)的節(jié)點(diǎn)分裂,選擇 基尼

pYYBAGKXDaWAWtd6AAAMQM6RLR4860.png

對(duì)所有對(duì)話框點(diǎn)擊 確定,查看Minitab輸出(部分):

poYBAGKXDamAbZ2eAABaPxEN2dE293.png


默認(rèn)情況下,Minitab 為誤分類成本在最小誤分類成本 1 個(gè)標(biāo)準(zhǔn)誤內(nèi)的最小樹生成輸出。也可以識(shí)別最優(yōu)樹的序列中探索其他樹。終端節(jié)點(diǎn)數(shù)越多,模型就越復(fù)雜。

pYYBAGKXDa2APy3QAACjjrSgDQI944.png

poYBAGKXDbGARjSOAABWvCxAVaA760.png

ROC曲線指受試者工作特征曲線 / 接收器操作特性曲線(receiver operating characteristic curve), 是反映敏感性和特異性連續(xù)變量的綜合指標(biāo),是用構(gòu)圖法揭示敏感性和特異性的相互關(guān)系,它通過將連續(xù)變量設(shè)定出多個(gè)不同的臨界值,從而計(jì)算出一系列敏感性和特異性,再以敏感性為縱坐標(biāo)、(1-特異性)為橫坐標(biāo)繪制成曲線,曲線下面積越大,診斷準(zhǔn)確性越高。
點(diǎn)擊ROC圖左下角的預(yù)測,可以根據(jù)模型預(yù)測不同場景下的輸出概率。

pYYBAGKXDbiAPR3CAABneA62wHc255.png

總結(jié):

機(jī)器學(xué)習(xí)是目前業(yè)界最為火熱的一項(xiàng)技術(shù),從網(wǎng)上的每一次淘寶的購買東西,到自動(dòng)駕駛汽車技術(shù),以及網(wǎng)絡(luò)攻擊抵御系統(tǒng)等等,都有機(jī)器學(xué)習(xí)的因子在內(nèi),同時(shí)機(jī)器學(xué)習(xí)也是最有可能使人類完成“AI 夢”的一項(xiàng)技術(shù),各種人工智能目前的應(yīng)用,如微軟小冰聊天機(jī)器人,到計(jì)算機(jī)視覺技術(shù)的進(jìn)步,都有機(jī)器學(xué)習(xí)努力的成分。作為全球領(lǐng)先的統(tǒng)計(jì)分析軟件,Minitab在2018年收購了SPM,并在Minitab.19.2020版中增加了預(yù)測分析的CART分類和CART回歸功能,能夠幫助我們了解一些機(jī)器學(xué)習(xí)的相關(guān)知識(shí)與概念,更好的理解為我們帶來莫大便利技術(shù)的背后原理,以及讓我們更好的理解當(dāng)代科技的進(jìn)程。

審核編輯:符乾江

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 預(yù)測分析
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    6428
  • Minitab
    +關(guān)注

    關(guān)注

    0

    文章

    161

    瀏覽量

    11653
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8357

    瀏覽量

    132335
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    制造商利用云技術(shù)優(yōu)化深度學(xué)習(xí)機(jī)器視覺的運(yùn)行效率

    機(jī)器視覺,作為推動(dòng)中國制造業(yè)蓬勃發(fā)展的關(guān)鍵技術(shù),已在半導(dǎo)體、電子制造、汽車、醫(yī)藥及食品包裝等多個(gè)領(lǐng)域展現(xiàn)其廣泛應(yīng)用價(jià)值。在此背景下,高工產(chǎn)業(yè)研究所(GGII)預(yù)測,至2024年,中國機(jī)器視覺市場規(guī)模將有望超過200億元,年增長
    的頭像 發(fā)表于 10-22 14:10 ?271次閱讀

    AI引擎機(jī)器學(xué)習(xí)陣列指南

    云端動(dòng)態(tài)工作負(fù)載以及超高帶寬網(wǎng)絡(luò),同時(shí)還可提供高級(jí)安全性功能。AI 和數(shù)據(jù)科學(xué)家以及軟硬件開發(fā)者均可充分利用高計(jì)算密度的優(yōu)勢加速提升任何應(yīng)用的性能。AI 引擎機(jī)器學(xué)習(xí)擁有先進(jìn)的張量計(jì)
    的頭像 發(fā)表于 09-18 09:16 ?289次閱讀
    AI引擎<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>陣列指南

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來一點(diǎn)也不輕松,加油。 作者首先說明了時(shí)間序列的信息提取是時(shí)間序列分析的一個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù),可以
    發(fā)表于 08-14 18:00

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 鳥瞰這本書

    清晰,從時(shí)間序列分析的基礎(chǔ)理論出發(fā),逐步深入到機(jī)器學(xué)習(xí)算法在時(shí)間序列預(yù)測中的應(yīng)用,內(nèi)容全面,循序漸進(jìn)。每一章都經(jīng)過精心設(shè)計(jì),對(duì)理論知識(shí)進(jìn)行了詳細(xì)的闡述,對(duì)實(shí)際案例進(jìn)行了生動(dòng)的展示,使讀者在理論與實(shí)踐
    發(fā)表于 08-12 11:28

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列分析的基礎(chǔ)知識(shí),更巧妙地展示了機(jī)器學(xué)習(xí)如何在這一領(lǐng)域發(fā)揮巨
    發(fā)表于 08-12 11:21

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 了解時(shí)間序列

    。 可以探索現(xiàn)象發(fā)展變化的規(guī)律,對(duì)某些社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行預(yù)測。 利用時(shí)間序列可以在不同地區(qū)或國家之間進(jìn)行對(duì)比分析,這也是統(tǒng)計(jì)分析的重要方法之一。 而《時(shí)間序列與機(jī)器學(xué)習(xí)》一書的后幾章分別
    發(fā)表于 08-11 17:55

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】全書概覽與時(shí)間序列概述

    數(shù)據(jù)中提取特征并將其轉(zhuǎn)化為交易策略,以及機(jī)器學(xué)習(xí)在其他金融領(lǐng)域(包括資產(chǎn)定價(jià)、資產(chǎn)配置、波動(dòng)預(yù)測)的應(yīng)用。 全書彩版印刷,內(nèi)容結(jié)構(gòu)嚴(yán)整,條理清晰,循序漸進(jìn),由淺入深,是很好的時(shí)間序列
    發(fā)表于 08-07 23:03

    選擇對(duì)的氣密性檢測儀,提升汽車塑料蓋子合格率

    汽車塑料蓋子的合格率具有至關(guān)重要的作用。氣密性檢測儀,顧名思義,是一種用于檢測產(chǎn)品密封性能的設(shè)備。在汽車塑料蓋子的生產(chǎn)過程中,通過氣密性檢測儀可以精確地測量出蓋子
    的頭像 發(fā)表于 08-01 11:21 ?170次閱讀
    選擇對(duì)的氣密性檢測儀,提升汽車塑料蓋子<b class='flag-5'>合格率</b>

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對(duì)比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?1128次閱讀

    機(jī)器學(xué)習(xí)的經(jīng)典算法與應(yīng)用

    關(guān)于數(shù)據(jù)機(jī)器學(xué)習(xí)就是喂入算法和數(shù)據(jù),讓算法從數(shù)據(jù)中尋找一種相應(yīng)的關(guān)系。Iris鳶尾花數(shù)據(jù)集是一個(gè)經(jīng)典數(shù)據(jù)集,在統(tǒng)計(jì)學(xué)習(xí)機(jī)器學(xué)習(xí)領(lǐng)域都經(jīng)常被
    的頭像 發(fā)表于 06-27 08:27 ?1549次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的經(jīng)典算法與應(yīng)用

    名單公布!【書籍評(píng)測活動(dòng)NO.35】如何用「時(shí)間序列與機(jī)器學(xué)習(xí)」解鎖未來?

    量化交易的概念、發(fā)展歷程,如何通過因子挖掘從時(shí)間序列數(shù)據(jù)中提取特征并將其轉(zhuǎn)化為交易策略,以及機(jī)器學(xué)習(xí)在其他金融領(lǐng)域(包括資產(chǎn)定價(jià)、資產(chǎn)配置、波動(dòng)預(yù)測)的應(yīng)用。 本書的兩位作者在時(shí)間
    發(fā)表于 06-25 15:00

    請(qǐng)問PSoC? Creator IDE可以支持IMAGIMOB機(jī)器學(xué)習(xí)嗎?

    我的項(xiàng)目使用 POSC62 MCU 進(jìn)行開發(fā),由于 UDB 模塊是需求的重要組成部分,所以我選擇了PSoC? Creator IDE 進(jìn)行項(xiàng)目開發(fā)。 但現(xiàn)在,由于需要擴(kuò)展,我不得不使用機(jī)器學(xué)習(xí)模塊
    發(fā)表于 05-20 08:06

    機(jī)器學(xué)習(xí)怎么進(jìn)入人工智能

    ,人工智能已成為一個(gè)熱門領(lǐng)域,涉及到多個(gè)行業(yè)和領(lǐng)域,例如語音識(shí)別、機(jī)器翻譯、圖像識(shí)別等。 在編程中進(jìn)行人工智能的關(guān)鍵是使用機(jī)器學(xué)習(xí)算法,這是一類基于樣本數(shù)據(jù)和模型訓(xùn)練進(jìn)行
    的頭像 發(fā)表于 04-04 08:41 ?236次閱讀

    機(jī)器學(xué)習(xí)8大調(diào)參技巧

    今天給大家一篇關(guān)于機(jī)器學(xué)習(xí)調(diào)參技巧的文章。超參數(shù)調(diào)優(yōu)是機(jī)器學(xué)習(xí)例程中的基本步驟之一。該方法也稱為超參數(shù)優(yōu)化,需要搜索超參數(shù)的最佳配置以實(shí)現(xiàn)最佳性能。
    的頭像 發(fā)表于 03-23 08:26 ?553次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>8大調(diào)參技巧

    怎么改善PCB電路板電鍍表面凹坑

    隨著PCB電路板線路制作精細(xì)化程度的提高,線路制作中的開短路問題成為影響產(chǎn)品合格率的重要因素,通常對(duì)于線路合格率的改善行動(dòng)會(huì)考慮到干膜附著力,曝光能量等因素,從整個(gè)系統(tǒng)制作的角度來說,電鍍后板面本身的平整度是影響線路良的一個(gè)根
    發(fā)表于 12-21 15:55 ?956次閱讀
    怎么改善PCB電路板電鍍表面凹坑