數(shù)據(jù)挖掘中應(yīng)用較多的技術(shù)機(jī)器學(xué)習(xí)。
機(jī)器學(xué)習(xí)主流算法包括三種:關(guān)聯(lián)分析、分類分析、聚類分析。本文主要介紹分類分析、聚類分析。
圖片來源:來自網(wǎng)絡(luò)
一、分類分析
(1)分類分析概念 分類分析是指算法通過學(xué)習(xí)得出“某種分類依據(jù)”,該分類依據(jù)可以判斷一個新事物的類別(含個人理解)。
(2)分類分析過程 分類分析包括兩個過程:
1)通過大量樣本的訓(xùn)練,使算法可以建立準(zhǔn)確率超過某值的分類依據(jù)。
2)算法根據(jù)分類依據(jù)對新事物分類。
(3)分類分析過程與學(xué)生學(xué)習(xí)過程對比
1)學(xué)生本身具有學(xué)習(xí)能力,但不會做某一類型的題。這類似于機(jī)器學(xué)習(xí)算法具有學(xué)習(xí)能力,但不會對某一事物進(jìn)行分類。
2)學(xué)生在學(xué)習(xí)過程中需要做大量習(xí)題,而且還需要根據(jù)標(biāo)準(zhǔn)答案確定每道題的正誤,學(xué)生在該過程逐步調(diào)整其知識體系。這類似于機(jī)器學(xué)習(xí)算法需要通過大量樣本的訓(xùn)練,機(jī)器學(xué)習(xí)的每個樣本均包含輸入和輸出,機(jī)器學(xué)習(xí)可以通過將樣本輸入其建立模型得出的輸出與樣本輸出(樣本輸出類似標(biāo)準(zhǔn)答案)進(jìn)行對比,判斷其建立模型的準(zhǔn)確性,不斷調(diào)整其建立的模型。
3)當(dāng)學(xué)生掌握所學(xué)的知識后,其就具備了在考試中解答新的同類型問題的能力。這類似于機(jī)器學(xué)習(xí)算法通過其建立的模型對新事物分類。
(4)分類分析算法
常見的分類分析算法包括:決策樹、K近鄰法(kNN)、樸素貝葉斯、感知機(jī)、支持向量機(jī)(SVM)。
更高級的分類分析方法包括:邏輯斯諦回歸(Logistic回歸)、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)路等。
二、聚類分析
(1)聚類分析概念
聚類分析是將一群物理對象劃分成相似的對象集合的過程。在聚類分析中,各個聚類內(nèi)的數(shù)據(jù)對象是相似的,不同聚類間的對象是相異的。
圖片來源:來自網(wǎng)絡(luò)
(2)聚類分析與分類分析對比
與分類分析類似,聚類分析的目的也是將樣本劃分至不同的子集。兩者不同的是:分類分析需要大量樣本訓(xùn)練,分類分析的算法在學(xué)習(xí)過程中需被告知每個樣本的類別;聚類分析不需要訓(xùn)練樣本,聚類分析的算法學(xué)習(xí)的數(shù)據(jù)是沒有指導(dǎo)信息的數(shù)據(jù),聚類分析的算法通過其內(nèi)部機(jī)制對樣本進(jìn)行劃分,將“它”認(rèn)為同類的數(shù)據(jù)進(jìn)行聚類。
(3)聚類分析與日常事物分類方式對比 聚類分析的分類方式使其對事物的分類方式可能有別于日常生活中對事物的劃分。
例如,日常生活中如果對香蕉、草莓、木塊分類,人們可能更容易將香蕉和草莓劃分為水果一類,將木塊劃分為另外的類別;但聚類分析算法可能將香蕉和木塊劃分為一類,將草莓劃分為另外的類別,分類依據(jù)是香蕉和木塊都是黃色的。
圖片來源:來自網(wǎng)絡(luò)
(4)聚類分析方法
聚類分析的常用方法包括:K-means算法、K中心點算法、層次聚類算法等。
審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
SVM
-
機(jī)器學(xué)習(xí)
-
神經(jīng)網(wǎng)路
原文標(biāo)題:大數(shù)據(jù)相關(guān)介紹(25)——機(jī)器學(xué)習(xí)之分類分析、聚類分析
文章出處:【微信號:行業(yè)學(xué)習(xí)與研究,微信公眾號:行業(yè)學(xué)習(xí)與研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
相關(guān)推薦
行為分析智能監(jiān)測攝像機(jī)是一種結(jié)合了人工智能和機(jī)器學(xué)習(xí)技術(shù)的智能設(shè)備,能夠?qū)崟r監(jiān)測目標(biāo)區(qū)域內(nèi)的行為動態(tài),并通過分析和識別行為特征來提供安全監(jiān)控和管理。這種攝像機(jī)在安防領(lǐng)域、智能交通和智能
發(fā)表于 08-21 10:14
?216次閱讀
個重要環(huán)節(jié),目標(biāo)是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù)。
特征工程(Feature Engineering)是將數(shù)據(jù)轉(zhuǎn)換為更好地表示潛在問題的特征,從而提高機(jī)器學(xué)習(xí)
發(fā)表于 08-17 21:12
本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來一點也不輕松,加油。
作者首先說明了時間序列的信息提取是時間序列分析的一個重要環(huán)節(jié),目標(biāo)是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析
發(fā)表于 08-14 18:00
清晰,從時間序列分析的基礎(chǔ)理論出發(fā),逐步深入到機(jī)器學(xué)習(xí)算法在時間序列預(yù)測中的應(yīng)用,內(nèi)容全面,循序漸進(jìn)。每一章都經(jīng)過精心設(shè)計,對理論知識進(jìn)行了詳細(xì)的闡述,對實際案例進(jìn)行了生動的展示,使讀者在理論與實踐
發(fā)表于 08-12 11:28
這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實地構(gòu)建了時間序列分析的基礎(chǔ)知識,更巧妙地展示了
發(fā)表于 08-12 11:21
收到《時間序列與機(jī)器學(xué)習(xí)》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個讓我學(xué)習(xí)時間序列及應(yīng)用的機(jī)會!
前言第一段描述了編寫背景:
由此可知,這是一本關(guān)于時間序列進(jìn)行大數(shù)據(jù)
發(fā)表于 08-11 17:55
的應(yīng)用也很廣泛,用機(jī)器學(xué)習(xí)為時間分析帶來新的可能性。人們往往可以通過過往的時間序列數(shù)據(jù)來預(yù)測未來,在各行各業(yè)中都有很好的應(yīng)用與發(fā)展前景。
時間序列分類:
1.單維時間序列
單維時間序列
發(fā)表于 08-07 23:03
時間序列分類(Time Series Classification, TSC)是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域的重要任務(wù)之一,廣泛應(yīng)用于人體活動識別、系統(tǒng)監(jiān)測、金融預(yù)測、醫(yī)療診斷等多個領(lǐng)域。隨
發(fā)表于 07-09 15:54
?653次閱讀
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)量的爆炸性增長對數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具,通過訓(xùn)練模型從數(shù)據(jù)中學(xué)習(xí)規(guī)律,為企業(yè)和組織提供了更高效、更準(zhǔn)確的數(shù)據(jù)
發(fā)表于 07-02 11:22
?515次閱讀
在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動力。它們各自以其獨特的方式推動著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器
發(fā)表于 07-01 11:40
?1100次閱讀
設(shè)備的運行狀況,生成各種維度的報告。
同時,通過大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)技術(shù),可以對業(yè)務(wù)進(jìn)行預(yù)測和預(yù)警,從而協(xié)助社會和企業(yè)進(jìn)行科學(xué)決策、降低成本并創(chuàng)造新的價值。
當(dāng)今時代,數(shù)據(jù)無處不在,而時間序列數(shù)據(jù)更是
發(fā)表于 06-25 15:00
頻譜分析儀是電子測量領(lǐng)域中的一項重要工具,主要用于分析信號的頻譜特性。隨著電子技術(shù)的飛速發(fā)展,頻譜分析儀的應(yīng)用范圍日益廣泛,其種類和技術(shù)指標(biāo)也日益豐富。本文將對頻譜分析儀的
發(fā)表于 05-14 15:48
?493次閱讀
在當(dāng)今信息化、網(wǎng)絡(luò)化的時代,網(wǎng)絡(luò)技術(shù)的迅速發(fā)展極大地推動了社會的進(jìn)步和變革。網(wǎng)絡(luò)分析儀作為一種在網(wǎng)絡(luò)技術(shù)中扮演重要角色的測試設(shè)備,其功能和應(yīng)用日益受到人們的關(guān)注。本文將對網(wǎng)絡(luò)分析儀的概述、分類、功能特點、應(yīng)用場景以及未來發(fā)展趨勢
發(fā)表于 05-10 15:26
?774次閱讀
機(jī)器視覺LED光源分類及特點解析 機(jī)器視覺技術(shù)已經(jīng)逐漸應(yīng)用于各個領(lǐng)域,尤其是在工業(yè)和醫(yī)療領(lǐng)域。在機(jī)器視覺系統(tǒng)中,LED光源扮演著非常重要的角色,用于提供光源以便進(jìn)行圖像采集和
發(fā)表于 12-15 10:31
?1247次閱讀
物聯(lián)網(wǎng)設(shè)備能產(chǎn)生大量數(shù)據(jù),機(jī)器學(xué)習(xí)算法可以評估分析這些數(shù)據(jù),兩者搭配相得益彰。機(jī)器學(xué)習(xí)作為人工智能的一部分,專門
發(fā)表于 11-11 08:23
?886次閱讀
評論