0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何利用好機(jī)器學(xué)習(xí),數(shù)據(jù)分析與處理很重要

獨(dú)愛72H ? 來(lái)源:網(wǎng)絡(luò)整理 ? 作者:佚名 ? 2020-04-12 22:44 ? 次閱讀

(文章來(lái)源:網(wǎng)絡(luò)整理)
機(jī)器學(xué)習(xí)涉及到很多的學(xué)科和門類,在我看來(lái),它更像是各個(gè)學(xué)科的集合體,因此想要學(xué)好機(jī)器學(xué)習(xí),你需要具備很多方面的知識(shí),不過(guò)也并不是所有人會(huì)用到機(jī)器學(xué)習(xí)的每個(gè)細(xì)節(jié),因此可以根據(jù)自己的專長(zhǎng)有針對(duì)性的學(xué)習(xí)。

我目前也在學(xué)習(xí)相關(guān)的技術(shù)資料,再加上之前也接觸過(guò)這方面的工作,所以對(duì)于機(jī)器學(xué)習(xí)方面還是有一定的了解,在我看來(lái)無(wú)論是什么樣的機(jī)器學(xué)習(xí)模型、分類、算法都是依托于原始數(shù)據(jù)的,原始數(shù)據(jù)的分析和處理是前提也是很重要的部分。

通常我身邊的工程師在進(jìn)行相關(guān)設(shè)計(jì)的時(shí)候有一個(gè)慣性的思維,先采集一大堆的數(shù)據(jù)然后用工具分析特征和生成模型,之后通過(guò)大量的數(shù)據(jù)采集來(lái)實(shí)現(xiàn)模型的修正和完善,這種方式應(yīng)該也是很多設(shè)計(jì)人員通常的思路,而且一般的情況下要求硬件采集設(shè)備盡可能的提供多種參數(shù),這樣可以豐富算法模型的輸入?yún)?shù),理論上可以更好地接近實(shí)際的結(jié)果,在純技術(shù)的角度上這個(gè)是可行的,而且隨著樣本量的增加,采用機(jī)器學(xué)習(xí)的思路,最終的模型和算法會(huì)越來(lái)越精確。

這樣的設(shè)計(jì)方法對(duì)于已有理想樣本或是可以很容易獲取樣本數(shù)據(jù)的前提下是非常高效的,但是如果已有樣本不是很理想,存在大量干擾成分,樣本數(shù)據(jù)受人為因素或者必須由人工采集獲取數(shù)據(jù)時(shí),傳統(tǒng)的方法就沒有太大優(yōu)勢(shì)了。這個(gè)時(shí)候需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和必要的分析,需要確定幾個(gè)問題:

一、預(yù)先確定幾個(gè)需要研究的參數(shù),選擇參數(shù)時(shí)需要有一定的依據(jù)和相關(guān)性,拿紅外信號(hào)輸出信號(hào)分析舉例,可以從公開的資料中知道紅外傳感器會(huì)受到溫度和光譜范圍的影響導(dǎo)致輸出曲線的變化,那么溫度和光譜范圍就是需要研究的參數(shù)。

二、確定了參數(shù)之后,先不要對(duì)所有參數(shù)進(jìn)行樣本數(shù)據(jù)采樣,而是針對(duì)單一參數(shù)進(jìn)行數(shù)據(jù)采樣,徹底明確單一參數(shù)對(duì)于最終結(jié)果的影響程度,也就是權(quán)重,用函數(shù)關(guān)系表示即:Y = F(X), Y為結(jié)果,X為樣本數(shù)據(jù)參數(shù),數(shù)據(jù)處理過(guò)程包括平滑、篩選、剔除、插入等基本操作,也就是預(yù)處理過(guò)程,之后可以生成基本的函數(shù)關(guān)系或?qū)φ毡恚瑸楹罄m(xù)的大模型的建立提供數(shù)據(jù)支持。

三、將每種數(shù)據(jù)參數(shù)的影響程度量化之后,我們就獲取了所有的參數(shù)對(duì)照表和函數(shù)對(duì)應(yīng)關(guān)系,利用這些已有的結(jié)果建立整個(gè)算法模型和框架結(jié)構(gòu),在模型中將每種數(shù)據(jù)的權(quán)重設(shè)計(jì)好,最終形成一個(gè)初步的機(jī)器學(xué)習(xí)模式。

四、在實(shí)現(xiàn)了以上三步之后,我們最終可以通過(guò)大數(shù)據(jù)樣本的采集來(lái)實(shí)現(xiàn)整個(gè)機(jī)器學(xué)習(xí)模型的完善,最終實(shí)現(xiàn)之前制定的目標(biāo)。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】時(shí)間序列的信息提取

    個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測(cè)任務(wù)。 特征工程(Feature Engineering)是將數(shù)據(jù)轉(zhuǎn)換為更好地表示潛在問題的特征,
    發(fā)表于 08-17 21:12

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來(lái)一點(diǎn)也不輕松,加油。 作者首先說(shuō)明了時(shí)間序列的信息提取是時(shí)間序列分析的一個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)
    發(fā)表于 08-14 18:00

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 了解時(shí)間序列

    收到《時(shí)間序列與機(jī)器學(xué)習(xí)》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個(gè)讓我學(xué)習(xí)時(shí)間序列及應(yīng)用的機(jī)會(huì)! 前言第一段描述了編寫背景: 由此可知,這是一本關(guān)于時(shí)間序列進(jìn)行大
    發(fā)表于 08-11 17:55

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)預(yù)處理與特征工程

    機(jī)器學(xué)習(xí)的整個(gè)流程中,數(shù)據(jù)預(yù)處理與特征工程是兩個(gè)至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量,進(jìn)而影響模型的訓(xùn)練效果和泛化能力。本文將從
    的頭像 發(fā)表于 07-09 15:57 ?194次閱讀

    數(shù)據(jù)分析除了spss還有什么

    Sciences)是一款非常流行的統(tǒng)計(jì)分析軟件,但除了SPSS之外,還有許多其他數(shù)據(jù)分析工具和方法。 引言 數(shù)據(jù)分析是一個(gè)跨學(xué)科的領(lǐng)域,涉及到統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、數(shù)據(jù)挖掘、
    的頭像 發(fā)表于 07-05 15:01 ?362次閱讀

    數(shù)據(jù)分析的工具有哪些

    數(shù)據(jù)分析是一個(gè)涉及收集、處理、分析和解釋數(shù)據(jù)以得出有意義見解的過(guò)程。在這個(gè)過(guò)程中,使用正確的工具至關(guān)重要。以下是一些主要的
    的頭像 發(fā)表于 07-05 14:54 ?521次閱讀

    數(shù)據(jù)分析有哪些分析方法

    數(shù)據(jù)分析是一種重要的技能,它可以幫助我們從大量的數(shù)據(jù)中提取有價(jià)值的信息,從而做出更明智的決策。在這篇文章中,我們將介紹數(shù)據(jù)分析的各種方法,包括描述性
    的頭像 發(fā)表于 07-05 14:51 ?324次閱讀

    機(jī)器學(xué)習(xí)數(shù)據(jù)分析中的應(yīng)用

    隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)量的爆炸性增長(zhǎng)對(duì)數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具,通過(guò)訓(xùn)練模型從
    的頭像 發(fā)表于 07-02 11:22 ?303次閱讀

    國(guó)內(nèi)機(jī)器人實(shí)際場(chǎng)景使用抽樣調(diào)查數(shù)據(jù)分析報(bào)告

    國(guó)內(nèi)機(jī)器人實(shí)際場(chǎng)景使用抽樣調(diào)查數(shù)據(jù)分析報(bào)告1背景我們通過(guò)為時(shí)3個(gè)月(2024年2月1日-2024年4月30日),針對(duì)國(guó)內(nèi)機(jī)器人實(shí)際使用者發(fā)出的1000份報(bào)告(收到實(shí)際反饋有效報(bào)告736份)。根據(jù)
    的頭像 發(fā)表于 05-28 08:14 ?455次閱讀
    國(guó)內(nèi)<b class='flag-5'>機(jī)器</b>人實(shí)際場(chǎng)景使用抽樣調(diào)查<b class='flag-5'>數(shù)據(jù)分析</b>報(bào)告

    串口接收不等長(zhǎng)的數(shù)據(jù)如何處理的呢?

    串口是一個(gè)很重要的通信方式,但是要用好串口并不是那么簡(jiǎn)單,比如如何接收不等長(zhǎng)的數(shù)據(jù)等。你們是如何處理的呢?大家來(lái)說(shuō)說(shuō)你們的做法。
    發(fā)表于 05-15 08:02

    求助,關(guān)于AD采集到的數(shù)據(jù)分析問題

    問題描述:使用AD采集一個(gè)10Hz到2MHz的脈沖,脈沖底部可能大于零,由采集到的數(shù)據(jù)分析出該脈沖的上升時(shí)間,幅值和占空比。 備注:在分析的時(shí)候已經(jīng)知道脈沖的頻率,精度為2X10^-5. 在分析
    發(fā)表于 05-09 07:40

    態(tài)勢(shì)數(shù)據(jù)分析系統(tǒng)軟件

    處理、分析和挖掘態(tài)勢(shì)數(shù)據(jù)的工具。它結(jié)合了數(shù)據(jù)集成、地圖制作、數(shù)據(jù)分析與挖掘以及可視化展示等多種功能 這類軟件能夠集成多種來(lái)源的地理
    的頭像 發(fā)表于 04-22 11:36 ?334次閱讀

    什么是機(jī)器學(xué)習(xí)?它的重要性體現(xiàn)在哪

    任務(wù)的解決方法。機(jī)器學(xué)習(xí)重要性體現(xiàn)在幾個(gè)方面數(shù)據(jù)處理能力:在當(dāng)今數(shù)字化時(shí)代,我們產(chǎn)生了大量的數(shù)據(jù)。機(jī)器
    的頭像 發(fā)表于 01-05 08:27 ?1084次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?它的<b class='flag-5'>重要</b>性體現(xiàn)在哪

    Get職場(chǎng)新知識(shí):做分析,用大數(shù)據(jù)分析工具

    數(shù)據(jù)管理的。 隨著原來(lái)越多的企業(yè)加入了數(shù)字化轉(zhuǎn)型的隊(duì)伍,大數(shù)據(jù)分析工具也越來(lái)越多地被應(yīng)用于各行各業(yè)的業(yè)務(wù)數(shù)據(jù)分析中,直至今日,大數(shù)據(jù)分析工具也成為了
    發(fā)表于 12-05 09:36

    基于大數(shù)據(jù)分析的5G智能工廠如何實(shí)現(xiàn)

    、應(yīng)用和未來(lái)的發(fā)展前景,以及它們?nèi)绾蜗嗷ソY(jié)合,推動(dòng)智能制造的未來(lái)發(fā)展。 大數(shù)據(jù)分析是指通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行分析,挖掘出其中有價(jià)值的信息和知識(shí),以指導(dǎo)業(yè)務(wù)決策和創(chuàng)新的過(guò)程。與傳統(tǒng)數(shù)據(jù)挖掘相
    的頭像 發(fā)表于 09-25 17:08 ?461次閱讀