0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計算機相關(guān)概念太難、太抽象?別怕,往下看!

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-08-19 09:12 ? 次閱讀

馬爾科夫鏈、主成分分析以及條件概率等概念,是計算機學生必學的知識點,然而理論的抽象性往往讓學生很難深入地去體會和理解。而本文,將這些抽象的理論概念,用可視化的方式來解釋,還可調(diào)節(jié)相應(yīng)參數(shù)來改變結(jié)果,使這些抽象概念變得生動而立體!

計算機相關(guān)概念太難、太抽象?別怕,往下看!

人類對視覺信息的記憶要遠遠大于文字信息。使用圖表等形式的可視化,可以讓抽象、難懂的概念一目了然;在此基礎(chǔ)之上,添加可控的參數(shù)調(diào)節(jié)器,將更有助于對概念的深入學習與理解。

馬爾科夫鏈

馬爾科夫鏈是指數(shù)學中具有馬爾科夫性質(zhì)的離散事件隨機過程。在其每一步中,系統(tǒng)根據(jù)概率分布可以從一個狀態(tài)變到另一個狀態(tài),也可以保持當前狀態(tài)。狀態(tài)的改變叫做轉(zhuǎn)移,與不同的狀態(tài)改變相關(guān)的概率叫做轉(zhuǎn)移概率。

這概念是不是看著有點暈?沒關(guān)系,我們來看下面這張圖:

2種狀態(tài)的馬爾科夫鏈

在狀態(tài)空間中有兩種狀態(tài),A和B。共有4種可能的轉(zhuǎn)換。如果我們在A,接下來可以過渡到B或留在A。如果我們在B,可以過渡到A或者留在B。在這張圖中,從任意狀態(tài)到任意狀態(tài)的轉(zhuǎn)移概率是0.5。

當然,真正的建模工作者不會總是就畫一張馬爾科夫鏈圖。 相反,他們會使用“轉(zhuǎn)移矩陣”來計算轉(zhuǎn)移概率。狀態(tài)空間中的每個狀態(tài)都會出現(xiàn)在表格中的一列或者一行中。矩陣中的每個單元格都告訴你從行狀態(tài)轉(zhuǎn)換到列狀態(tài)的概率。因此,在矩陣中,單元格做的工作和圖中的箭頭所示是一樣。

如果狀態(tài)空間添加了一個狀態(tài),我們將添加一行和一列,向每個現(xiàn)有的列和行添加一個單元格。 這意味著當我們向馬爾可夫鏈添加狀態(tài)時,單元格的數(shù)量會呈二次方增長。因此,轉(zhuǎn)換矩陣就起到了很大的作用(除非你想把法爾科夫鏈圖畫的跟叢林一樣)。

馬爾科夫鏈的一個作用是用計算機模擬現(xiàn)實世界中的現(xiàn)象。例如,可以用來檢測一個新建的水壩溢流的頻率(取決于連續(xù)下雨的天數(shù))。為建立這個模型,可以從下面的雨天(R)和晴天(S)開始:

表述這種模擬天氣的方法就是:“有一半的天數(shù)是下雨天。所以模擬中的每一天都有50%的概率是下雨的?!边@個規(guī)則在模擬中所產(chǎn)生的序列如下:

你注意到上面的序列和原來的不太一樣了嗎?第二個序列似乎具有跳躍性,而第一個(真實數(shù)據(jù))似乎具有“粘性”。在真實的數(shù)據(jù)中,如果某一天是晴天,那么第二天也很可能是晴天。

可以通過兩個狀態(tài)的馬爾可夫鏈來消除這種“粘性”。當馬爾科夫鏈處于狀態(tài)“R”時,它保持在該狀態(tài)的概率是0.9,狀態(tài)改變的概率是0.1。同樣,“S”狀態(tài)保持不變的概率是0.9,過渡到“R”狀態(tài)的概率是0.1。

在許多需要對大規(guī)模的現(xiàn)象做研究的工作人員手中,馬爾科夫鏈的作用可以變得非常強大。例如,谷歌用于確定搜索結(jié)果順序的算法,稱為PageRank,就是一種馬爾可夫鏈。

主成分分析(PCA)

主成分分析, 是一種統(tǒng)計方法。通過正交變換將一組可能存在相關(guān)性的變量轉(zhuǎn)換為一組線性不相關(guān)的變量,轉(zhuǎn)換后的這組變量叫主成分。PCA是最重要的降維方法之一,在數(shù)據(jù)壓縮消除冗余和數(shù)據(jù)噪音消除等領(lǐng)域都有廣泛的應(yīng)用。

2D示例

首先,只考慮兩個維度的數(shù)據(jù)集,比如高度和重量。這個數(shù)據(jù)集可以繪制成平面上的點。但如果想要整理出變量,PCA會找到一個新的坐標系,其中每個點都有一個新的(x,y)值。坐標軸實際上沒有任何物理意義。它們是高度和重量的組合,被稱為“主分量”。

拖動原始數(shù)據(jù)集中的點,可以看到PC坐標系統(tǒng)正在調(diào)整

PCA對于降維很有用。下面,我們將數(shù)據(jù)繪制成兩條直線:一條由x值組成,另一條由y值組成。

但是,如果我們只打算沿一個維度查看數(shù)據(jù),那么將該維度作為具有最大變化的主成分可能會更好。 通過減少PC2,不會造成太大損失,因為它對數(shù)據(jù)集的變化貢獻最小。

3D示例

看透一個數(shù)據(jù)云是非常困難的,因此,在3D空間中,PCA顯得更為重要。在下面的示例中,原始數(shù)據(jù)以3D的形式繪制,但可以通過不同的視角,將其投射到2D空間。確定好角度之后,點擊“顯示PCA”按鈕,即可呈現(xiàn)2D的結(jié)果。在本例中,PCA變換確保水平軸PC1的變化量最大,垂直軸PC2的變化量次之,第三軸PC3的變化量最少。顯然,PC3是丟棄的。

應(yīng)用:吃喝在英國

如果數(shù)據(jù)集不僅僅是三維的,而是17個維度的呢?!如下表所示:

表中是英國每個地區(qū)平均每人每周17種食物的消費量,單位為克。這張表顯示了不同食物類型之間存在的一些有趣的差異,但總體差異并不顯著。讓我們看看PCA是否可以通過降維來強地區(qū)家之間的差異。

下圖是第一個主成分的數(shù)據(jù)圖。 我們可以看到一些有關(guān)北愛爾蘭的情況已經(jīng)發(fā)生了變化。

現(xiàn)在,看看第一和第二主成分,可以看到北愛爾蘭是一個主要的異常值。一旦回過頭來看看表格中的數(shù)據(jù),這就顯得很有道理了:北愛爾蘭人吃的新鮮土豆要很多,吃的新鮮水果、奶酪、魚和酒精飲料較少。這是一個很好的跡象,我們所看到的結(jié)構(gòu)反映了現(xiàn)實世界地理的一個重要事實:北愛爾蘭是四個國家中唯一一個不在大不列顛島上的。

條件概率

條件概率是指一個事件在另外一個事件已經(jīng)發(fā)生條件下的發(fā)生概率。一個落下來的球可能落在紅色的架子上(稱之為A事件),或者落在藍色架子上(稱之為B事件),或者兩者兼而有之。

那么給定一個球,它擊中了紅色架子(A事件),而后擊中藍色架子(B事件)的概率會是多少呢?可以通過給定A的條件概率,即P(B | A)來回答這個問題。

將抽象、難懂的計算機概念,以可視化的形式展現(xiàn)出來,可以幫助學生、研究者更好的理解;甚至可以幫助教師們提高教學質(zhì)量。

無論如何,希望讀者們能從本文中得到或多或少的幫助。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • PCA
    PCA
    +關(guān)注

    關(guān)注

    0

    文章

    88

    瀏覽量

    29536
  • 可視化
    +關(guān)注

    關(guān)注

    1

    文章

    1166

    瀏覽量

    20858
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1200

    瀏覽量

    24621

原文標題:【“看見”理論】13張動圖,徹底看懂馬爾科夫鏈、PCA和條件概率

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    計算機的分類及基本組成

    )==二、計算機發(fā)展歷程1.計算機硬件的發(fā)展2. 計算機的分類按用途劃分按照計算機性能按指令和數(shù)據(jù)流分類3. 一個概念三、
    發(fā)表于 07-16 07:12

    計算機有哪些功能

    一句話概括:計算機體系結(jié)構(gòu)講的是計算機有哪些功能(包括指令集、數(shù)據(jù)類型、存儲器尋址技術(shù)、I/O機理等等),是抽象的;計算機組成原理講的是計算機
    發(fā)表于 07-16 07:45

    什么是計算機系統(tǒng)、計算機硬件和計算機軟件?

    計算機軟件:計算機運行所需的程序及相關(guān)資料。硬件和軟件在計算機系統(tǒng)中相互依存,缺一不可,因此同樣重要。5. 馮?諾依曼計算機的特點是什么?
    發(fā)表于 07-22 09:06

    計算機網(wǎng)絡(luò)概述

    技術(shù)小白要崛起——【計算機網(wǎng)絡(luò)】學習【1】第一章:計算機網(wǎng)絡(luò)概述基礎(chǔ)概念計算機數(shù)據(jù)通信過程OSI參考模型TCP/IP協(xié)議和OSI參考模型計算機
    發(fā)表于 07-22 06:26

    計算機模糊控制的相關(guān)知識

    模糊控制的相關(guān)知識、計算機接口技術(shù)的介紹以及計算機接口技術(shù)在工程實際當中的應(yīng)用等課程內(nèi)容的介紹,概括了模糊控制的數(shù)學基礎(chǔ)、模糊控制的工作原理與計算機接口技術(shù)。
    發(fā)表于 09-10 06:08

    計算機應(yīng)用基礎(chǔ)相關(guān)知識

    年月統(tǒng)考試題計算機應(yīng)用基礎(chǔ)計算機應(yīng)用基礎(chǔ)9一、單選題1、第四代計算機的典型代表是______。A:巨型機B:大中型機C:小型機D:微型機答案: D2、下列不屬于電子數(shù)字計算機特點的是_
    發(fā)表于 09-10 07:39

    計算機及系統(tǒng)組成

    存儲過程中按照執(zhí)行的順序;以運算器和控制器作為計算機結(jié)構(gòu)的中心等。馮諾依曼計算機廣泛應(yīng)用于數(shù)據(jù)的處理和控制方面,但是存在一些局限性2、結(jié)構(gòu):控制器、運算器、存儲器、輸入輸出共五個部分1.2單片機、單板機、PC的區(qū)別概念:CPU:
    發(fā)表于 12-09 08:19

    計算機體系結(jié)構(gòu)的相關(guān)資料推薦

    layer of indirection.”“計算機科學領(lǐng)域的任何問題都可以通過增加一個間接的中間層來解決”0.計算機的體系結(jié)構(gòu)圖1.操作系統(tǒng)概念...
    發(fā)表于 01-07 06:42

    量子計算機的優(yōu)點_量子計算機的應(yīng)用_量子計算機的未來應(yīng)用

    量子計算機是一類遵循量子力學規(guī)律進行高速數(shù)學和邏輯運算、存儲及處理量子信息的物理裝置。當某個裝置處理和計算的是量子信息,運行的是量子算法時,它就是量子計算機。量子計算機
    發(fā)表于 11-28 18:10 ?1.2w次閱讀

    計算機圖形學總覽:圖像和圖像的概念辨析

    計算機圖形學和計算機視覺是同一過程的兩個方向。計算機圖形學將抽象的語義信息轉(zhuǎn)化成圖形,計算機視覺則從圖形中提取
    的頭像 發(fā)表于 08-21 09:10 ?6528次閱讀

    計算機視覺技術(shù)的概念

    正像其它學科一樣,一個大量人員研究了多年的學科,卻很難給出一個嚴格的定義,模式識別如此,目前火熱的人工智能如此,計算機視覺亦如此。與計算機視覺密切相關(guān)概念有視覺感知(visual
    的頭像 發(fā)表于 03-10 14:19 ?4418次閱讀

    計算機視覺的基礎(chǔ)概念和現(xiàn)實應(yīng)用

    本文將介紹計算機視覺的基礎(chǔ)概念和現(xiàn)實應(yīng)用,對任何聽說過計算機視覺但不確定它是什么以及如何應(yīng)用的人,本文是了解計算機視覺這一復雜問題的便捷途徑。
    的頭像 發(fā)表于 11-08 10:10 ?1432次閱讀

    計算機通信的簡單概念

    計算機通信指的是在兩個或多個計算機之間進行數(shù)據(jù)傳輸和信息交換的過程。計算機通信可以分為點對點通信和廣播通信兩種模式。在點對點通信模式下,數(shù)據(jù)從一個計算機直接傳輸?shù)搅硪粋€
    發(fā)表于 05-09 16:48 ?1833次閱讀

    計算機視覺相關(guān)概念總結(jié)

    為了幫助同事和客戶了解更多有關(guān)計算機視覺和AI的更多信息,我們言簡意賅介紹一些計算機視覺和AI術(shù)語,希望能幫助到大家。
    的頭像 發(fā)表于 05-31 10:11 ?715次閱讀

    計算機組成與設(shè)計

    組成與設(shè)計的一些基本概念和內(nèi)容,同時探討這門課程的重要性以及對未來的影響。 一、計算機組成原理 計算機組成原理是計算機科學中的一個重要分支,它主要研究
    的頭像 發(fā)表于 08-17 12:37 ?1241次閱讀