隨著人工智能發(fā)展越來(lái)越快,機(jī)器學(xué)習(xí)成為了如今的熱門行業(yè),機(jī)器學(xué)習(xí)似乎是一個(gè)很重要的,具有很多未知特性的技術(shù)。今日?qǐng)?bào)道,谷歌上線基于TensorFlow的機(jī)器學(xué)習(xí)速成課程,包含一系列視頻講座課程、實(shí)際案例分析和實(shí)踐練習(xí)。被稱之為機(jī)器學(xué)習(xí)熱愛(ài)者的自學(xué)指南。
隨著機(jī)器學(xué)習(xí)越來(lái)越受到公眾的關(guān)注,很多初學(xué)者希望能快速了解機(jī)器學(xué)習(xí)及前沿技術(shù)。而今天谷歌上線了基于 TensorFlow 的機(jī)器學(xué)習(xí)速成課程,它包含 40 多項(xiàng)練習(xí)、25 節(jié)課程以及 15 個(gè)小時(shí)的緊湊學(xué)習(xí)內(nèi)容。谷歌官方描述為機(jī)器學(xué)習(xí)熱愛(ài)者的自學(xué)指南,且課程資料都是中文書寫,課程視頻都由機(jī)器學(xué)習(xí)技術(shù)轉(zhuǎn)述為中文音頻。這對(duì)于中文讀者來(lái)說(shuō)將會(huì)有很大的幫助,當(dāng)然我們也能選擇英文語(yǔ)音以更精確地學(xué)習(xí)內(nèi)容。此外,據(jù)記者了解,這曾是谷歌內(nèi)部培訓(xùn)工程師的課程,有近萬(wàn)名谷歌員工參與并將學(xué)到的東西用在產(chǎn)品的優(yōu)化和增強(qiáng)上。
課程地址:https://developers.google.cn/machine-learning/crash-course/
按照該課程所述,讀者可能需要初級(jí)代數(shù)知識(shí),如變量與系數(shù)、線性方程組和函數(shù)曲線等以理解基本的機(jī)器學(xué)習(xí)模型。此外,讀者也需要一些 Python 編程經(jīng)驗(yàn),但一般只需要最基礎(chǔ)的函數(shù)定義、列表/字典、循環(huán)和條件表達(dá)式等。本課程的實(shí)現(xiàn)是基于 Python 和 TensorFlow,不過(guò)讀者在學(xué)習(xí)前并不需要任何 TensorFlow 知識(shí)。
除了前面所述的兩個(gè)基本要求外,讀者可能還需要準(zhǔn)備一些基礎(chǔ)知識(shí),當(dāng)然等真正遇到再去查資料也完全沒(méi)問(wèn)題。其實(shí)準(zhǔn)備工作主要分為數(shù)學(xué)基礎(chǔ)、編程基礎(chǔ)和函數(shù)庫(kù)三個(gè)部分,我們給各位讀者提供記者的資源文章合集,以便查閱相關(guān)問(wèn)題。
在數(shù)學(xué)方面,代數(shù)相關(guān)的變量、系數(shù)、線性方程、對(duì)數(shù)和 Sigmoid 函數(shù)有助于讀者了解模型最基本的表達(dá),包括怎么定義的推斷過(guò)程、如何構(gòu)建的損失函數(shù)以及激活函數(shù)等。線性代數(shù)相關(guān)的矩陣和張量等知識(shí)有助于讀者理解模型在計(jì)算過(guò)程中到底代表了什么意思,例如矩陣乘法這種仿射變換在神經(jīng)網(wǎng)絡(luò)中代表了神經(jīng)元的線性組合或全連接。概率論與統(tǒng)計(jì)學(xué)也是有要求的,不過(guò)本課程僅僅需要能知道均值、方差等概念就行。對(duì)于微積分,我們只需要了解導(dǎo)數(shù)、偏導(dǎo)數(shù)和鏈?zhǔn)椒▌t的基本概念就行,雖然最優(yōu)化方法需要非常多的數(shù)學(xué)知識(shí)才能明確地推導(dǎo)出流行的優(yōu)化器表達(dá)式,但在基礎(chǔ)階段只需要調(diào)用工具就行了。
在 Python 編程與常見(jiàn)第三方庫(kù)等方面,該課程也只有非常少的要求,掌握基本的操作就行。例如 Python 的列表、字典和元組三大數(shù)據(jù)結(jié)構(gòu),還有循環(huán)和條件等基本表達(dá)式。而需要了解的第三方庫(kù)也是科學(xué)計(jì)算方面代表,如 NumPy、Pandas 和 Matplotlib 等。以下是 2017 年記者發(fā)過(guò)的教程,它基本上可以為讀者提供足夠的學(xué)習(xí)資料。
目錄
簡(jiǎn)介:
前提條件和準(zhǔn)備工作
機(jī)器學(xué)習(xí)概念:
框架處理(15 分鐘)機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)
深入了解機(jī)器學(xué)習(xí)(20 分鐘)什么是損失函數(shù),權(quán)重和 bias 是什么
降低損失(60 分鐘)兩種梯度下降,及對(duì)學(xué)習(xí)率的實(shí)驗(yàn)
使用 TensorFlow 基本步驟(60 分鐘)不能不懂的 TensorFlow
泛化(15 分鐘)什么是過(guò)擬合,怎樣評(píng)價(jià)一個(gè)模型的好壞,把數(shù)據(jù)集分成測(cè)試和訓(xùn)練兩部分
訓(xùn)練及測(cè)試集(25 分鐘)驗(yàn)證把數(shù)據(jù)集分成兩部分的好處
驗(yàn)證(40 分鐘)擔(dān)心過(guò)擬合?在測(cè)試和訓(xùn)練集外多弄一個(gè)驗(yàn)證集
表示法(65 分鐘)特征工程,75% 機(jī)器學(xué)習(xí)工程師的時(shí)間都在干的事
特征組合(70 分鐘)明白什么是特征組合,怎么用 TensorFlow 實(shí)現(xiàn)
正則化:簡(jiǎn)單性(40 分鐘)L2 正則化,學(xué)習(xí)復(fù)雜化和普遍化的取舍
邏輯回歸(20 分鐘)理解邏輯回歸,探索損失函數(shù)和正則化
分類(90 分鐘)評(píng)估一個(gè)邏輯回歸模型的正確性和精度
正則化:稀松性(45 分鐘)L2 的其他種類
介紹神經(jīng)網(wǎng)絡(luò)(40 分鐘)隱藏層,激活函數(shù)
訓(xùn)練神經(jīng)網(wǎng)絡(luò)(40 分鐘)反向傳播
多種類神經(jīng)網(wǎng)絡(luò)(50 分鐘)理解多類分類器問(wèn)題,Softmax,在 TensorFlow 中實(shí)現(xiàn) Softmax 結(jié)果。
嵌入(80 分鐘)什么是嵌入,這是干什么的,怎樣用好。
工程:
生產(chǎn) ML 系統(tǒng)(3 分鐘)ML 生產(chǎn)中的寬度
靜態(tài) vs. 動(dòng)態(tài)訓(xùn)練(7 分鐘)靜態(tài)和動(dòng)態(tài)訓(xùn)練的優(yōu)缺點(diǎn)
靜態(tài) vs. 動(dòng)態(tài)推斷(7 分鐘)靜態(tài)和動(dòng)態(tài)推斷的優(yōu)缺點(diǎn)
數(shù)據(jù)依賴(14 分鐘)理解 ML 中的數(shù)據(jù)依賴
生活中實(shí)際的 ML 例子:
預(yù)測(cè)癌癥(5 分鐘)
18 世紀(jì)文獻(xiàn)(5 分鐘)
真實(shí)世界方針(2 分鐘)
結(jié)論:
下一步要學(xué)習(xí)的內(nèi)容,推薦了 TensorFlow,Google 的課程深度學(xué)習(xí),及 Kaggle 比賽等。
練習(xí)題:
大部分練習(xí)題的數(shù)據(jù)是用的 California housing data set 。
測(cè)試分成三種,編程練習(xí),檢查你的理解和 Playground。
課程特點(diǎn)
這一機(jī)器學(xué)習(xí)速成課程最大的特點(diǎn)是它有完整的中文資料、中文語(yǔ)音和字幕以及中文測(cè)試題,它為機(jī)器學(xué)習(xí)初學(xué)者提供了最實(shí)用的的資料。
如下所示,該課程提供的課件非常適合于國(guó)內(nèi)初學(xué)者:
如下所示,該課程提供了很多中文練習(xí),包括編程練習(xí)和文本理解的選擇題,這非常有助于各位讀者檢驗(yàn)在視頻和資料中學(xué)習(xí)到的知識(shí)。
如下展示了機(jī)器學(xué)習(xí)術(shù)語(yǔ),這一部分分成全面的介紹了機(jī)器學(xué)習(xí)中的術(shù)語(yǔ)的含義,非常好懂。
最后,該課程還提供了非常多的中文學(xué)習(xí)資料或技術(shù)博客,這些文本資料同樣也是擴(kuò)展讀者知識(shí)并從原理上學(xué)習(xí)新技術(shù)的重要保證。
評(píng)論
查看更多