導(dǎo)讀
如果你想要用機(jī)器學(xué)習(xí)來做一些事情,這里列出了 4 件最重要的事情。
如何確保你的項(xiàng)目保持在正軌上。
如果你是產(chǎn)品經(jīng)理,想要用機(jī)器學(xué)習(xí)來做一些事情,這里列出了 4 件最重要的事情:
1. 優(yōu)先考慮工程而不是數(shù)據(jù)科學(xué)
一個(gè)機(jī)器學(xué)習(xí)項(xiàng)目首先是一個(gè)軟件項(xiàng)目。許多數(shù)據(jù)科學(xué)家在構(gòu)建架構(gòu)良好、可靠、易于部署的軟件方面缺乏經(jīng)驗(yàn)。當(dāng)你構(gòu)建一個(gè)生產(chǎn)系統(tǒng)時(shí),這將成為一個(gè)問題。
根據(jù)經(jīng)驗(yàn),**工程師掌握數(shù)據(jù)科學(xué)技能的速度要比數(shù)據(jù)科學(xué)家掌握工程經(jīng)驗(yàn)的速度快。**如果有疑問,請(qǐng)與擁有 5 年以上經(jīng)驗(yàn)、對(duì)人工智能充滿激情的 python 工程師合作,而不是首次嘗試構(gòu)建商業(yè)應(yīng)用的數(shù)據(jù)科學(xué)博士。
2. 保持高效
盡早降低風(fēng)險(xiǎn)很重要。用具體的里程碑來組織你的項(xiàng)目:
完成原型:查看你的想法是否有希望在 1-2 周內(nèi)完成
離線測(cè)試系統(tǒng):對(duì)模型進(jìn)行調(diào)優(yōu),并在 2-4 周內(nèi)對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行嚴(yán)格測(cè)試
在線測(cè)試系統(tǒng):最終確定模型并在 2-4 周內(nèi)進(jìn)行測(cè)試
上線:自動(dòng)化數(shù)據(jù)更新、模型訓(xùn)練和代碼部署 2-4 周
持續(xù)改進(jìn):(可選)12 個(gè)月
總時(shí)間:1-3 個(gè)月
一個(gè)有經(jīng)驗(yàn)的團(tuán)隊(duì)?wèi)?yīng)該能夠?yàn)閹缀跛械捻?xiàng)目遵循這些時(shí)間表。讓團(tuán)隊(duì)在 1-3 個(gè)月內(nèi)建立一個(gè)實(shí)時(shí)系統(tǒng)。上線后,再?zèng)Q定是否值得進(jìn)一步改進(jìn)。
這些誘惑會(huì)不必要地延長(zhǎng)你的項(xiàng)目:
等待完美的數(shù)據(jù)
使用錯(cuò)誤的工具(太復(fù)雜或太慢)
可擴(kuò)展性的過度工程化
無休止地玩弄算法(見下一點(diǎn))
3. 算法不重要
機(jī)器學(xué)習(xí)系統(tǒng)有很多有趣的按鈕可以使用。不要這么干。
這些改進(jìn)值得花時(shí)間(按重要性排序):
獲取更多(相關(guān))輸入數(shù)據(jù)
對(duì)數(shù)據(jù)進(jìn)行更好的預(yù)處理
選擇正確的算法并進(jìn)行正確的調(diào)優(yōu)。
算法是最不重要的因素。簡(jiǎn)單地選擇一個(gè)可行的算法。無休止地升級(jí)算法是很誘人的,但它可能不會(huì)提供你期望的結(jié)果。
4. 交流,交流,交流
分享盡可能多的業(yè)務(wù)場(chǎng)景
一旦工程團(tuán)隊(duì)開始構(gòu)建,他們必須做出許多選擇。他們?cè)搅私饽愕妮p重緩急,就越能做出正確的決定。至少,你應(yīng)該告訴他們:
戰(zhàn)略重點(diǎn)
這是一個(gè)關(guān)鍵的問題嗎?它是否需要每天處理數(shù)百萬個(gè)請(qǐng)求?這是不是一個(gè)未來產(chǎn)品的研究?
目前的問題
目前處理流程是否太長(zhǎng)?是不是太不準(zhǔn)確了?還是有很多數(shù)據(jù)沒有機(jī)器學(xué)習(xí)就無法計(jì)算?
輸入和輸出
輸入:你(作為一個(gè)人)將使用哪些數(shù)據(jù)來做出正確的決策?輸出:誰將使用輸出?使用的頻率?它需要是實(shí)時(shí)的嗎?
性能指標(biāo)
最重要的指標(biāo)是什么:點(diǎn)擊率?銷售?投資回報(bào)?假陽性?
預(yù)計(jì)精度
如果你想要優(yōu)化轉(zhuǎn)化率,那么它可能不值得再花 2 周的時(shí)間來獲得 2%的準(zhǔn)確率。如果你建立了醫(yī)療診斷系統(tǒng),那么即使是 1%的假陰性也是不可接受的。
TL;DR
工程優(yōu)先于數(shù)據(jù)科學(xué)。
通過精益來降低風(fēng)險(xiǎn)。
不要被算法分心。
與開發(fā)人員共享所有業(yè)務(wù)需求。
-
AI
+關(guān)注
關(guān)注
87文章
29815瀏覽量
268109 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8353瀏覽量
132315
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論