在线无码免费的毛片视频,亚洲熟妇中文字幕日产无码

導(dǎo)讀

為什么我們的機器學(xué)習(xí)項目會失??？

創(chuàng)造一個大的機器學(xué)習(xí)系統(tǒng)是一門藝術(shù)。

在構(gòu)建一個大的機器學(xué)習(xí)系統(tǒng)時，有很多事情需要考慮。但作為數(shù)據(jù)科學(xué)家，我們常常只擔(dān)心項目的某些部分。

但是我們是否考慮過一旦我們擁有了模型，我們將如何部署它們？

我見過許多 ML 項目，其中許多項目注定要失敗，因為它們從一開始就沒有一個固定的生產(chǎn)計劃。

這篇文章是關(guān)于一個成功的 ML 項目的過程需求 —— 一個進入生產(chǎn)的項目。

1. 在開始的時候建立基線

你并不需要用模型來獲得基線結(jié)果。

假設(shè)我們將使用 RMSE 作為我們的時間序列模型的評估指標(biāo)。我們在測試集上對模型進行了評估，RMSE 為 3.64。

3.64 是個好 RMSE 嗎？我們怎么知道？我們需要一個基線 RMSE。

這可能來自當(dāng)前使用的用于相同任務(wù)的模型。或者使用一些非常簡單的啟發(fā)式。對于時間序列模型，需要打敗的基線是最后一天的預(yù)測。即，預(yù)測前一天的數(shù)字。

如果是圖像分類任務(wù)，取 1000 個有標(biāo)簽的樣本。而人類的準(zhǔn)確性可以作為你的基線。如果一個人不能在任務(wù)中獲得 70%的預(yù)測精度，那么如果你的模型達到類似的水平，你總是可以考慮將流程自動化。

學(xué)習(xí)：在你創(chuàng)建模型之前，試著了解你將要得到的結(jié)果。設(shè)定一些不切實際的期望只會讓你和你的客戶失望。

2. 持續(xù)集成是前進的方向

你現(xiàn)在已經(jīng)創(chuàng)建了你的模型。它在本地測試數(shù)據(jù)集上的性能比基線/當(dāng)前模型要好。我們應(yīng)該繼續(xù)前進嗎？

我們有兩個選擇：

進一步改進我們的模型，這是一個無止境的循環(huán)。

在生產(chǎn)環(huán)境中測試我們的模型，得到更多關(guān)于可能出錯的信息，然后使用持續(xù)集成來改進我們的模型。

我支持第二種方法。Andrew Ng 在 Coursera 上的第三門課，“Deep Learning Specialization”中的“Structuring Machine learning”中說：

“不要一開始就試圖設(shè)計和構(gòu)建完美的系統(tǒng)。相反，應(yīng)該快速地建立和訓(xùn)練一個基本的系統(tǒng) —— 也許只需要幾天的時間。即使基本的系統(tǒng)遠遠不是你能建立的“最好”的系統(tǒng)，檢查基本的系統(tǒng)是有價值的：你會很快找到一些線索，告訴你在哪些方面最值得投入你的時間。

完成比完美更好。

學(xué)習(xí)：如果你的新模型比當(dāng)前生產(chǎn)中的模型更好，或者你的新模型比基線更好，那么等待投入生產(chǎn)是沒有意義的。

3. 你的模型可能會進入生產(chǎn)

你的模型是否優(yōu)于基線？它在本地測試數(shù)據(jù)集上表現(xiàn)得更好，但是它真的能在整體上工作得很好嗎？

為了測試你的模型優(yōu)于現(xiàn)有模型的假設(shè)的有效性，你可以設(shè)置一個A/B 測試。一些用戶(測試組)看到來自你的模型的預(yù)測，而一些用戶(控制組)看到來自前一個模型的預(yù)測。

事實上，這是部署模型的正確方式。你可能會發(fā)現(xiàn)你的模型并沒有看起來那么好。

錯了并不是真的錯，錯的是沒有預(yù)料到我們可能會錯。

很難指出你的模型在生產(chǎn)環(huán)境中表現(xiàn)不佳的真正原因，但一些原因可能是：

你可能會看到實時的數(shù)據(jù)與訓(xùn)練數(shù)據(jù)有很大的不同。

或者你沒有正確地完成預(yù)處理 pipeline。

或者你沒有正確地衡量 perf ormance。

或者你的實現(xiàn)中有一個 bug。

學(xué)習(xí)：不要全面投入生產(chǎn)。A/B 測試永遠是前進的好方法。準(zhǔn)備一些可以依靠的東西(可能是一個更老的模型)?？傆幸恍〇|西會出問題，這是你無法預(yù)料的。

4. 你的模型可能不會投入生產(chǎn)中

我創(chuàng)建了這個令人印象深刻的 ML 模型，它提供了 90%的準(zhǔn)確性，但它需要大約 10 秒鐘來獲取預(yù)測。

**這樣可接受嗎？**對于某些用例可能是，但實際上不是。

在過去，有許多 Kaggle 競賽的獲勝者最終創(chuàng)造了非常大的模型集成，占據(jù)了排行榜的榜首。下面是一個例子模型，它曾在 Kaggle 上贏得 Otto 分類挑戰(zhàn)：

在Level1上用了33個模型和8種特征工程

另一個例子是 Netflix 百萬美元推薦引擎挑戰(zhàn)。由于涉及的工程成本，Netflix 團隊最終沒有使用獲獎解決方案。

那么，如何讓你的模型在機器上既準(zhǔn)確又簡單呢？

機器學(xué)習(xí)模型部署到ML項目的過程

Te acher — Student模型

這就引出了 Teacher-Student 模型或“知識蒸餾”的概念。在知識蒸餾中，我們在一個更大的已經(jīng)訓(xùn)練好的教師模型上訓(xùn)練一個更小的學(xué)生模型。

這里我們使用來自教師模型的軟標(biāo)簽/概率，并將其作為學(xué)生模型的訓(xùn)練數(shù)據(jù)。

關(guān)鍵是，老師輸出類別概率 —— “軟標(biāo)簽”而不是“硬標(biāo)簽”。例如，一個水果分類器可能會說“Apple 0.9, Pear 0.1”而不是“Apple 1.0, Pear 0.0”。為什么要這樣呢？因為這些“軟標(biāo)簽”比原來的標(biāo)簽信息更豐富——告訴學(xué)生，是的，這個蘋果確實有點像梨。學(xué)生模型通?？梢苑浅＝咏處熕降谋憩F(xiàn)，即使參數(shù)少了 1-2 個數(shù)量級！

學(xué)習(xí)：有時，我們的預(yù)測時間很有限，所以我們想要一個更輕的模型。我們可以嘗試構(gòu)建更簡單的模型，或者嘗試對這樣的用例使用知識蒸餾。

5. 周期性的維護和反饋

世界不是恒定的，你的模型權(quán)重也不是恒定的

我們周圍的世界正在迅速變化，兩個月前可能適用的東西現(xiàn)在可能已經(jīng)不適用了。在某種程度上，我們建立的模型是對世界的反映，如果世界在變化，我們的模型應(yīng)該能夠反映這種變化。

機器學(xué)習(xí)模型部署到ML項目的過程

模型性能通常隨時間而下降。

由于這個原因，我們必須在一開始就考慮將我們的模型升級作為維護的一部分

維護周期的頻率完全取決于你試圖解決的業(yè)務(wù)問題。在一個廣告預(yù)測系統(tǒng)中，用戶往往變化無常，購買模式不斷出現(xiàn)，需要相當(dāng)高的頻率。而在評論情緒分析系統(tǒng)中，由于語言本身的結(jié)構(gòu)變化不是很大，所以頻率不需要那么高。

機器學(xué)習(xí)模型部署到ML項目的過程

我還必須要承認(rèn)反饋回路在機器學(xué)習(xí)系統(tǒng)中的重要性。假設(shè)你用貓狗分類器預(yù)測了一個的圖像是狗，但是概率很低。我們能從這些低置信度的例子中學(xué)到什么嗎？你可以將其發(fā)送到手動檢查，以檢查它是否可以用于重新訓(xùn)練模型。通過這種方式，我們可以在它不確定的樣本上訓(xùn)練分類器。

學(xué)習(xí)：在考慮生產(chǎn)時，提出使用反饋來維護和改進模型的計劃。

總結(jié)

在考慮將模型投入生產(chǎn)之前，我發(fā)現(xiàn)這些事情是很重要的。

雖然這并不是你需要考慮的事情和可能出錯的事情的詳盡列表，但它無疑可以作為你下次創(chuàng)建機器學(xué)習(xí)系統(tǒng)時的思想食糧。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

機器學(xué)習(xí)

機器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8353

瀏覽量
132315

AI大模型與深度學(xué)習(xí)的關(guān)系

AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系，它們互為促進，相輔相成。以下是對兩者關(guān)系的介紹：一、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐：深度學(xué)習(xí)

發(fā)表于 10-23 15:25 ?308次閱讀

AI大模型與傳統(tǒng)機器學(xué)習(xí)的區(qū)別

多個神經(jīng)網(wǎng)絡(luò)層組成，每個層都包含大量的神經(jīng)元和權(quán)重參數(shù)。傳統(tǒng)機器學(xué)習(xí) ：模型規(guī)模相對較小，參數(shù)數(shù)量通常只有幾千到幾百萬個，模型結(jié)構(gòu)相對簡單

發(fā)表于 10-23 15:01 ?299次閱讀

構(gòu)建語音控制機器人 - 線性模型和機器學(xué)習(xí)

2024-07-31 |Annabel Ng 在該項目的[上一篇博客文章]中，我介紹了運行機器人電機、處理音頻信號和調(diào)節(jié)電壓所需的電路的基礎(chǔ)知識。然而，機器人還沒有完全完成！盡管機器人

發(fā)表于 10-02 16:31 ?156次閱讀

深度學(xué)習(xí)模型量化方法

深度學(xué)習(xí)模型量化是一種重要的模型輕量化技術(shù)，旨在通過減少網(wǎng)絡(luò)參數(shù)的比特寬度來減小模型大小和加速推理過程，同時盡量保持

發(fā)表于 07-15 11:01 ?437次閱讀

pycharm如何訓(xùn)練機器學(xué)習(xí)模型

PyCharm是一個流行的Python集成開發(fā)環(huán)境（IDE），它提供了豐富的功能，包括代碼編輯、調(diào)試、測試等。在本文中，我們將介紹如何在PyCharm中訓(xùn)練機器學(xué)習(xí)模型。一、安裝PyCharm

發(fā)表于 07-11 10:14 ?623次閱讀

PyTorch神經(jīng)網(wǎng)絡(luò)模型構(gòu)建過程

PyTorch，作為一個廣泛使用的開源深度學(xué)習(xí)庫，提供了豐富的工具和模塊，幫助開發(fā)者構(gòu)建、訓(xùn)練和部署神經(jīng)網(wǎng)絡(luò)模型。在神經(jīng)網(wǎng)絡(luò)模型中，輸出層是尤為關(guān)鍵的部分，它負(fù)責(zé)將

發(fā)表于 07-10 14:57 ?420次閱讀

深度學(xué)習(xí)模型訓(xùn)練過程詳解

深度學(xué)習(xí)模型訓(xùn)練是一個復(fù)雜且關(guān)鍵的過程，它涉及大量的數(shù)據(jù)、計算資源和精心設(shè)計的算法。訓(xùn)練一個深度學(xué)習(xí)模型，本質(zhì)上是通過優(yōu)化算法調(diào)整

發(fā)表于 07-01 16:13 ?1023次閱讀

鴻蒙實戰(zhàn)開發(fā)-本地部署、SmartPerf 編譯部署指導(dǎo)文檔

install 在項目目錄下運行命令: npm run build 編譯成功后會有main 可執(zhí)行文件生成。 項目部署 直接運行 ./main 可執(zhí)行程序，完成項目的部署。

發(fā)表于 05-09 14:23

深入探討機器學(xué)習(xí)的可視化技術(shù)

機器學(xué)習(xí)可視化（簡稱ML可視化）一般是指通過圖形或交互方式表示機器學(xué)習(xí)模型、數(shù)據(jù)及其關(guān)系的

發(fā)表于 04-25 11:17 ?353次閱讀

基于 Renesas 的 RA8M1 實現(xiàn) AI 和 ML 部署

作者：Kenton Williston 人工智能 (AI)、機器學(xué)習(xí) (ML) 和其他計算密集型工作負(fù)載在物聯(lián)網(wǎng)?(IoT) 網(wǎng)絡(luò)邊緣的興起，給微控制器 (MCU) 帶來了額外的處理負(fù)載。處理這些

發(fā)表于 04-23 15:04 ?1118次閱讀

機器學(xué)習(xí)（ML）推理主要計算之存內(nèi)計算芯片

機器學(xué)習(xí)（ML）應(yīng)用已經(jīng)在汽車、醫(yī)療保健、金融和技術(shù)等各個領(lǐng)域變得無處不在。這導(dǎo)致對高性能、高能效 ML 硬件解決方案的需求不斷增加。

發(fā)表于 04-07 10:48 ?1009次閱讀

使用CUBEAI部署tflite模型到STM32F0中，模型創(chuàng)建失敗怎么解決？

看到CUBE_AI已經(jīng)支持到STM32F0系列芯片，就想拿來入門嵌入式AI。生成的模型很小，是可以部署到F0上的，但是一直無法創(chuàng)建成功。查閱CUBE AI文檔說在調(diào)用create

發(fā)表于 03-15 08:10

英特爾CPU部署Qwen 1.8B模型的過程

本文介紹了在英特爾 13 代酷睿 CPU i5 - 13490F 設(shè)備上部署 Qwen 1.8B 模型的過程，你需要至少 16GB 內(nèi)存的機器來完成這項任務(wù)，我們將使用英特爾的大

發(fā)表于 01-12 10:28 ?2492次閱讀

如何使用TensorFlow構(gòu)建機器學(xué)習(xí)模型

在這篇文章中，我將逐步講解如何使用 TensorFlow 創(chuàng)建一個簡單的機器學(xué)習(xí)模型。

發(fā)表于 01-08 09:25 ?895次閱讀

如何使用OpenVINO C++ API部署FastSAM模型

FastSAM 模型 | 開發(fā)者實戰(zhàn)》，在該文章中我們向大家展示了基于 OpenVINO Python API 的基本部署流程。在實際部署過程中會考慮到由效率問題，使得我們可能更傾向

發(fā)表于 11-17 09:53 ?839次閱讀