我們總說(shuō)“不要重復(fù)發(fā)明輪子”，python 中的第 3 方工具庫(kù)就是最好的例子。借助它們，我們可以用簡(jiǎn)單的方式編寫(xiě)復(fù)雜且耗時(shí)的代碼。在本篇內(nèi)容中給大家整理了 7 個(gè)有用的 Python 庫(kù)，如果大家從事機(jī)器學(xué)習(xí)工作，一定要來(lái)一起了解一下。1.Prophet

Prophet是 Facebook 開(kāi)源的時(shí)間序列預(yù)測(cè)工具庫(kù)，基于 Stan 框架，可以自動(dòng)檢測(cè)時(shí)間序列中的趨勢(shì)、周期性和節(jié)假日效應(yīng)，并根據(jù)這些信息進(jìn)行預(yù)測(cè)。這個(gè)庫(kù)在 GitHub 上有超過(guò) 15k 星。

Prophet 通常用于預(yù)測(cè)未來(lái)幾個(gè)月、幾年或幾十年的時(shí)間序列數(shù)據(jù)，例如銷(xiāo)售額、市場(chǎng)份額等。它提供了 Python 和 R 兩個(gè)版本，可以跨平臺(tái)使用，支持 CPU 和 GPU 的并行運(yùn)算。Prophet 的輸入數(shù)據(jù)格式要求是一個(gè)包含時(shí)間戳和目標(biāo)值的數(shù)據(jù)框，并支持給定時(shí)間范圍、預(yù)測(cè)期限和寬限期等參數(shù)進(jìn)行預(yù)測(cè)。Prophet 對(duì)缺失數(shù)據(jù)和趨勢(shì)變化很穩(wěn)健，通?？梢院芎玫靥幚懋惓Ｖ?。

# Pythonforecast = m.predict(future)forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].tail()

2.Deep Lake

Deep Lake是一種數(shù)據(jù)集格式，提供簡(jiǎn)單的 API 以用于創(chuàng)建、存儲(chǔ)和協(xié)作處理任何規(guī)模的 AI 數(shù)據(jù)集。這個(gè)庫(kù)在 GitHub 上有超過(guò) 5k 星。

Deep Lake 的數(shù)據(jù)布局可以在大規(guī)模訓(xùn)練模型的同時(shí)，實(shí)現(xiàn)數(shù)據(jù)的快速轉(zhuǎn)換和流式傳輸。谷歌、Waymo、紅十字會(huì)、牛津大學(xué)等都在使用 Deep Lake。

for epoch in range(2):    running_loss = 0.0    for i, data in enumerate(deeplake_loader):    images, labels = data['images'], data['labels']     # zero the parameter gradients    optimizer.zero_grad()     # forward + backward + optimize    outputs = net(images)    loss = criterion(outputs, labels.reshape(-1))    loss.backward()    optimizer.step()     # print statistics    running_loss += loss.item()    if i % 100 == 99: #print every 100 mini-batches        print('[%d, %5d] loss: %.3f' %        (epoch + 1, i + 1, running_loss / 100))        running_loss = 0.0

3.Optuna

Optuna 是一個(gè)自動(dòng)機(jī)器學(xué)習(xí)超參數(shù)調(diào)優(yōu)工具，可以幫助用戶通過(guò)使用各種規(guī)則自動(dòng)調(diào)整機(jī)器學(xué)習(xí)模型的超參數(shù)，以提高模型的性能。這個(gè)庫(kù)在 GitHub 上擁有超過(guò) 7k 顆星。

Optuna 使用了貝葉斯優(yōu)化算法來(lái)自動(dòng)調(diào)整超參數(shù)，并使用基于樹(shù)的方法來(lái)探索參數(shù)空間。這使得 Optuna 能夠在訓(xùn)練機(jī)器學(xué)習(xí)模型時(shí)自動(dòng)進(jìn)行超參數(shù)調(diào)整，從而提高模型的性能。Optuna 可以與各種機(jī)器學(xué)習(xí)框架集成使用，包括 TensorFlow、PyTorch、XGBoost 等。它還支持多種優(yōu)化目標(biāo)，包括最小化損失函數(shù)、最大化準(zhǔn)確率等。總的來(lái)說(shuō)，Optuna是一個(gè)強(qiáng)大的工具，可以幫助用戶提高機(jī)器學(xué)習(xí)模型的性能，提高模型的準(zhǔn)確率。它的易用性和可擴(kuò)展性使它成為機(jī)器學(xué)習(xí)工作流中的一個(gè)重要工具。

import ... # Define an objective function to be minimized.def objective(trial):     # Invoke suggest methods of a Trial object to generate hyperparameters     regressor_name = trial.suggest_categorical('regressor',['SVR', 'RandomForest'])    if regressor_name = 'SVR':        svr_c = trial.suggest_float('svr_c', 1e-10, 1e10, log=True)        regressor_obj = sklearn.svm.SVR(C=svr_c)    else:        rf_max_depth = trial.suggest_int('rf_max_depth', 2, 332)        regressor_obj = sklearn.ensemble.RandomForestRegressor(max_depth=rf_max_depth)     X, y = sklearn.datasets.fetch_california_housing(return_X_y=True)    X_train, X_val, y_train, y_val = sklearn.model_selection.train_test_split(X, y, random_state=0)     regressor_obj.fit(X_train, y_train) y_pred = regressor_obj.predict(X_val)     error = sklearn.metrics.mean_squared_error(y_val, y_pred)     return error # An objective value linked with the Trial object. study = optuna.create_study() # Create a neW studystudy.optimize(objective, n_trials=100) # Invoke opotimization of the objective function

4.pycm

pycm是一個(gè)用于計(jì)算二分類(lèi)和多分類(lèi)指標(biāo)的 Python 庫(kù)。這個(gè)庫(kù)在 GitHub 上有超過(guò) 1k 星。

它可以計(jì)算多種常用的指標(biāo)，包括準(zhǔn)確率、召回率、F1值、混淆矩陣等。此外，pycm 還提供了一些額外的功能，例如可視化混淆矩陣、評(píng)估模型性能的指標(biāo)來(lái)源差異等。pycm是一個(gè)非常實(shí)用的庫(kù)，可以幫助快速評(píng)估模型的性能。

from pycm import *y_actu = [2, 0, 2, 2, 0, 1, 1, 2, 2, 0, 1, 2] y_pred = [0, 0, 2, 1, 0, 2, 1, 0, 2, 2, 2, 2] cm = ConfusionMatrix(actual_vector=y_actu, predict_vector=y_pred) cm.classes cm.print_matrix()  cm.print_normalized_matrix()

5.NannyML

NannyML是一個(gè)開(kāi)源的 Python 庫(kù)，允許估算部署后的模型性能（而無(wú)需訪問(wèn)目標(biāo)），檢測(cè)數(shù)據(jù)漂移，并智能地將數(shù)據(jù)漂移警報(bào)鏈接回模型性能的變化。這個(gè)庫(kù)在 GitHub 上有超過(guò) 1k 星。

為數(shù)據(jù)科學(xué)家設(shè)計(jì)的 NannyML 具有易于使用的交互式可視化界面，目前支持所有表格式的用例（tabular use cases）、分類(lèi)（classification）和回歸（regression）。NannyML 的核心貢獻(xiàn)者研發(fā)了多種用于估算模型性能的新算法：基于信心的性能估算（CBPE）與直接損失估算（DLE）等。NannyML 通過(guò)構(gòu)建“性能監(jiān)控+部署后數(shù)據(jù)科學(xué)”的閉環(huán)，使數(shù)據(jù)科學(xué)家能夠快速理解并自動(dòng)檢測(cè)靜默模型故障。通過(guò)使用 NannyML，數(shù)據(jù)科學(xué)家最終可以保持對(duì)他們部署的機(jī)器學(xué)習(xí)模型的完全可見(jiàn)性和信任。

import nannyml as nmlfrom IPython.display import display # Load synthetic data reference, analysis, analysis_target = nml.load_synthnetic_binary_classification_dataset()display(reference.head())display(analysis.head()) # Choose a chunker or set a chunk sizechunk size = 5000 # initialize, specify required data columns,, fit estimator and estimateestimator = nml.CBPE(    y_pred_proba='y_pred_proba',    y_pred='y_pred',    y_true='work_home_actual',    metrics=['roc_auc'],    chunk_size=chunk_size,    problem_type='classification_binary',)estimator = estimator.fit(reference)estimated_performance = estimator.estimate(analysis) # Show resultsfigure = estimated_performance.plot(kind='performance', metric='roc_auc', plot_reference=True)figure.show()

6.ColossalAI

ColossalAI是一個(gè)開(kāi)源機(jī)器學(xué)習(xí)工具庫(kù)，用于構(gòu)建和部署高質(zhì)量的深度學(xué)習(xí)模型。這個(gè)庫(kù)在 GitHub 上有超過(guò) 6.5k 星。

ColossalAI 提供了一系列預(yù)定義的模型和模型基礎(chǔ)架構(gòu)，可用于快速構(gòu)建和訓(xùn)練模型。它還提供了一系列工具，用于模型評(píng)估，調(diào)優(yōu)和可視化，以確保模型的高質(zhì)量和準(zhǔn)確性。此外，ColossalAI 還支持部署模型，使其能夠通過(guò)各種不同的接口與其他系統(tǒng)集成。ColossalAI 的優(yōu)勢(shì)在于它易于使用，可以為數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師提供快速和有效的方法來(lái)構(gòu)建和部署高質(zhì)量的大型模型。

from colossalai.logging import get_dist_loggerfrom colossalai.trainer import Trainer, hooks # build components and initialize with colossaalai.initialize... # create a logger so that trainer can log on thhe consolelogger = get_dist_logger() # create a trainer objecttrainer = Trainer(    engine=engine,    logger=logger)

7.emcee

emcee是一個(gè)開(kāi)源的 Python 庫(kù)，用于使用 Markov chain Monte Carlo（MCMC）方法進(jìn)行模型擬合和參數(shù)估計(jì)。這個(gè)庫(kù)在 GitHub 上有超過(guò) 1k 星。

emcee 是面向?qū)ο蟮?，并且具有用于診斷和調(diào)試擬合過(guò)程的許多工具。它使用了一種叫做"決策樹(shù)結(jié)構(gòu)鏈"的方法，可以并行化擬合過(guò)程，提高擬合效率。emcee 非常適合處理復(fù)雜的非線性模型，并且可以輕松擴(kuò)展到大型數(shù)據(jù)集。它也可以輕松與其他 Python 庫(kù)集成，如 NumPy、SciPy和Matplotlib。

import numpy as npimport emcee def log_prob(x, ivar):    return -0.5 * np.sum(ivar * x ** 2)  ndim, nwalkers = 5, 100 ivar = 1./np.random.rand(ndim)p0 = np.random.randn(nwalkers, ndim) sampler = emcee.EnsembleSampler(nwalkers, ndim, log_prob, args=[ivar])sampler.run_mcmc(p0, 10000)

總結(jié)

以上就是給大家做的工具庫(kù)介紹，這7個(gè)工具庫(kù)都是非常有用的，對(duì)于機(jī)器學(xué)習(xí)工作者來(lái)說(shuō)，它們可以大大提高工作效率，讓你能夠在簡(jiǎn)單的方式下編寫(xiě)復(fù)雜的代碼。所以，如果你還沒(méi)有了解這些工具庫(kù)的話，不妨花一點(diǎn)時(shí)間來(lái)了解一下。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8306

瀏覽量
131848
python

python

+關(guān)注

關(guān)注
53

文章
4753

瀏覽量
84081
GitHub

GitHub

+關(guān)注

關(guān)注
3

文章
461

瀏覽量
16237

原文標(biāo)題：【推薦】7個(gè)強(qiáng)大實(shí)用的Python機(jī)器學(xué)習(xí)庫(kù)！

文章出處：【微信號(hào)：vision263com，微信公眾號(hào)：新機(jī)器視覺(jué)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

pytorch和python的關(guān)系是什么

在當(dāng)今的人工智能領(lǐng)域，Python已經(jīng)成為了最受歡迎的編程語(yǔ)言之一。Python的易學(xué)易用、豐富的庫(kù)和框架以及強(qiáng)大的社區(qū)支持，使其成為了數(shù)據(jù)科學(xué)、機(jī)

發(fā)表于 08-01 15:27 ?791次閱讀

Python自動(dòng)訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)

人工神經(jīng)網(wǎng)絡(luò)（ANN）是機(jī)器學(xué)習(xí)中一種重要的模型，它模仿了人腦神經(jīng)元的工作方式，通過(guò)多層節(jié)點(diǎn)（神經(jīng)元）之間的連接和權(quán)重調(diào)整來(lái)學(xué)習(xí)和解決問(wèn)題。Python由于其

發(fā)表于 07-19 11:54 ?160次閱讀

opencv-python和opencv一樣嗎

不一樣。OpenCV（Open Source Computer Vision Library）是一個(gè)開(kāi)源的計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)軟件庫(kù)，它提供了大量的圖像和視頻處理功能。OpenCV-

發(fā)表于 07-16 10:38 ?449次閱讀

深度學(xué)習(xí)常用的Python庫(kù)

深度學(xué)習(xí)作為人工智能的一個(gè)重要分支，通過(guò)模擬人類(lèi)大腦中的神經(jīng)網(wǎng)絡(luò)來(lái)解決復(fù)雜問(wèn)題。Python作為一種流行的編程語(yǔ)言，憑借其簡(jiǎn)潔的語(yǔ)法和豐富的庫(kù)支持，成為了深度

發(fā)表于 07-03 16:04 ?390次閱讀

如何使用Python進(jìn)行神經(jīng)網(wǎng)絡(luò)編程

神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介神經(jīng)網(wǎng)絡(luò)是一種受人腦啟發(fā)的機(jī)器學(xué)習(xí)模型，由大量的節(jié)點(diǎn)（或稱(chēng)為“神經(jīng)元”）組成，這些節(jié)點(diǎn)在網(wǎng)絡(luò)中相互連接。每個(gè)節(jié)點(diǎn)可以接收輸入，對(duì)輸入進(jìn)行加權(quán)求和，然后通過(guò)一個(gè)激活函數(shù)產(chǎn)生輸出

發(fā)表于 07-02 09:58 ?272次閱讀

如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練？

如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練？使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)和自動(dòng)訓(xùn)練需要掌握一些重要的概念和技術(shù)。在本文中，我們將介紹如何使用

發(fā)表于 01-12 16:06 ?446次閱讀

python第三方庫(kù)有哪些

Python 作為一門(mén)功能強(qiáng)大的編程語(yǔ)言，擁有豐富的第三方庫(kù)，幾乎覆蓋了各個(gè)領(lǐng)域的應(yīng)用。下面是一些常見(jiàn)且廣泛應(yīng)用的 Python 第三方庫(kù)的

發(fā)表于 11-29 14:31 ?1935次閱讀

windows7可以安裝python什么版本

Windows 7可以安裝多個(gè)Python版本，以下是適用于Windows 7的常見(jiàn)Python版本： Python 2.7：

發(fā)表于 11-23 17:15 ?2.4w次閱讀

python中如何引入math庫(kù)

在Python中，要使用math庫(kù)，首先需要先引入它。math庫(kù)是Python的一個(gè)標(biāo)準(zhǔn)庫(kù)，它提

發(fā)表于 11-22 11:03 ?3384次閱讀

時(shí)間序列分析的四個(gè)基本Python庫(kù)介紹

在本文中，我們將介紹四個(gè)主要的Python庫(kù)——statmodels、tslearn、tssearch、 tsfresh ——每個(gè)庫(kù)都針對(duì)時(shí)間序列分析的不同方面進(jìn)行了定制。這些

發(fā)表于 11-03 10:17 ?659次閱讀

Python 梯度計(jì)算模塊如何實(shí)現(xiàn)一個(gè)邏輯回歸模型

AutoGrad 是一個(gè)老少皆宜的 Python 梯度計(jì)算模塊。對(duì)于初高中生而言，它可以用來(lái)輕易計(jì)算一條曲線在任意一個(gè)點(diǎn)上的斜率。對(duì)于大學(xué)生、機(jī)器

發(fā)表于 10-21 11:01 ?419次閱讀

TinyDB ：一個(gè)純Python編寫(xiě)的輕量級(jí)數(shù)據(jù)庫(kù)

TinyDB 是一個(gè)純 Python 編寫(xiě)的輕量級(jí)數(shù)據(jù)庫(kù)，一共只有1800行代碼，沒(méi)有外部依賴(lài)項(xiàng)。 TinyDB的目標(biāo)是降低小型 Python 應(yīng)用程序使用數(shù)據(jù)

發(fā)表于 10-21 10:22 ?733次閱讀

Bulbea：用于股票市場(chǎng)預(yù)測(cè)和建模的Python庫(kù)

Bulbea 是一個(gè)基于深度學(xué)習(xí)開(kāi)發(fā)的，用于股票市場(chǎng)預(yù)測(cè)和建模的Python庫(kù)。 Bulbea 自帶了不少可用于股票深度學(xué)習(xí)訓(xùn)練及測(cè)試的AP

發(fā)表于 10-17 11:01 ?410次閱讀

如何使用Python和PinPong庫(kù)控制Arduino

Python程序員在編程Arduino時(shí)面臨的第一個(gè)挑戰(zhàn)是語(yǔ)言不同。Arduino IDE使用的是受C和C++啟發(fā)的語(yǔ)言。實(shí)際上，像Arduino這樣的平臺(tái)與Python非常搭配，特別適用于需要

發(fā)表于 10-13 10:59 ?759次閱讀

Python庫(kù)中oloredlogs的使用

coloredlogs介紹 coloredlogs是一個(gè)Python庫(kù)，它允許開(kāi)發(fā)人員在控制臺(tái)打印彩色日志。這個(gè)庫(kù)的主要優(yōu)點(diǎn)是它可以很容易地改變?nèi)罩鞠⒌念伾?，從而使日志更易于閱讀和理

發(fā)表于 10-07 11:28 ?717次閱讀

搜索歷史

7個(gè)強(qiáng)大實(shí)用的Python機(jī)器學(xué)習(xí)庫(kù)！

2.Deep Lake

3.Optuna

4.pycm

5.NannyML

6.ColossalAI

7.emcee

總結(jié)

評(píng)論

pytorch和python的關(guān)系是什么

Python自動(dòng)訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)

opencv-python和opencv一樣嗎

深度學(xué)習(xí)常用的Python庫(kù)

如何使用Python進(jìn)行神經(jīng)網(wǎng)絡(luò)編程

如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練？

python第三方庫(kù)有哪些

windows7可以安裝python什么版本

python中如何引入math庫(kù)

時(shí)間序列分析的四個(gè)基本Python庫(kù)介紹

Python 梯度計(jì)算模塊如何實(shí)現(xiàn)一個(gè)邏輯回歸模型

TinyDB ：一個(gè)純Python編寫(xiě)的輕量級(jí)數(shù)據(jù)庫(kù)

Bulbea：用于股票市場(chǎng)預(yù)測(cè)和建模的Python庫(kù)

如何使用Python和PinPong庫(kù)控制Arduino

Python庫(kù)中oloredlogs的使用

搜索歷史

7個(gè)強(qiáng)大實(shí)用的Python機(jī)器學(xué)習(xí)庫(kù)！

2.Deep Lake

3.Optuna

4.pycm

5.NannyML

6.ColossalAI

7.emcee

總結(jié)

評(píng)論

7個(gè)強(qiáng)大實(shí)用的Python機(jī)器學(xué)習(xí)庫(kù)！