0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

10個Python機器學習庫介紹

馬哥Linux運維 ? 來源:量子位 ? 作者:量子位 ? 2022-09-05 15:55 ? 次閱讀

1. Awkward Array

根據(jù)官方介紹,Awkward Array用于嵌套的、大小不一的數(shù)據(jù),包括任意長度的列表、記錄、混合的類型和缺失數(shù)據(jù),使用起來類似NumPy。

看起來像是升級版的NumPy呀。

73291e1a-2c5b-11ed-ba43-dac502259ad0.png

果然,不同長度的數(shù)組可以直接放在一起運算。

734e081a-2c5b-11ed-ba43-dac502259ad0.png

并且,官方表示Awkward Array不僅使用起來更簡便,在速度和內(nèi)存上也有量級的優(yōu)勢。

看看是不是可以安排上了~

https://pypi.org/project/awkward/

2. Jupytext

相信大家對Jupyter Notebook都不陌生。

當你有了Jupytext這個小插件就可以將Jupyter Notebook和IDE完美結(jié)合,聽起來是不是很棒!

從此Jupyter Notebook可以被存儲為Markdown文件或多種語言的腳本文件。

Jupytext可以做的事主要有:

Jupyter Notebook的版本控制

在你喜歡的文本編輯器中編輯、合并或重構(gòu)Notebook

在Notebook上使用Q&A檢查

Python中使用的樣子:

737403c6-2c5b-11ed-ba43-dac502259ad0.png

此項目在Github上已有5k+star。

https://github.com/mwouts/jupytext

3. Gradio

比Streamlit還輕量的UI設(shè)計庫,Gradio讓你輕松在瀏覽器中“玩轉(zhuǎn)”你的模型,可以直接在瀏覽器中拖放圖片,粘貼文字,錄制聲音,等等。

739bbbdc-2c5b-11ed-ba43-dac502259ad0.png

73b51c6c-2c5b-11ed-ba43-dac502259ad0.gif

只要將launch()函數(shù)中的參數(shù)設(shè)置為share=True,還能得到一個可分享的網(wǎng)址,拿到鏈接的朋友在電腦手機端都能打開,活脫脫就是一個小程序。

時常需要做Demo的小伙伴快看起來吧,此項目在Github上已有4.5k+star。

https://github.com/gradio-app/gradio

4. Hub

這個Hub在數(shù)據(jù)管理和數(shù)據(jù)預(yù)處理上可是一把好手。

它可以處理任何類型,任何大小的數(shù)據(jù),并且因為數(shù)據(jù)儲存在云端上,所以可以無縫在任何機器上訪問。

被壓縮為二進制字節(jié)的數(shù)據(jù)可以被存儲在任何地方,并且只有在需要的時候才會被獲取,所以沒有TB級硬盤也可以處理TB級數(shù)據(jù)。

Hub貼心地提供了重要API,支持數(shù)據(jù)在常用工具(PyTorch等)上的使用,數(shù)據(jù)版本控制,數(shù)據(jù)轉(zhuǎn)換等功能。

此項目在github上已有4.1k+star。

https://github.com/activeloopai/Hub

5. AugLy

AugLy是facebook最新推出的數(shù)據(jù)增強庫,同時支持語音,文本,圖像和視頻類型的數(shù)據(jù),包含了100多種增強方式。

數(shù)據(jù)對于模型訓練至關(guān)重要,而標注大規(guī)模數(shù)據(jù)十分困難。由于人力資源,和模型特性的限制,數(shù)據(jù)增強的應(yīng)用越來越廣泛。

AugLy的優(yōu)點:

處理類型更為全面。其他的數(shù)據(jù)增強庫,例如Albumentations和NVIDIA DALI,主要負責圖像相關(guān)數(shù)據(jù)的處理,文字數(shù)據(jù)不支持。

處理方式十分人性化。AugLy可以將一張圖片做成備忘錄,在圖片/視頻上疊加文字/Emojis,轉(zhuǎn)發(fā)社交媒體上的截圖,還可以幫助你處理諸如拷貝檢測、仇恨言論檢測或版權(quán)侵權(quán)等問題。

此項目在Github上已有4.1k+star。

https://github.com/facebookresearch/AugLy

6. Evidently

Evidently是用來監(jiān)測模型效果的工具,可從Pandas DataFrame或csv文件中生成交互式可視化報告和JSON格式的效果簡介。在Jupyter Notebook中可以使用。

741daec6-2c5b-11ed-ba43-dac502259ad0.png

目前可以提供6種報告:數(shù)據(jù)漂移、數(shù)值目標漂移、分類目標漂移、回歸模型性能、分類模型性能和概率分類模型性能。

此項目在Github上已有1.8k+star。

https://github.com/evidentlyai/evidently

7. YOLOX

如果你熟悉YOLO的話,那你或許會對曠視今年推出的YOLOX感興趣。

YOLO就是那個目標檢測算法,可以被使用在汽車自動駕駛等前沿技術(shù)中。

而YOLOX是YOLO的無錨版本,設(shè)計更簡單,但性能更好!它的目標是在研究界和工業(yè)界之間架起一座橋梁,同時彌合兩方之間的差距。

這個Github上的開源項目在短短半年內(nèi)已獲得5.2k+star。

https://github.com/Megvii-BaseDetection/YOLOX

8. LightSeq

正如它的名字一樣,LightSeq是一款由字節(jié)跳動開發(fā)的支持BERT、GPT、Transformer等眾多模型的超快推理引擎。

可以看到它的表現(xiàn),比FasterTransformer還要Fast。

747d7a04-2c5b-11ed-ba43-dac502259ad0.png

LightSeq支持的模型也是非常全面。

74a211de-2c5b-11ed-ba43-dac502259ad0.png

總之就是兩個字“好用”。此項目在Github上已有1.9k+star。

https://github.com/bytedance/lightseq

9. Greykite

想預(yù)測COVID-19的恢復(fù)速度嗎?那就來看看LinkedIn為了自家時間序列預(yù)測需求開發(fā)的Greykite吧。

74b22a74-2c5b-11ed-ba43-dac502259ad0.png

功能全面(多種時間趨勢),界面直觀,預(yù)測速度快和可擴展性強是它最大的亮點。

74e67bd0-2c5b-11ed-ba43-dac502259ad0.png

被應(yīng)用在上面的三大算法:

Silverkite (Greykite’s flagship algorithm)

Facebook Prophet

Auto Arima

感興趣的話就去研究看看吧,此項目在Github上已有1.4k+star。

https://github.com/linkedin/greykite

10. Jina and Finetuner

如今,在搜索引擎等應(yīng)用上,語義識別的地位越來越高,因為它可以有效避免字詞匹配的局限。

不過語義識別涉及的神經(jīng)網(wǎng)絡(luò)可能會讓很多人感到頭大,Jina和Finetuner可以幫你解決這些問題。

750864b6-2c5b-11ed-ba43-dac502259ad0.png

Jina是一個神經(jīng)搜索框架,使任何人都能在幾分鐘內(nèi)建立可擴展的深度學習搜索應(yīng)用程序。

Finetuner配合Jina幫助你對神經(jīng)網(wǎng)絡(luò)進行調(diào)參,以獲得神經(jīng)搜索任務(wù)的最佳結(jié)果。

Jina和Finetuner適合沒什么經(jīng)驗,又想嘗試的朋友。

https://github.com/jina-ai/finetuner

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4237

    瀏覽量

    61969
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8306

    瀏覽量

    131845
  • python
    +關(guān)注

    關(guān)注

    53

    文章

    4753

    瀏覽量

    84079

原文標題:這 10 個 Python 機器學習庫,你用過哪些?

文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    pytorch和python的關(guān)系是什么

    在當今的人工智能領(lǐng)域,Python已經(jīng)成為了最受歡迎的編程語言之一。Python的易學易用、豐富的和框架以及強大的社區(qū)支持,使其成為了數(shù)據(jù)科學、機器
    的頭像 發(fā)表于 08-01 15:27 ?789次閱讀

    opencv-python和opencv一樣嗎

    不一樣。OpenCV(Open Source Computer Vision Library)是一開源的計算機視覺和機器學習軟件,它提供了大量的圖像和視頻處理功能。OpenCV-
    的頭像 發(fā)表于 07-16 10:38 ?442次閱讀

    深度學習常用的Python

    深度學習作為人工智能的一重要分支,通過模擬人類大腦中的神經(jīng)網(wǎng)絡(luò)來解決復(fù)雜問題。Python作為一種流行的編程語言,憑借其簡潔的語法和豐富的支持,成為了深度
    的頭像 發(fā)表于 07-03 16:04 ?390次閱讀

    如何使用Python進行圖像識別的自動學習自動訓練?

    如何使用Python進行圖像識別的自動學習自動訓練? 使用Python進行圖像識別的自動學習和自動訓練需要掌握一些重要的概念和技術(shù)。在本文中,我們將
    的頭像 發(fā)表于 01-12 16:06 ?446次閱讀

    python常用機器學習及深度學習介紹

    目前,隨著人工智能的大熱,吸引了諸多行業(yè)對于人工智能的關(guān)注,同時也迎來了一波又一波的人工智能學習的熱潮,雖然人工智能背后的原理并不能通過短短一文給予詳細介紹,但是像所有學科一樣,我們并不需要從頭開始”造輪子“,可以通過使用豐富的人工智能框架來快速構(gòu)建人工智能模型,從而入門
    的頭像 發(fā)表于 01-03 10:28 ?677次閱讀
    <b class='flag-5'>python</b>常用<b class='flag-5'>機器</b><b class='flag-5'>學習</b>及深度<b class='flag-5'>學習</b><b class='flag-5'>庫</b><b class='flag-5'>介紹</b>

    python第三方有哪些

    和物理模擬等領(lǐng)域中發(fā)揮著重要的作用。 Pandas Pandas 是一用于數(shù)據(jù)處理和分析的 Python 。它
    的頭像 發(fā)表于 11-29 14:31 ?1933次閱讀

    python軟件怎么運行代碼

    Python是一種高級編程語言,它被廣泛用于開發(fā)各種類型的應(yīng)用程序,從簡單的腳本到復(fù)雜的網(wǎng)絡(luò)應(yīng)用和機器學習模型。要運行Python代碼,您需要一
    的頭像 發(fā)表于 11-28 16:02 ?745次閱讀

    python中如何引入math

    Python中,要使用math,首先需要先引入它。mathPython的一標準,它提
    的頭像 發(fā)表于 11-22 11:03 ?3379次閱讀

    時間序列分析的四基本Python介紹

    在本文中,我們將介紹主要的Python——statmodels、tslearn、tssearch、 tsfresh ——每個都針對時
    的頭像 發(fā)表于 11-03 10:17 ?658次閱讀
    時間序列分析的四<b class='flag-5'>個</b>基本<b class='flag-5'>Python</b><b class='flag-5'>庫</b><b class='flag-5'>介紹</b>

    Python項目中遇到的10安全陷阱

    極少的微妙之處或細節(jié)會使開發(fā)者們疏忽大意,從而在代碼中引入嚴重的安全漏洞。 在這篇博文中,我們將分享在實際 Python 項目中遇到的 10 安全陷阱。我們選擇了一些在技術(shù)圈中不太為人所知的陷阱。通過
    的頭像 發(fā)表于 10-30 10:34 ?390次閱讀

    Python 梯度計算模塊如何實現(xiàn)一邏輯回歸模型

    AutoGrad 是一老少皆宜的 Python 梯度計算模塊。 對于初高中生而言,它可以用來輕易計算一條曲線在任意一點上的斜率。 對于大學生、機器
    的頭像 發(fā)表于 10-21 11:01 ?418次閱讀
    <b class='flag-5'>Python</b> 梯度計算模塊如何實現(xiàn)一<b class='flag-5'>個</b>邏輯回歸模型

    Bulbea:用于股票市場預(yù)測和建模的Python

    Bulbea 是一基于深度學習開發(fā)的,用于股票市場預(yù)測和建模的Python。 Bulbea 自帶了不少可用于股票深度學習訓練及測試的AP
    的頭像 發(fā)表于 10-17 11:01 ?409次閱讀
    Bulbea:用于股票市場預(yù)測和建模的<b class='flag-5'>Python</b><b class='flag-5'>庫</b>

    如何使用Python和PinPong控制Arduino

    Python程序員在編程Arduino時面臨的第一挑戰(zhàn)是語言不同。Arduino IDE使用的是受C和C++啟發(fā)的語言。實際上,像Arduino這樣的平臺與Python非常搭配,特別適用于需要
    的頭像 發(fā)表于 10-13 10:59 ?754次閱讀
    如何使用<b class='flag-5'>Python</b>和PinPong<b class='flag-5'>庫</b>控制Arduino

    Python中oloredlogs的使用

    coloredlogs介紹 coloredlogs是一Python,它允許開發(fā)人員在控制臺打印彩色日志。這個的主要優(yōu)點是它可以很容易地
    的頭像 發(fā)表于 10-07 11:28 ?716次閱讀
    <b class='flag-5'>Python</b><b class='flag-5'>庫</b>中oloredlogs的使用

    python中matplotlib和seaborn介紹

    的使用和分析,而數(shù)據(jù)的整合最好的方式就是使用可視化的方式將數(shù)據(jù)變現(xiàn)出來。 matplotlib和seabornde介紹Python中,我們可以使用matplotlib和seaborn
    的頭像 發(fā)表于 10-07 11:16 ?886次閱讀
    <b class='flag-5'>python</b>中matplotlib和seaborn<b class='flag-5'>介紹</b>