【導(dǎo)讀】Python數(shù)據(jù)工具箱涵蓋從數(shù)據(jù)源到數(shù)據(jù)可視化的完整流程中涉及到的常用庫、函數(shù)和外部工具。其中既有Python內(nèi)置函數(shù)和標(biāo)準(zhǔn)庫,又有第三方庫和工具。
這些庫可用于文件讀寫、網(wǎng)絡(luò)抓取和解析、數(shù)據(jù)連接、數(shù)清洗轉(zhuǎn)換、數(shù)據(jù)計(jì)算和統(tǒng)計(jì)分析、圖像和視頻處理、音頻處理、數(shù)據(jù)挖掘/機(jī)器學(xué)習(xí)/深度學(xué)習(xí)、數(shù)據(jù)可視化、交互學(xué)習(xí)和集成開發(fā)以及其他Python協(xié)同數(shù)據(jù)工作工具。
為了區(qū)分不同對(duì)象的來源和類型,本文將在描述中通過以下方法進(jìn)行標(biāo)識(shí):
Python內(nèi)置函數(shù):Python自帶的內(nèi)置函數(shù)。函數(shù)無需導(dǎo)入,直接使用。例如要計(jì)算-3.2的絕對(duì)值,直接使用abs函數(shù),方法是
abs(-3.2)
Python標(biāo)準(zhǔn)庫:Python自帶的標(biāo)準(zhǔn)庫。Python標(biāo)準(zhǔn)庫無需安裝,只需要先通過import方法導(dǎo)入便可使用其中的方法。例如導(dǎo)入string模塊,然后使用其中的find方法:
import stringstring.find('abcde','b')
第三方庫:Python的第三方庫。這些庫需要先進(jìn)行安裝(部分可能需要配置)。
外部工具:非Python寫成的庫或包,用于Python數(shù)據(jù)工作的相關(guān)工具。
「推薦度」3星最高,1星最低。
01 文件讀寫
文件的讀寫包括常見的txt、Excel、xml、二進(jìn)制文件以及其他格式的數(shù)據(jù)文本,主要用于本地?cái)?shù)據(jù)的讀寫。
1. open(name[, mode[, buffering]])
類型:Python內(nèi)置函數(shù)
描述:Python默認(rèn)的文件讀寫方法
推薦度:★★★
2. numpy.loadtxt、numpy.load和numpy.fromfile
類型:第三方庫
描述:Numpy自帶的讀寫函數(shù),包括loadtxt、load和fromfile,用于文本、二進(jìn)制文件讀寫
推薦度:★★★
3. pandas.read_*
類型:第三方庫
描述:Pandas自帶的read文件方法,例如ead_csv、read_fwf、read_table等,用于文本、Excel、二進(jìn)制文件、HDF5、表格、SAS文件、SQL數(shù)據(jù)庫、Stata文件等的讀寫
推薦度:★★★
4. xlrd
類型:第三方庫
描述:用于Excel文件讀取
推薦度:★★
5. xlwt
類型:第三方庫
描述:用于Excel文件寫入
推薦度:★★
6. pyexcel-xl
類型:第三方庫
描述:用于Excel文件讀寫
推薦度:★★
7. xluntils
類型:第三方庫
描述:用于Excel文件讀寫
推薦度:★★
8. pyExcelerator
類型:第三方庫
描述:用于Excel文件讀寫
推薦度:★
9. openpyxl
類型:第三方庫
描述:用于Excel文件讀寫
推薦度:★
10. lxml
類型:第三方庫
描述:xml和HTML讀取和解析
推薦度:★★★
11. xml
類型:Python標(biāo)準(zhǔn)庫
描述:xml對(duì)象解析和格式化處理
推薦度:★★★
12. libxml2
類型:第三方庫
描述:xml對(duì)象解析和格式化處理
推薦度:★
13. xpath
類型:第三方庫
描述:xml對(duì)象解析和格式化處理
推薦度:★★
14. win32com
類型:第三方庫
描述:有關(guān)Windows系統(tǒng)操作、Office(Word、Excel等)文件讀寫等的綜合應(yīng)用庫
推薦度:★
02 網(wǎng)絡(luò)抓取和解析
網(wǎng)絡(luò)抓取和解析用于從互聯(lián)網(wǎng)中抓取信息,并對(duì)HTML對(duì)象進(jìn)行處理,有關(guān)xml對(duì)象的解析和處理的庫在“01 文件讀寫”中找到。
15. requests
類型:第三方庫
描述:網(wǎng)絡(luò)請(qǐng)求庫,提供多種網(wǎng)絡(luò)請(qǐng)求方法并可定義復(fù)雜的發(fā)送信息
推薦度:★★★
16. urllib
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的庫,簡(jiǎn)單的讀取特定URL并獲得返回的信息
推薦度:★★
17. urllib2
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的庫,讀取特定URL并獲得返回的信息,相對(duì)于urllib可處理更多HTTP信息,例如cookie、身份驗(yàn)證、重定向等
推薦度:★★
18. urlparse
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的URL解析庫,可自動(dòng)解析URL不同的域、參數(shù)、路徑等
推薦度:★★★
19. HTMLParser
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的HTML解析模塊,能夠很容易的實(shí)現(xiàn)HTML文件的分析
推薦度:★★★
20. Scapy
類型:第三方庫
描述:分布式爬蟲框架,可用于模擬用戶發(fā)送、偵聽和解析并偽裝網(wǎng)絡(luò)報(bào)文,常用于大型網(wǎng)絡(luò)數(shù)據(jù)爬取
推薦度:★★★
21. Beautiful Soup
類型:第三方庫
描述:Beautiful Soup是網(wǎng)頁數(shù)據(jù)解析和格式化處理工具,通常配合Python的urllib、urllib2等庫一起使用
推薦度:★★★
03 數(shù)據(jù)庫連接
數(shù)據(jù)庫連接可用于連接眾多數(shù)據(jù)庫以及訪問通用數(shù)據(jù)庫接口,可用于數(shù)據(jù)庫維護(hù)、管理和增、刪、改、查等日常操作。
22. mysql-connector-python
類型:第三方庫
描述:MySQL官方驅(qū)動(dòng)連接程序
推薦度:★★★
23. pymysql
類型:第三方庫
描述:MySQL連接庫,支持Python3
推薦度:★★★
24. MySQL-python
類型:第三方庫
描述:MySQL連接庫
推薦度:★★
25. cx_Oracle
類型:第三方庫
描述:Oracle連接庫
推薦度:★★★
26. psycopg2
類型:第三方庫
描述:Python編程語言中非常受歡迎的PostgreSQL適配器
推薦度:★★★
27. redis
類型:Python標(biāo)準(zhǔn)庫
描述:Redis連接庫
推薦度:★★★
28. pymongo
類型:第三方庫
描述:MongoDB官方驅(qū)動(dòng)連接程序
推薦度:★★★
29. HappyBase
類型:第三方庫
描述:HBase連接庫
推薦度:★★★
30. py2neo
類型:第三方庫
描述:Neo4j連接庫
推薦度:★★★
31. cassandra-driver
類型:第三方庫
描述:Cassandra(1.2+)和DataStax Enterprise(3.1+)連接庫
推薦度:★★★
32. sqlite3
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的模塊,用于操作SQLite數(shù)據(jù)庫
推薦度:★★★
33. pysqlite2
類型:第三方庫
描述:SQLite 3.x連接庫
推薦度:★★
34. bsddb3
類型:第三方庫
描述:Berkeley DB連接庫
35. bsddb
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的模塊,提供了一個(gè)到Berkeley DB庫的接口
推薦度:★★
36. dbhash
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的模塊,dbhash模塊提供了使用BSD數(shù)據(jù)庫庫打開數(shù)據(jù)庫的功能。該模塊鏡像了提供對(duì)DBM樣式數(shù)據(jù)庫訪問的其他Python數(shù)據(jù)庫模塊的接口。bsddb模塊需要使用dbhash
推薦度:★★
37. adodb
類型:第三方庫
描述:ADOdb是一個(gè)數(shù)據(jù)庫抽象庫,支持常見的數(shù)據(jù)和數(shù)據(jù)庫接口并可自行進(jìn)行數(shù)據(jù)庫擴(kuò)展,該庫可以對(duì)不同數(shù)據(jù)庫中的語法進(jìn)行解析和差異化處理,具有很高的通用性
推薦度:★★★
38. SQLObject
類型:第三方庫
描述:SQLObject是一種流行的對(duì)象關(guān)系管理器,用于向數(shù)據(jù)庫提供對(duì)象接口,其中表為類、行為實(shí)例、列為屬性
推薦度:★★
39. SQLAlchemy
類型:第三方庫
描述:SQLAlchemy是Python SQL工具包和對(duì)象關(guān)系映射器,為應(yīng)用程序開發(fā)人員提供了SQL的全部功能和靈活性控制
推薦度:★★
40. ctypes
類型:第三方庫
描述:ctypes是Python的一個(gè)外部庫,提供和C語言兼容的數(shù)據(jù)類型,可以很方便地調(diào)用C DLL中的函數(shù)
推薦度:★★★
41. pyodbc
類型:第三方庫
描述:Python通過ODBC訪問數(shù)據(jù)庫的接口庫
推薦度:★★★
42. Jython
類型:第三方庫
描述:Python通過JDBC訪問數(shù)據(jù)庫的接口庫
推薦度:★★★
04 數(shù)據(jù)清洗轉(zhuǎn)換
數(shù)據(jù)清洗轉(zhuǎn)換主用于數(shù)據(jù)正式應(yīng)用之前的預(yù)處理工作。
43. frozenset([iterable])
類型:Python內(nèi)置函數(shù)
描述:返回一個(gè)新的frozenset對(duì)象,可選擇從iterable取得的元素
推薦度:★★★
44. int(x)
類型:Python內(nèi)置函數(shù)
描述:返回x的整數(shù)部分
推薦度:★★★
45. isinstance(object, classinfo)
類型:Python內(nèi)置函數(shù)
描述:返回object是否是指定的classinfo實(shí)例信息
推薦度:★★★
46. len(s)
類型:Python內(nèi)置函數(shù)
描述:返回對(duì)象的長(zhǎng)度或項(xiàng)目數(shù)量
推薦度:★★★
47. long(x)
類型:Python內(nèi)置函數(shù)
描述:返回由字符串或數(shù)字x構(gòu)造的長(zhǎng)整型對(duì)象
推薦度:★★★
48. max(iterable[, key])
類型:Python內(nèi)置函數(shù)
描述:返回一個(gè)可迭代或最大的兩個(gè)或多個(gè)參數(shù)中的最大項(xiàng)
推薦度:★★★
49. min(iterable[, key])
類型:Python內(nèi)置函數(shù)
描述:返回一個(gè)可迭代或最大的兩個(gè)或多個(gè)參數(shù)中的最小項(xiàng)
推薦度:★★★
50. range(start, stop[, step])
類型:Python內(nèi)置函數(shù)
描述:用于與for循環(huán)一起創(chuàng)建循環(huán)列表,通過指定start(開始)、stop(結(jié)束)和step(步長(zhǎng))控制迭代次數(shù)并獲取循環(huán)值
推薦度:★★★
51. raw_input(prompt)
類型:Python內(nèi)置函數(shù)
描述:捕獲用戶輸入并作為字符串返回(不推薦使用input作為用戶輸入的捕獲函數(shù))
推薦度:★★★
52. round(number[, ndigits])
類型:Python內(nèi)置函數(shù)
描述:返回number小數(shù)點(diǎn)后ndigits位的四舍五入的浮點(diǎn)數(shù)
推薦度:★★★
53. set([iterable])
類型:Python內(nèi)置函數(shù)
描述:返回一個(gè)新的集合對(duì)象,可選擇從iterable獲取的元素
推薦度:★★★
54. slice(start, stop[, step])
類型:Python內(nèi)置函數(shù)
描述:返回表示由范圍(start、stop、step)指定的索引集的切片對(duì)象
推薦度:★★
55. sorted(iterable[, cmp[, key[, reverse]]])
類型:Python內(nèi)置函數(shù)
描述:從iterable的項(xiàng)中返回一個(gè)新的排序列表
推薦度:★★★
56. xrange(start, stop[, step])
類型:Python內(nèi)置函數(shù)
描述:此函數(shù)與range()非常相似,但返回一個(gè)xrange對(duì)象而不是列表
推薦度:★★★
57. string
類型:Python標(biāo)準(zhǔn)庫
描述:字符串處理庫,可實(shí)現(xiàn)字符串查找、分割、組合、替換、去重、大小寫轉(zhuǎn)換及其他格式化處理
推薦度:★★★
58. re
類型:Python標(biāo)準(zhǔn)庫
描述:正則表達(dá)式模塊,在文本和字符串處理中經(jīng)常使用
推薦度:★★★
59. random
類型:Python標(biāo)準(zhǔn)庫
描述:該模塊為各種分布實(shí)現(xiàn)偽隨機(jī)數(shù)生成器,支持?jǐn)?shù)據(jù)均勻分布、正態(tài)(高斯)分布、對(duì)數(shù)正態(tài)分布、負(fù)指數(shù)分布、伽馬和β分布等
推薦度:★★★
60. os
類型:Python標(biāo)準(zhǔn)庫
描述:用于新建、刪除、權(quán)限修改、切換路徑等目錄操作,以及調(diào)用執(zhí)行系統(tǒng)命令
推薦度:★★★
61. os.path
類型:Python標(biāo)準(zhǔn)庫
描述:針對(duì)目錄的遍歷、組合、分割、判斷等操作,常用于數(shù)據(jù)文件的判斷、查找、合并
推薦度:★★★
62. prettytable
類型:Python標(biāo)準(zhǔn)庫
描述:格式化表格輸出模塊
推薦度:★★
63. json
類型:Python標(biāo)準(zhǔn)庫
描述:Python對(duì)象與json對(duì)象的轉(zhuǎn)換
推薦度:★★★
64. base64
類型:Python標(biāo)準(zhǔn)庫
描述:將任意二進(jìn)制字符串編碼和解碼為文本字符串的Base16,Base32和Base64
推薦度:★★★
05 數(shù)據(jù)計(jì)算和統(tǒng)計(jì)分析
數(shù)據(jù)計(jì)算和統(tǒng)計(jì)分析主要用于數(shù)據(jù)探查、計(jì)算和初步數(shù)據(jù)分析等工作。
65. numpy
類型:第三方庫
描述:NumPy是Python科學(xué)計(jì)算的基礎(chǔ)工具包,很多Python數(shù)據(jù)計(jì)算工作庫都依賴它
推薦度:★★★
66. scipy
類型:第三方庫
描述:Scipy是一組專門解決科學(xué)和工程計(jì)算不同場(chǎng)景的主題工具包
推薦度:★★★
67. pandas
類型:第三方庫
描述:Pandas是一個(gè)用于Python數(shù)據(jù)分析的庫,它的主要作用是進(jìn)行數(shù)據(jù)分析。Pandas提供用于進(jìn)行結(jié)構(gòu)化數(shù)據(jù)分析的二維的表格型數(shù)據(jù)結(jié)構(gòu)DataFrame,類似于R中的數(shù)據(jù)框,能提供類似于數(shù)據(jù)庫中的切片、切塊、聚合、選擇子集等精細(xì)化操作,為數(shù)據(jù)分析提供了便捷
推薦度:★★★
68. statsmodels
類型:第三方庫
描述:Statsmodels是Python的統(tǒng)計(jì)建模和計(jì)量經(jīng)濟(jì)學(xué)工具包,包括一些描述性統(tǒng)計(jì)、統(tǒng)計(jì)模型估計(jì)和統(tǒng)計(jì)測(cè)試,集成了多種線性回歸模型、廣義線性回歸模型、離散數(shù)據(jù)分布模型、時(shí)間序列分析模型、非參數(shù)估計(jì)、生存分析、主成分分析、核密度估計(jì)以及廣泛的統(tǒng)計(jì)測(cè)試和繪圖等功能
推薦度:★★★
69. abs(x)
類型:Python內(nèi)置函數(shù)
描述:返回x的絕對(duì)值
推薦度:★★★
70. cmp(x, y)
類型:Python內(nèi)置函數(shù)
描述:比較兩個(gè)對(duì)象x和y,并根據(jù)結(jié)果返回一個(gè)整數(shù)。如果x
推薦度:★★
71. float(x)
類型:Python內(nèi)置函數(shù)
描述:返回從數(shù)字或字符串x構(gòu)造的浮點(diǎn)數(shù)
推薦度:★★★
72. pow(x, y[, z])
類型:Python內(nèi)置函數(shù)
描述:返回x的y次冪。如果z存在,則返回x的y次冪,模z
推薦度:★★★
73. sum(iterable[, start])
類型:Python內(nèi)置函數(shù)
描述:從左到右依次迭代,返回總和
推薦度:★★★
74. math
類型:Python標(biāo)準(zhǔn)庫
描述:數(shù)學(xué)函數(shù)庫,包括正弦、余弦、正切、余切、弧度轉(zhuǎn)換、對(duì)數(shù)運(yùn)算、圓周率、絕對(duì)值、取整等數(shù)學(xué)計(jì)算方法
推薦度:★★★
75. cmath
類型:Python標(biāo)準(zhǔn)庫
描述:與math基本一致,區(qū)別是cmath運(yùn)算的是復(fù)數(shù)
推薦度:★★
76. decimal
類型:Python標(biāo)準(zhǔn)庫
描述:10進(jìn)制浮點(diǎn)運(yùn)算
推薦度:★★
77. fractions
類型:Python標(biāo)準(zhǔn)庫
描述:分?jǐn)?shù)模塊提供對(duì)有理數(shù)算術(shù)的支持
推薦度:★★
06 自然語言處理和文本挖掘
自然語言處理和文本挖掘庫主要用于以自然語言文本為對(duì)象的數(shù)據(jù)處理和建模。
78. nltk
類型:第三方庫
描述:NLTK是一個(gè)Python自然語言處理工具,它用于對(duì)自然語言進(jìn)行分類、解析和語義理解。目前已經(jīng)有超過50種語料庫和詞匯資源
推薦度:★★★
79. pattern
類型:第三方庫
描述:Pattern是一個(gè)網(wǎng)絡(luò)數(shù)據(jù)挖掘Python工具包,提供了用于網(wǎng)絡(luò)挖掘(如網(wǎng)絡(luò)服務(wù)、網(wǎng)絡(luò)爬蟲等)、自然語言處理(如詞性標(biāo)注、情感分析等)、機(jī)器學(xué)習(xí)(如向量空間模型、分類模型等)、圖形化的網(wǎng)絡(luò)分析模型
推薦度:★★★
80. gensim
類型:第三方庫
描述:Gensim是一個(gè)專業(yè)的主題模型(發(fā)掘文字中隱含主題的一種統(tǒng)計(jì)建模方法)Python工具包,用來提供可擴(kuò)展統(tǒng)計(jì)語義、分析純文本語義結(jié)構(gòu)以及檢索語義上相似的文檔
推薦度:★★★
81. 結(jié)巴分詞
類型:第三方庫
描述:結(jié)巴分詞是國內(nèi)流行的Python文本處理工具包,分詞模式分為三種模式:精確模式、全模式和搜索引擎模式,支持繁體分詞、自定義詞典等,是非常好的Python中文分詞解決方案,可以實(shí)現(xiàn)分詞、詞典管理、關(guān)鍵字抽取、詞性標(biāo)注等
推薦度:★★★
82. SnowNLP
類型:第三方庫
描述:SnowNLP是一個(gè)Python寫的類庫,可以方便的處理中文文本內(nèi)容。該庫是受到了TextBlob的啟發(fā)而針對(duì)中文處理寫的類庫,和TextBlob不同的是這里沒有用NLTK,所有的算法都是自己實(shí)現(xiàn)的,并且自帶了一些訓(xùn)練好的字典
推薦度:★★
83. smallseg
類型:第三方庫
描述:Smallseg是一個(gè)開源的、基于DFA的輕量級(jí)的中文分詞工具包??勺远x詞典、切割后返回登錄詞列表和未登錄詞列表、有一定的新詞識(shí)別能力
推薦度:★★
84. spaCy
類型:第三方庫
描述:spaCy是一個(gè)Python自然語言處理工具包,它結(jié)合Python和Cython使得自然語言處理能力達(dá)到了工業(yè)強(qiáng)度
推薦度:★★★
85. TextBlob
類型:第三方庫
描述:TextBlob 是一個(gè)處理文本數(shù)據(jù)的Python庫,可用來做詞性標(biāo)注、情感分析、文本翻譯、名詞短語抽取、文本分類等
推薦度:★★
86. PyNLPI
類型:第三方庫
描述:PyNLPI是一個(gè)適合各種自然語言處理任務(wù)的集合庫,可用于中文文本分詞、關(guān)鍵字分析等,尤其重要的是其支持中英文映射,支持UTF-8和GBK編碼的字符串等
推薦度:★★★
87. synonyms
類型:第三方庫
描述:中文近義詞工具包,可用于自然語言理解的很多任務(wù):文本對(duì)齊,推薦算法,相似度計(jì)算,語義偏移,關(guān)鍵字提取,概念提取,自動(dòng)摘要,搜索引擎等。
推薦度:★★★
07 圖像和視頻處理
圖像處理和視頻處理主要適用于基于圖像的操作、處理、分析和挖掘,如人臉識(shí)別、圖像識(shí)別、目標(biāo)跟蹤、圖像理解等。
88. PIL/Pillow
類型:第三方庫
描述:PIL是一個(gè)常用的圖像讀取、處理和分析的庫,提供了多種數(shù)據(jù)處理、變換的操作方法和屬性。PIL僅支持到2.7版本且已經(jīng)很久沒有更新,一群志愿者基于PIL發(fā)布了新的分支Pillow。Pillow同時(shí)支持Python2和Python3并且加入很多新的功能
推薦度:★★
89. OpenCV
類型:第三方庫
描述:OpenCV是一個(gè)強(qiáng)大的圖像和視頻工作庫。它提供了多種程序接口,支持跨平臺(tái)(包括移動(dòng)端)應(yīng)用。OpenCV的設(shè)計(jì)效率很高,它以優(yōu)化的C / C ++編寫,庫可以利用多核處理。除了對(duì)圖像進(jìn)行基本處理外,還支持圖像數(shù)據(jù)建模,并預(yù)制了多種圖像識(shí)別引擎,如人臉識(shí)別
推薦度:★★★
90. scikit-image
類型:第三方庫
描述:scikit-image(也稱skimage)是一個(gè)圖像處理庫,支持顏色模式轉(zhuǎn)換、濾鏡、繪圖、圖像處理、特征檢測(cè)等多種功能
推薦度:★★
91. imageop
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的函數(shù),對(duì)圖像基本操作,包括裁剪、縮放、模式轉(zhuǎn)換
推薦度:★
92. colorsys
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的函數(shù),實(shí)現(xiàn)不同圖像色彩模式的轉(zhuǎn)換
推薦度:★
93. imghdr
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的函數(shù),返回圖像文件的類型
推薦度:★
08 音頻處理
音頻處理主要適用于基于聲音的處理、分析和建模,主要應(yīng)用于語音識(shí)別、語音合成、語義理解等。
94. TimeSide
類型:第三方庫
描述:TimeSide是一個(gè)能夠進(jìn)行音頻分析、成像、轉(zhuǎn)碼、流媒體和標(biāo)簽處理的Python框架,可以對(duì)任何音頻或視頻內(nèi)容非常大的數(shù)據(jù)集進(jìn)行復(fù)雜的處理
推薦度:★★★
95. audiolazy
類型:第三方庫
描述:audiolazy是一個(gè)用于實(shí)時(shí)聲音數(shù)據(jù)流處理的庫,支持實(shí)時(shí)數(shù)據(jù)應(yīng)用處理、無限數(shù)據(jù)序列表示、數(shù)據(jù)流表示等
推薦度:★★
96. pydub
類型:第三方庫
描述:pydub支持多種格式聲音文件,可進(jìn)行多種信號(hào)處理(例如壓縮、均衡、歸一化)、信號(hào)生成(例如正弦、方波、鋸齒等)、音效注冊(cè)、靜音處理等
推薦度:★★★
97. audioop
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的函數(shù),可實(shí)現(xiàn)對(duì)聲音片段的一些常用操作
推薦度:★★
98. tinytag
類型:第三方庫
描述:tinytag用于讀取多種聲音文件的元數(shù)據(jù),涵蓋MP3、OGG、OPUS、MP4、M4A、FLAC、WMA、Wave等格式
推薦度:★★
99. aifc
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的函數(shù),讀寫AIFF和AIFC文件
推薦度:★
100. sunau
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的函數(shù),讀寫Sun AU文件
推薦度:★
101. wave
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的函數(shù),讀寫WAV文件
推薦度:★★
102. chunk
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的函數(shù),讀取EA IFF 85塊格式的文件
推薦度:★
103. sndhdr
類型:Python標(biāo)準(zhǔn)庫
描述:Python自帶的函數(shù),返回聲音文件的類型
推薦度:★
104. ossaudiodev
類型:Python標(biāo)準(zhǔn)庫
描述:該模塊支持訪問OSS(開放聲音系統(tǒng))音頻接口
推薦度:★★★
09 數(shù)據(jù)挖掘/機(jī)器學(xué)習(xí)/深度學(xué)習(xí)
數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等是Python進(jìn)行數(shù)據(jù)建模和挖掘?qū)W習(xí)的核心模塊。
105. Scikit-Learn
類型:第三方庫
描述:scikit-learn(也稱SKlearn)是一個(gè)基于Python的機(jī)器學(xué)習(xí)綜合庫,內(nèi)置監(jiān)督式學(xué)習(xí)和非監(jiān)督式學(xué)習(xí)機(jī)器學(xué)習(xí)方法,包括各種回歸、聚類、分類、流式學(xué)習(xí)、異常檢測(cè)、神經(jīng)網(wǎng)絡(luò)、集成方法等主流算法類別,同時(shí)支持預(yù)置數(shù)據(jù)集、數(shù)據(jù)預(yù)處理、模型選擇和評(píng)估等方法,是一個(gè)非常完整、流行的機(jī)器學(xué)習(xí)工具庫
推薦度:★★★
106. TensorFlow
類型:第三方庫
描述:TensorFlow 是谷歌的第二代機(jī)器學(xué)習(xí)系統(tǒng),內(nèi)建深度學(xué)習(xí)的擴(kuò)展支持,任何能夠用計(jì)算流圖形來表達(dá)的計(jì)算,都可以使用 TensorFlow
推薦度:★★★
107. NuPIC
類型:第三方庫
描述:NuPIC是一個(gè)以HTM(分層時(shí)間記憶)學(xué)習(xí)算法為工具的機(jī)器智能平臺(tái)。NuPIC適合于各種各樣的問題,尤其適用于檢測(cè)異常和預(yù)測(cè)應(yīng)用
推薦度:★★★
108. PyTorch
類型:第三方庫
描述:PyTorch是FaceBook推出的深度學(xué)習(xí)框架,它基于Python(而非lua)產(chǎn)生,它提供的動(dòng)態(tài)計(jì)算圖是顯著區(qū)別于Tensorflow等其他學(xué)習(xí)框架的地方。
推薦度:★★
109. Orange
類型:第三方庫
描述:Orange通過圖形化操作界面,提供交互式數(shù)據(jù)分析功能,尤其適用于分類、聚類、回歸、特征選擇和交叉驗(yàn)證工作
推薦度:★★★
110. theano
類型:第三方庫
描述:Theano是非常成熟的深度學(xué)習(xí)庫。它與Numpy緊密集成,支持GPU計(jì)算、單元測(cè)試和自我驗(yàn)證
推薦度:★★★
111. keras
類型:第三方庫
描述:Keras是一個(gè)用Python編寫的高級(jí)神經(jīng)網(wǎng)絡(luò)API,能夠運(yùn)行在TensorFlow或者Theano之上,它的開發(fā)重點(diǎn)是實(shí)現(xiàn)快速實(shí)驗(yàn)
推薦度:★★
112. neurolab
類型:第三方庫
描述:Neurolab是具有靈活網(wǎng)絡(luò)配置和Python學(xué)習(xí)算法的基本神經(jīng)網(wǎng)絡(luò)算法庫。它包含通過遞歸神經(jīng)網(wǎng)絡(luò)(RNN)實(shí)現(xiàn)的不同變體,該庫是同類RNN API中最好的選擇之一
推薦度:★★
113. PyLearn2
類型:第三方庫
描述:PyLearn2是基于Theano的深度學(xué)習(xí)庫,它旨在提供極大的靈活性,并使研究人員可以進(jìn)行自由可控制,參數(shù)和屬性的靈活、開放配置是亮點(diǎn)
推薦度:★★★
114. OverFeat
類型:第三方庫
描述:OverFeat是一個(gè)深度學(xué)習(xí)庫,主要用于圖片分類、定位物體檢測(cè)
推薦度:★★
115. Pyevolve
類型:第三方庫
描述:Pyevolve是一個(gè)完整的遺傳算法框架,也支持遺傳編程
推薦度:★★
116. Caffe2
類型:第三方庫
描述:Cafffe2也是FaceBook推出的深度學(xué)習(xí)框架,相比于PyTorch 更適合于研究,Caffe2 適合大規(guī)模部署,主要用于計(jì)算機(jī)視覺,它對(duì)圖像識(shí)別的分類具有很好的應(yīng)用效果
推薦度:★★
10數(shù)據(jù)可視化
數(shù)據(jù)可視化主要用于做數(shù)據(jù)結(jié)果展示、數(shù)據(jù)模型驗(yàn)證、圖形交互和探查等方面。
117. Matplotlib
類型:第三方庫
描述:Matplotlib是Python的2D繪圖庫,它以各種硬拷貝格式和跨平臺(tái)的交互式環(huán)境生成出版質(zhì)量級(jí)別的圖形,開發(fā)者可以僅需要幾行代碼,便可以生成多種高質(zhì)量圖形
推薦度:★★★
118. pyecharts
類型:第三方庫
描述:基于百度Echarts的強(qiáng)大的可視化工具庫,其提供的圖形功能眾多,尤其對(duì)于復(fù)雜關(guān)系的展示能力較強(qiáng)
推薦度:★★★
119. seaborn
類型:第三方庫
描述:Seaborn是在Matplotlib的基礎(chǔ)上進(jìn)行了更高級(jí)的API封裝,它可以作為Matplotlib的補(bǔ)充
推薦度:★★★
120. bokeh
類型:第三方庫
描述:Bokeh是一種交互式可視化庫,可以在WEB瀏覽器中實(shí)現(xiàn)美觀的視覺效果
推薦度:★★★
121. Plotly
類型:第三方庫
描述:Plotly提供的圖形庫可以進(jìn)行在線WEB交互,并提供具有出版品質(zhì)的圖形,支持線圖、散點(diǎn)圖、區(qū)域圖、條形圖、誤差條、框圖、直方圖、熱圖、子圖、多軸、極坐標(biāo)圖、氣泡圖、玫瑰圖、熱力圖、漏斗圖等眾多圖形
推薦度:★★★
122. VisPy
類型:第三方庫
描述:VisPy是用于交互式科學(xué)可視化的Python庫,旨在實(shí)現(xiàn)快速,可擴(kuò)展和易于使用
推薦度:★★
123. PyQtGraph
類型:第三方庫
描述:PyQtGraph是一個(gè)建立在PyQt4 / PySide和numpy之上的純Python圖形和GUI庫,主要用于數(shù)學(xué)/科學(xué)/工程應(yīng)用
推薦度:★★
124. ggplot
類型:第三方庫
描述:ggplot是用Python實(shí)現(xiàn)的圖形輸出庫,類似于 R中的圖形展示版本
推薦度:★★★
11交互學(xué)習(xí)和集成開發(fā)
交互學(xué)習(xí)和集成開發(fā)主要用來做Python開發(fā)、調(diào)試和集成之用,包括Python集成開發(fā)環(huán)境和IDE。
125. IPython/ Jupyter
類型:第三方庫
描述:IPython 是一個(gè)基于Python 的交互式shell,比默認(rèn)的Python shell 好用得多,支持變量自動(dòng)補(bǔ)全、自動(dòng)縮進(jìn)、交互式幫助、魔法命令、系統(tǒng)命令等,內(nèi)置了許多很有用的功能和函數(shù)。從IPython4.0開始,IPython衍生出了IPython和Jupyter兩個(gè)分支。在該分支正式出現(xiàn)之前,IPython其實(shí)已經(jīng)擁有了ipython notebook功能,因此,Jupyter更像是一個(gè)ipython notebook的升級(jí)版。
推薦度:★★★
126. Elpy
類型:第三方庫
描述:Elpy是Emacs用于Python的開發(fā)環(huán)境,它結(jié)合并配置了許多其他軟件包,它們都是用Emacs Lisp和Python編寫的
推薦度:★★
127. PTVS
類型:第三方庫
描述:Visual Studio 的 Python 工具
推薦度:★★
128. PyCharm
類型:外部工具
描述:PyCharm帶有一整套可以幫助用戶在使用Python語言開發(fā)時(shí)提高其效率的工具,比如調(diào)試、語法高亮、項(xiàng)目管理、代碼跳轉(zhuǎn)、智能提示、自動(dòng)完成、單元測(cè)試、版本控制并可集成IPython、系統(tǒng)終端命令行等,在PyCharm里幾乎就可以實(shí)現(xiàn)所有有關(guān)Python工作的全部過程
推薦度:★★★
129. LiClipse
類型:外部工具
描述:LiClipse是基于Eclipse的免費(fèi)多語言 IDE,通過其中的PyDev可支持 Python開發(fā)應(yīng)用
推薦度:★★
130. Spyder
類型:外部工具
描述:Spyder是一個(gè)開源的Python IDE,由IPython和眾多流行的Python庫的支持,是一個(gè)具備高級(jí)編輯、交互式測(cè)試、調(diào)試以及數(shù)字計(jì)算環(huán)境的交互式開發(fā)環(huán)境
推薦度:★★
12其他 Python 協(xié)同數(shù)據(jù)工作工具
其他Python協(xié)同數(shù)據(jù)工作工具指除了上述主題以外,其他在數(shù)據(jù)工作中常用的工具或庫。
131. tesseract-ocr
類型:外部工具
描述:這是一個(gè)Google支持的開源OCR圖文識(shí)別項(xiàng)目,支持超過200種語言(包括中文),并支持自定義訓(xùn)練字符集,支持跨Windows、Linux、Mac OSX 多平臺(tái)使用
推薦度:★★★
132. RPython
類型:第三方庫
描述:R集成庫
推薦度:★★★
133. Rpy2
類型:第三方庫
描述:Python連接R的庫
134. matpython
類型:第三方庫
描述:MATLAB集成庫
推薦度:★★★
135. Lunatic Python
類型:第三方庫
描述:Lua集成庫
推薦度:★★
136. PyCall.jl
類型:第三方庫
描述:Julia集成庫
推薦度:★★
137. PySpark
類型:第三方庫
描述:Spark提供的Python API
推薦度:★★★
138. dumbo
類型:第三方庫
描述:這個(gè)模塊可以讓Pythoner輕松的編寫和運(yùn)行 Hadoop 程序,程序版本比較早,可以作為參考
推薦度:★★
139. dpark
類型:第三方庫
描述:Python對(duì)Spark的克隆版本,類MapReduce框架
推薦度:★★
140. streamparse
類型:第三方庫
描述:Streamparse允許通過Storm對(duì)實(shí)時(shí)數(shù)據(jù)流運(yùn)行Python代碼
推薦度:★★★
關(guān)于作者:宋天龍,大數(shù)據(jù)技術(shù)專家,觸脈咨詢合伙人兼副總裁,前Webtrekk中國區(qū)技術(shù)和咨詢負(fù)責(zé)人(Webtrekk,德國的在線數(shù)據(jù)分析服務(wù)提供商)。擅長(zhǎng)數(shù)據(jù)挖掘、建模、分析與運(yùn)營,精通端到端數(shù)據(jù)價(jià)值場(chǎng)景設(shè)計(jì)、業(yè)務(wù)需求轉(zhuǎn)換、數(shù)據(jù)結(jié)構(gòu)梳理、數(shù)據(jù)建模與學(xué)習(xí)以及數(shù)據(jù)工程交付。
-
二進(jìn)制
+關(guān)注
關(guān)注
2文章
786瀏覽量
41564 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8349瀏覽量
132312 -
python
+關(guān)注
關(guān)注
55文章
4767瀏覽量
84375
原文標(biāo)題:精華 | 140種Python標(biāo)準(zhǔn)庫、第三方庫和外部工具都有了
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論