国产美腿91肉丝袜在线播放,精品91自产拍在线观看二区

本文分享給大家 12 種 Numpy 和 Pandas 函數(shù)，這些高效的函數(shù)會(huì)令數(shù)據(jù)分析更為容易、便捷。最后，讀者也可以在 GitHub 項(xiàng)目中找到本文所用代碼的 Jupyter Notebook。

項(xiàng)目地址：https://github.com/kunaldhariwal/12-Amazing-Pandas-NumPy-Functions

Numpy 的 6 種高效函數(shù)

首先從 Numpy 開始。Numpy 是用于科學(xué)計(jì)算的 Python 語言擴(kuò)展包，通常包含強(qiáng)大的 N 維數(shù)組對象、復(fù)雜函數(shù)、用于整合 C/C++和 Fortran 代碼的工具以及有用的線性代數(shù)、傅里葉變換和隨機(jī)數(shù)生成能力。

除了上面這些明顯的用途，Numpy 還可以用作通用數(shù)據(jù)的高效多維容器（container），定義任何數(shù)據(jù)類型。這使得 Numpy 能夠?qū)崿F(xiàn)自身與各種數(shù)據(jù)庫的無縫、快速集成。

接下來一一解析 6 種 Numpy 函數(shù)。

1、argpartition（）

借助于 argpartition（），Numpy 可以找出 N 個(gè)最大數(shù)值的索引，也會(huì)將找到的這些索引輸出。然后我們根據(jù)需要對數(shù)值進(jìn)行排序。

x = np.array（［12， 10， 12， 0， 6， 8， 9， 1， 16， 4， 6， 0］）index_val = np.argpartition（x， -4）［-4：］

index_val

array（［1， 8， 2， 0］， dtype=int64）np.sort（x［index_val］）

array（［10， 12， 12， 16］）

2、allclose（）

allclose（）用于匹配兩個(gè)數(shù)組，并得到布爾值表示的輸出。如果在一個(gè)公差范圍內(nèi)（within a tolerance）兩個(gè)數(shù)組不等同，則 allclose（）返回 False。該函數(shù)對于檢查兩個(gè)數(shù)組是否相似非常有用。

array1 = np.array（［0.12，0.17，0.24，0.29］）

array2 = np.array（［0.13，0.19，0.26，0.31］）# with a tolerance of 0.1， it should return False：

np.allclose（array1，array2，0.1）

False# with a tolerance of 0.2， it should return True：

np.allclose（array1，array2，0.2）

True

3、clip（）

Clip（）使得一個(gè)數(shù)組中的數(shù)值保持在一個(gè)區(qū)間內(nèi)。有時(shí)，我們需要保證數(shù)值在上下限范圍內(nèi)。為此，我們可以借助 Numpy 的 clip（）函數(shù)實(shí)現(xiàn)該目的。給定一個(gè)區(qū)間，則區(qū)間外的數(shù)值被剪切至區(qū)間上下限（interval edge）。

x = np.array（［3， 17， 14， 23， 2， 2， 6， 8， 1， 2， 16， 0］）np.clip（x，2，5）

array（［3， 5， 5， 5， 2， 2， 5， 5， 2， 2， 5， 2］）

4、extract（）

顧名思義，extract（）是在特定條件下從一個(gè)數(shù)組中提取特定元素。借助于 extract（），我們還可以使用 and 和 or 等條件。

# Random integers

array = np.random.randint（20， size=12）

array

array（［ 0， 1， 8， 19， 16， 18， 10， 11， 2， 13， 14， 3］）# Divide by 2 and check if remainder is 1

cond = np.mod（array， 2）==1

cond

array（［False， True， False， True， False， False， False， True， False， True， False， True］）# Use extract to get the values

np.extract（cond， array）

array（［ 1， 19， 11， 13， 3］）# Apply condition on extract directly

np.extract（（（array 《 3） | （array 》 15））， array）

array（［ 0， 1， 19， 16， 18， 2］）

5、where（）

Where（）用于從一個(gè)數(shù)組中返回滿足特定條件的元素。比如，它會(huì)返回滿足特定條件的數(shù)值的索引位置。Where（）與 SQL 中使用的 where condition 類似，如以下示例所示：

y = np.array（［1，5，6，8，1，7，3，6，9］）# Where y is greater than 5， returns index position

np.where（y》5）

array（［2， 3， 5， 7， 8］， dtype=int64），）# First will replace the values that match the condition， # second will replace the values that does not

np.where（y》5， “Hit”， “Miss”）

array（［ Miss ， Miss ， Hit ， Hit ， Miss ， Hit ， Miss ， Hit ， Hit ］，dtype= 《U4 ）

6、percentile（）

Percentile（）用于計(jì)算特定軸方向上數(shù)組元素的第 n 個(gè)百分位數(shù)。

a = np.array（［1，5，6，8，1，7，3，6，9］）print（“50th Percentile of a， axis = 0 ： ”，

np.percentile（a， 50， axis =0））

50th Percentile of a， axis = 0 ： 6.0b = np.array（［［10， 7， 4］，［3， 2， 1］］）print（“30th Percentile of b， axis = 0 ： ”，

np.percentile（b， 30， axis =0））

30th Percentile of b， axis = 0 ：［5.1 3.5 1.9］

這就是 Numpy 擴(kuò)展包的 6 種高效函數(shù)，相信會(huì)為你帶來幫助。接下來看一看 Pandas 數(shù)據(jù)分析庫的 6 種函數(shù)。

Pandas的 6 種高效函數(shù)

Pandas 也是一個(gè) Python 包，它提供了快速、靈活以及具有顯著表達(dá)能力的數(shù)據(jù)結(jié)構(gòu)，旨在使處理結(jié)構(gòu)化（表格化、多維、異構(gòu)）和時(shí)間序列數(shù)據(jù)變得既簡單又直觀。

Pandas 適用于以下各類數(shù)據(jù)：

具有異構(gòu)類型列的表格數(shù)據(jù)，如 SQL 表或 Excel 表；

有序和無序（不一定是固定頻率）的時(shí)間序列數(shù)據(jù)；

帶有行/列標(biāo)簽的任意矩陣數(shù)據(jù)（同構(gòu)類型或者是異構(gòu)類型）；

其他任意形式的統(tǒng)計(jì)數(shù)據(jù)集。事實(shí)上，數(shù)據(jù)根本不需要標(biāo)記就可以放入 Pandas 結(jié)構(gòu)中。

1、read_csv（nrows=n）

大多數(shù)人都會(huì)犯的一個(gè)錯(cuò)誤是，在不需要.csv 文件的情況下仍會(huì)完整地讀取它。如果一個(gè)未知的.csv 文件有 10GB，那么讀取整個(gè).csv 文件將會(huì)非常不明智，不僅要占用大量內(nèi)存，還會(huì)花很多時(shí)間。我們需要做的只是從.csv 文件中導(dǎo)入幾行，之后根據(jù)需要繼續(xù)導(dǎo)入。

import io

import requests# I am using this online data set just to make things easier for you guys

url = “https://raw.github.com/vincentarelbundock/Rdatasets/master/csv/datasets/AirPassengers.csv”

s = requests.get（url）.content# read only first 10 rows

df = pd.read_csv（io.StringIO（s.decode（ utf-8 ）），nrows=10 ， index_col=0）

2、map（）

map（）函數(shù)根據(jù)相應(yīng)的輸入來映射 Series 的值。用于將一個(gè) Series 中的每個(gè)值替換為另一個(gè)值，該值可能來自一個(gè)函數(shù)、也可能來自于一個(gè) dict 或 Series。

# create a dataframe

dframe = pd.DataFrame（np.random.randn（4， 3）， columns=list（ bde ）， index=［ India ， USA ， China ， Russia ］）#compute a formatted string from each floating point value in frame

changefn = lambda x： %.2f % x# Make changes element-wise

dframe［ d ］.map（changefn）

3、apply（）

apply（）允許用戶傳遞函數(shù)，并將其應(yīng)用于 Pandas 序列中的每個(gè)值。

# max minus mix lambda fn

fn = lambda x： x.max（） - x.min（）# Apply this on dframe that we ve just created above

dframe.apply（fn）

4、isin（）

lsin （）用于過濾數(shù)據(jù)幀。Isin （）有助于選擇特定列中具有特定（或多個(gè)）值的行。

# Using the dataframe we created for read_csv

filter1 = df［“value”］.isin（［112］）

filter2 = df［“time”］.isin（［1949.000000］）df ［filter1 & filter2］

5、copy（）

Copy （）函數(shù)用于復(fù)制 Pandas 對象。當(dāng)一個(gè)數(shù)據(jù)幀分配給另一個(gè)數(shù)據(jù)幀時(shí)，如果對其中一個(gè)數(shù)據(jù)幀進(jìn)行更改，另一個(gè)數(shù)據(jù)幀的值也將發(fā)生更改。為了防止這類問題，可以使用 copy （）函數(shù)。

# creating sample series

data = pd.Series（［ India ， Pakistan ， China ， Mongolia ］）# Assigning issue that we face

data1= data

# Change a value

data1［0］= USA

# Also changes value in old dataframe

data# To prevent that， we use# creating copy of series

new = data.copy（）# assigning new values

new［1］= Changed value # printing data print（new）

print（data）

6、select_dtypes（）

select_dtypes（）的作用是，基于 dtypes 的列返回?cái)?shù)據(jù)幀列的一個(gè)子集。這個(gè)函數(shù)的參數(shù)可設(shè)置為包含所有擁有特定數(shù)據(jù)類型的列，亦或者設(shè)置為排除具有特定數(shù)據(jù)類型的列。

# We ll use the same dataframe that we used for read_csv

framex = df.select_dtypes（include=“float64”）# Returns only time column

最后，pivot_table（）也是 Pandas 中一個(gè)非常有用的函數(shù)。如果對 pivot_table（）在 excel 中的使用有所了解，那么就非常容易上手了。

# Create a sample dataframe

school = pd.DataFrame（{ A ：［ Jay ， Usher ， Nicky ， Romero ， Will ］，

B ：［ Masters ， Graduate ， Graduate ， Masters ， Graduate ］，

C ：［26， 22， 20， 23， 24］}）# Lets create a pivot table to segregate students based on age and course

table = pd.pivot_table（school， values = A ， index =［ B ， C ］，

columns =［ B ］， aggfunc = np.sum， fill_value=“Not Available”）

table

原文鏈接：https://towardsdatascience.com/12-amazing-pandas-numpy-functions-22e5671a45b8

編輯：jq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

SQL

SQL

+關(guān)注

關(guān)注
1

文章
753

瀏覽量
44032
函數(shù)

函數(shù)

+關(guān)注

關(guān)注
3

文章
4277

瀏覽量
62323
代碼

代碼

+關(guān)注

關(guān)注
30

文章
4722

瀏覽量
68234

原文標(biāo)題：12種Numpy&Pandas高效技巧

文章出處：【微信號(hào)：magedu-Linux，微信公眾號(hào)：馬哥Linux運(yùn)維】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評(píng)論

相關(guān)推薦

語義分割25種損失函數(shù)綜述和展望

本綜述提供了對25種用于圖像分割的損失函數(shù)的全面且統(tǒng)一的回顧。我們提供了一種新穎的分類法，并詳細(xì)審查了這些損失函數(shù)如何在圖像分割中被定制和利用，強(qiáng)調(diào)了它們的重要特征和應(yīng)用，并進(jìn)行了系統(tǒng)

發(fā)表于 10-22 08:04 ?92次閱讀

語義分割25<b class='flag-5'>種</b>損失<b class='flag-5'>函數(shù)</b>綜述和展望

使用NumPy實(shí)現(xiàn)前饋神經(jīng)網(wǎng)絡(luò)

要使用NumPy實(shí)現(xiàn)一個(gè)前饋神經(jīng)網(wǎng)絡(luò)（Feedforward Neural Network），我們需要從基礎(chǔ)開始構(gòu)建，包括初始化網(wǎng)絡(luò)參數(shù)、定義激活函數(shù)及其導(dǎo)數(shù)、實(shí)現(xiàn)前向傳播、計(jì)算損失函數(shù)、以及實(shí)現(xiàn)

發(fā)表于 07-11 16:30 ?1478次閱讀

pytorch如何訓(xùn)練自己的數(shù)據(jù)

（https://pytorch.org/）來獲取安裝指令。安裝完成后，我們還需要安裝一些常用的庫，如NumPy、Pandas、Matplotlib等。 pip install torch numpy

發(fā)表于 07-11 10:04 ?421次閱讀

python 學(xué)習(xí)：在內(nèi)網(wǎng)中 python庫-numpy 安裝方法，升級(jí)pip3版本的指令

指令格式如下：先下載numpy庫到C盤具體位置手動(dòng)安裝指令如下： pip install c:\\\\users\\\\sesa738142

發(fā)表于 04-22 17:18

回調(diào)函數(shù)(callback)是什么？回調(diào)函數(shù)的實(shí)現(xiàn)方法

回調(diào)函數(shù)是一種特殊的函數(shù)，它作為參數(shù)傳遞給另一個(gè)函數(shù)，并在被調(diào)用函數(shù)執(zhí)行完畢后被調(diào)用?；卣{(diào)函數(shù)通

發(fā)表于 03-12 11:46 ?2645次閱讀

函數(shù)發(fā)生器的作用,概念要點(diǎn)是什么

函數(shù)生成器是Python中非常強(qiáng)大的特性之一。它們允許我們以一種簡潔且高效的方式生成迭代器，從而幫助我們更好地處理大量數(shù)據(jù)或者在特定條件下生成無限數(shù)據(jù)。在本文中，我們將探討函數(shù)生成器的

發(fā)表于 02-23 16:01 ?492次閱讀

verilog function函數(shù)的用法

Verilog 是一種硬件描述語言 (HDL)，主要用于描述數(shù)字電子電路的行為和結(jié)構(gòu)。在 Verilog 中，函數(shù) (Function) 是一種用于執(zhí)行特定任務(wù)并返回一個(gè)值的可重用代碼塊。函數(shù)

發(fā)表于 02-22 15:49 ?4806次閱讀

基于NumPy的機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)

David Bourgin 表示他一直在慢慢寫或收集不同模型與模塊的純 NumPy 實(shí)現(xiàn)，它們跑起來可能沒那么快，但是模型的具體過程一定足夠直觀。每當(dāng)我們想了解模型 API 背后的實(shí)現(xiàn)，卻又不想看復(fù)雜的框架代碼，那么它可以作為快速的參考。

發(fā)表于 01-17 12:36 ?181次閱讀

Python利用pandas讀寫Excel文件

使用pandas模塊讀取Excel文件可以更為方便和快捷。pandas可以將Excel文件讀取為一個(gè)DataFrame對象，方便進(jìn)行數(shù)據(jù)處理和分析。

發(fā)表于 12-16 11:22 ?1246次閱讀

vlookup函數(shù)的使用方法兩個(gè)表匹配

、參數(shù)、示例和注意事項(xiàng)，幫助讀者正確并高效地應(yīng)用該函數(shù)，以滿足各種數(shù)據(jù)處理需求。第一部分：概述與基本語法 1.1 概述：vlookup函數(shù)是Excel中一種常用的查找

發(fā)表于 12-03 10:23 ?1669次閱讀

使用pandas進(jìn)行數(shù)據(jù)選擇和過濾的基本技術(shù)和函數(shù)

Python pandas庫提供了幾種選擇和過濾數(shù)據(jù)的方法，如loc、iloc、[]括號(hào)操作符、query、isin、between等等

發(fā)表于 12-01 10:14 ?324次閱讀

isnan函數(shù)的使用方法

isnan函數(shù)是一種用于檢查特定值是否為“非數(shù)字”的函數(shù)。在Python中，該函數(shù)屬于math模塊，并提供了一種簡單的方法來區(qū)分?jǐn)?shù)字和非數(shù)字

發(fā)表于 11-30 16:24 ?2860次閱讀

python第三方庫有哪些

Python） NumPy 是 Python 中最重要且最常用的科學(xué)計(jì)算庫之一。它提供了支持大型、多維數(shù)組和矩陣運(yùn)算的高性能數(shù)學(xué)函數(shù)和計(jì)算工具。NumPy 的使用極為廣泛，尤其在數(shù)據(jù)處理、數(shù)值計(jì)算

發(fā)表于 11-29 14:31 ?2070次閱讀

如何實(shí)現(xiàn)Pandas的DataFrame轉(zhuǎn)換交互式表格

Pivottablejs是一個(gè)通過IPython widgets集成到Python中的JavaScript庫，允許用戶直接從DataFrame數(shù)據(jù)創(chuàng)建交互式和靈活的匯總報(bào)表?？梢赃M(jìn)行高效、清晰的數(shù)據(jù)分析和表示，幫助將數(shù)據(jù)從Pandas DataFrame轉(zhuǎn)換為易于觀察的交

發(fā)表于 11-21 16:15 ?793次閱讀

四種獲取內(nèi)核函數(shù)地址的方法

在內(nèi)核調(diào)試中，經(jīng)常需要知道某個(gè)函數(shù)的地址，或者根據(jù)函數(shù)地址找到對應(yīng)的函數(shù)，從而進(jìn)行更深一步的debug。

發(fā)表于 11-17 16:58 ?1218次閱讀