0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python Pandas如何來管理結(jié)構(gòu)化數(shù)據(jù)

數(shù)據(jù)分析與開發(fā) ? 來源:數(shù)據(jù)分析與開發(fā) ? 2023-05-25 11:22 ? 次閱讀

Python Pandas是一個(gè)為Python編程提供數(shù)據(jù)操作和分析功能的開源工具包。這個(gè)庫已經(jīng)成為數(shù)據(jù)科學(xué)家和分析師的必備工具。它提供了一種有效的方法來管理結(jié)構(gòu)化數(shù)據(jù)(Series和DataFrame)。

人工智能領(lǐng)域,Pandas經(jīng)常用于機(jī)器學(xué)習(xí)深度學(xué)習(xí)過程的預(yù)處理步驟。Pandas通過提供數(shù)據(jù)清理、重塑、合并和聚合,可以將原始數(shù)據(jù)集轉(zhuǎn)換為結(jié)構(gòu)化的、隨時(shí)可用的2維表格,并將其輸入人工智能算法

63526d2c-fa4e-11ed-90ce-dac502259ad0.png

項(xiàng)目地址:https://github.com/gventuri/pandas-ai

使用 pip 安裝 Pandas AI

pipinstallpandasai

使用 OpenAI 導(dǎo)入 PandasAI

在下一步中,我們將導(dǎo)入之前安裝的 pandasai 庫,然后導(dǎo)入 LLM(大型語言模型)功能。截至 2023 年 5 月,pandasai 僅支持 OpenAI 模型,我們將使用它來理解數(shù)據(jù)。

importpandasaspd
frompandasaiimportPandasAI

#SampleDataFrame
df=pd.DataFrame({
"country":["UnitedStates","UnitedKingdom","France","Germany","Italy","Spain","Canada","Australia","Japan","China"],
"gdp":[19294482071552,2891615567872,2411255037952,3435817336832,1745433788416,1181205135360,1607402389504,1490967855104,4380756541440,14631844184064],
"happiness_index":[6.94,7.16,6.66,7.07,6.38,6.4,7.23,7.22,5.87,5.12]
})

#InstantiateaLLM
frompandasai.llm.openaiimportOpenAI
llm=OpenAI(api_token="your_API_key")

pandas_ai=PandasAI(llm)
pandas_ai.run(df,prompt='Whicharethe5happiestcountries?')
6Canada
7Australia
1UnitedKingdom
3Germany
0UnitedStates
Name:country,dtype:object

要使用 OpenAI API,您必須生成自己唯一的 API 密鑰。

因?yàn)閜andas的特性,我們不僅僅可以處理csv文件,我們還可以連接關(guān)系型的數(shù)據(jù)庫,例如pgsql:

#creatingtheuriandconnectingtodatabase
pg_conn="postgresql://YOURURIHERE"

#Querysqldatabase
query="""
SELECT*
FROMtable_name
"""

#Createdataframenameddf
df=pd.read_sql(query,pg_conn)

然后像上面代碼一樣,我們可以直接與它進(jìn)行對(duì)話了:

#Usingpandas-ai!
pandas_ai=PandasAI(llm)
pandas_ai.run(df,prompt='Placeyourprompthere)

當(dāng)然,你也可以讓 PandasAI 進(jìn)行更復(fù)雜的查詢。例如,可以要求 PandasAI 求出 2 個(gè)最不幸福國(guó)家的 GDP 總和:

pandas_ai.run(df,prompt='WhatisthesumoftheGDPsofthe2unhappiestcountries?')

上面的代碼將返回以下內(nèi)容:

19012600725504

也可以請(qǐng) PandasAI 畫圖:

pandas_ai.run(
df,
"Plotthehistogramofcountriesshowingforeachthegpd,usingdifferentcolorsforeachbar",
)
6370df14-fa4e-11ed-90ce-dac502259ad0.png
最后

ChatGPT、Pandas是強(qiáng)大的工具,當(dāng)它們結(jié)合在一起時(shí),可以徹底改變我們與數(shù)據(jù)交互和分析的方式。ChatGPT憑借其先進(jìn)的自然語言處理能力,可以更直觀地與數(shù)據(jù)進(jìn)行類似人類的交互。而PandasAI可以增強(qiáng)Pandas數(shù)據(jù)分析體驗(yàn)。通過將復(fù)雜的數(shù)據(jù)操作任務(wù)轉(zhuǎn)換為簡(jiǎn)單的自然語言查詢,PandasAI使用戶更容易從數(shù)據(jù)中提取有價(jià)值的見解,而無需編寫大量代碼。

這對(duì)于那些還不熟悉Python或pandas操作/轉(zhuǎn)換的人來說是一種編程的新方法。我們不需要為你想要執(zhí)行的任務(wù)編程,而是只是與AI代理交談,明確的額告訴它想要的結(jié)果,代理會(huì)將此消息轉(zhuǎn)換為計(jì)算機(jī)可解釋的代碼,并返回結(jié)果。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編程
    +關(guān)注

    關(guān)注

    88

    文章

    3565

    瀏覽量

    93536
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8349

    瀏覽量

    132312
  • python
    +關(guān)注

    關(guān)注

    55

    文章

    4767

    瀏覽量

    84375

原文標(biāo)題:Pandas + ChatGPT:交互式數(shù)據(jù)分析!

文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    結(jié)構(gòu)化布線系統(tǒng)有哪些難題

    在15年建筑物整修周期內(nèi)限制系統(tǒng)的升級(jí)。經(jīng)過精心設(shè)計(jì)的結(jié)構(gòu)化布線系統(tǒng)可以承受超過大多數(shù)局域網(wǎng)傳輸速率10~15倍的數(shù)據(jù)流量。這將允許在不改變結(jié)構(gòu)化布線系統(tǒng)的情況下使用新型網(wǎng)絡(luò)技術(shù)?! ?.通用
    發(fā)表于 05-19 13:46

    python數(shù)據(jù)分析的類庫

    ,因?yàn)樗匾?Pandas庫提供了我們很多函數(shù),能夠快速的方便的,處理結(jié)構(gòu)化的大型數(shù)據(jù),不夸張的說,Pandas是讓Python成為強(qiáng)大
    發(fā)表于 05-10 15:18

    TrustZone結(jié)構(gòu)化消息是什么?

    大家好,我已閱讀任何與TrustZone相關(guān)的內(nèi)容,但我無法弄清楚這兩個(gè)世界是如何相互溝通的。我所能找到的只是TrustZone API規(guī)范中的內(nèi)容:客戶端和服務(wù)可以通過兩種機(jī)制進(jìn)行通信:結(jié)構(gòu)化
    發(fā)表于 03-20 08:58

    Deeplearningai結(jié)構(gòu)化機(jī)器學(xué)習(xí)項(xiàng)目

    Deeplearningai 結(jié)構(gòu)化機(jī)器學(xué)習(xí)項(xiàng)目 Week2 6-10
    發(fā)表于 05-18 15:12

    結(jié)構(gòu)化設(shè)計(jì)分為哪幾部分?結(jié)構(gòu)化設(shè)計(jì)的要求有哪些

    結(jié)構(gòu)化設(shè)計(jì)分為哪幾部分?結(jié)構(gòu)化設(shè)計(jì)的要求有哪些?結(jié)構(gòu)化設(shè)計(jì)主要包括哪些部分?
    發(fā)表于 12-23 06:15

    結(jié)構(gòu)化布線的綜合說明

    結(jié)構(gòu)化布線的綜合說明 一、結(jié)構(gòu)化布線系統(tǒng)簡(jiǎn)介     隨著計(jì)算機(jī)和通信技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)應(yīng)用
    發(fā)表于 04-14 17:16 ?725次閱讀

    什么叫結(jié)構(gòu)化的算法_算法和結(jié)構(gòu)化數(shù)據(jù)初識(shí)

    結(jié)構(gòu)化算法是由一些基本結(jié)構(gòu)順序組成的,就是把一個(gè)大的功能的實(shí)現(xiàn)分隔為許多個(gè)小功能的實(shí)現(xiàn)。在基本結(jié)構(gòu)之間不存在向前或向后的跳轉(zhuǎn),流程的轉(zhuǎn)移只存在于一個(gè)基本的結(jié)構(gòu)范圍內(nèi)。一個(gè)非
    發(fā)表于 01-03 16:09 ?1.2w次閱讀
    什么叫<b class='flag-5'>結(jié)構(gòu)化</b>的算法_算法和<b class='flag-5'>結(jié)構(gòu)化</b><b class='flag-5'>數(shù)據(jù)</b>初識(shí)

    結(jié)構(gòu)化布線系統(tǒng)的四點(diǎn)注意事項(xiàng)

    布線系統(tǒng)結(jié)構(gòu)化 結(jié)構(gòu)化布線 title=結(jié)構(gòu)化布線結(jié)構(gòu)化布線 title=結(jié)構(gòu)化布線結(jié)構(gòu)化布線系
    發(fā)表于 10-16 10:52 ?1223次閱讀

    海量非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)難題 ,杉巖數(shù)據(jù)對(duì)象存儲(chǔ)完美解決

    過去幾年,大數(shù)據(jù)產(chǎn)業(yè)更多關(guān)注的是如何處理海量、多源和異構(gòu)的數(shù)據(jù),但我們必須承認(rèn)這些只是冰山一角。目前,結(jié)構(gòu)化數(shù)據(jù)僅占到全部數(shù)據(jù)量的20%,其
    發(fā)表于 03-15 17:22 ?1174次閱讀

    Danfo.js提供高性能、直觀易用的數(shù)據(jù)結(jié)構(gòu),支持結(jié)構(gòu)化數(shù)據(jù)的操作和處理

    Danfo.js 是個(gè) JavaScript 開源庫,提供了高性能、直觀易用的數(shù)據(jù)結(jié)構(gòu),支持結(jié)構(gòu)化數(shù)據(jù)的操作和處理。Danfo.js 深受 Python
    的頭像 發(fā)表于 09-23 18:21 ?5220次閱讀

    如何在Pixie中收集大量非結(jié)構(gòu)化數(shù)據(jù)

    Pixie 旨在幫助開發(fā)者快速了解并調(diào)試產(chǎn)品系統(tǒng)。為了實(shí)現(xiàn)這一目標(biāo),我們將提供支持,幫助開發(fā)者輕松訪問其生產(chǎn)系統(tǒng)中的一系列指標(biāo)和日志數(shù)據(jù)。如,幫助收集系統(tǒng)中各個(gè)進(jìn)程的 CPU 和內(nèi)存用量的結(jié)構(gòu)化數(shù)據(jù)
    的頭像 發(fā)表于 08-10 17:37 ?2697次閱讀

    詳解Python中的Pandas和Numpy庫

    pandas、numpy是Python數(shù)據(jù)科學(xué)中非常常用的庫,numpy是Python的數(shù)值計(jì)算擴(kuò)展,專門用來處理矩陣,它的運(yùn)算效率比列表更高效。
    的頭像 發(fā)表于 05-25 12:49 ?2479次閱讀

    PandasPython中最好的數(shù)據(jù)分析工具

    Pandas絕對(duì)是Python中最好的數(shù)據(jù)分析工具,不接受反駁。 本文將展示如何美化 Pandas DataFrame 中的數(shù)字,并使用一些更高級(jí)的
    的頭像 發(fā)表于 10-31 10:47 ?442次閱讀
    <b class='flag-5'>Pandas</b>:<b class='flag-5'>Python</b>中最好的<b class='flag-5'>數(shù)據(jù)</b>分析工具

    如何利用Pythonpandas來處理json數(shù)據(jù)

    了如何利用PythonpandasPython的第三方庫)來處理json數(shù)據(jù),主要內(nèi)容包含: json數(shù)據(jù)簡(jiǎn)介 常用json
    的頭像 發(fā)表于 11-01 10:59 ?2196次閱讀
    如何利用<b class='flag-5'>Python</b>和<b class='flag-5'>pandas</b>來處理json<b class='flag-5'>數(shù)據(jù)</b>

    結(jié)構(gòu)化布線的好處多嗎

    結(jié)構(gòu)化布線是網(wǎng)絡(luò)系統(tǒng)中的重要組成部分,因?yàn)樗鼮?b class='flag-5'>數(shù)據(jù)傳輸提供了強(qiáng)大、可擴(kuò)展且可靠的基礎(chǔ)。通過遵守全球公認(rèn)的標(biāo)準(zhǔn),結(jié)構(gòu)化布線可促進(jìn)高速連接、簡(jiǎn)化故障排除并確保未來的可擴(kuò)展性??紤]到這些優(yōu)勢(shì),企業(yè)應(yīng)優(yōu)先
    的頭像 發(fā)表于 04-07 11:15 ?399次閱讀