0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

推薦神器:四大可供學(xué)習(xí)Pandas的GitHub代碼庫(kù)

如意 ? 來(lái)源:讀芯術(shù)微信公眾號(hào) ? 作者:讀芯術(shù)微信公眾號(hào) ? 2020-08-19 13:40 ? 次閱讀

Github的大名想必?zé)o人不知,無(wú)人不曉。一些新手或許會(huì)不敢接觸Github,但同為初學(xué)者,我非常清楚Github的用途遠(yuǎn)不止管理項(xiàng)目版本。除了人人都可參與的開(kāi)源項(xiàng)目以外,Github上還有豐富的學(xué)習(xí)資源。

網(wǎng)課固然讓人受益良多,但輔以練習(xí)才能鞏固新知。一些常用網(wǎng)站,例如“Codewars”和“Codekata”,提供每日練習(xí),用戶可根據(jù)自身需求選擇語(yǔ)言并解題。

如果要針對(duì)Pandas進(jìn)行強(qiáng)化練習(xí),可以參考下列四大可供學(xué)習(xí)Pandas的Github代碼倉(cāng)庫(kù)。其中一個(gè)代碼倉(cāng)庫(kù)經(jīng)Fork次數(shù)最多,受眾層次廣,Pandas新手以及進(jìn)階學(xué)習(xí)者都可使用。

Pandas Exercises——多種類數(shù)據(jù)(4k Forks)

該代碼倉(cāng)庫(kù)由11個(gè)部分組成,涵蓋了從數(shù)據(jù)預(yù)處理到高級(jí)數(shù)據(jù)可視化等內(nèi)容。每個(gè)文件夾中有多個(gè)數(shù)據(jù)集,包含不同的練習(xí)。

用戶可下載IPYNB文件,打開(kāi)Jupyter notebook,親自動(dòng)手一試??蓪⒋a輸入題目下方的空白cell框格中,并查看“Exercise_with_Solution.ipynb”文件以核對(duì)答案。

該代碼倉(cāng)庫(kù)資源綜合性強(qiáng),共有27個(gè)notebook可供使用。即使已經(jīng)熟悉Pandas,“入門須知(Getting and knowing)”部分也值得一看,或許可從中新學(xué)到.describe(include=all) 和 .nunique()等函數(shù)。

Pandas Videos——多種類數(shù)據(jù)/含視頻(1.2k Forks)

該代碼倉(cāng)庫(kù)內(nèi)含的Jupyter notebook附有代碼,其代碼來(lái)自于一個(gè)介紹Pandas多種不同功能的系列視頻。作者使用真實(shí)數(shù)據(jù)集,遍歷了解決問(wèn)題的全過(guò)程,將其寫進(jìn)notebook中并發(fā)布于網(wǎng)上。

理想狀態(tài)下,打開(kāi)Jupyter notebook后便會(huì)隨之播放視頻。視頻和代碼都瀏覽完畢后,可將代碼倉(cāng)庫(kù)中的notebook作為“答題紙”。這些notebook中還附有腳注,有助于厘清特定cell框格的輸出結(jié)果。

這些視頻與相應(yīng)的notebook綜合性極強(qiáng)。對(duì)于Pandas相關(guān)的疑問(wèn),諸如“如何對(duì)Pandas中的Series和Dataframe進(jìn)行排序”等簡(jiǎn)單小問(wèn)題,或是“如何用Pandas和sci-kit learn在Kaggle完成提交”等復(fù)雜大問(wèn)題,都能在這一代碼倉(cāng)庫(kù)中獲得解答。

100 Pandas Puzzles(1k Forks)

該代碼庫(kù)中含有一個(gè)Jupyter notebook文件和一些練習(xí)以供下載。用戶可將代碼填入問(wèn)題下方的cell框格中,并可與“solutionsnotebook”文件中的相應(yīng)cell框格進(jìn)行比對(duì)。

notebook由不同部分組成,包括“導(dǎo)入Pandas(Importing Pandas)”、“DataFrame基礎(chǔ)知識(shí)(DataFrame basics)”和“Series與DatetimeIndex(Series andDatetimeIndex)”等。大多數(shù)問(wèn)題并不需大段代碼,在理想情況下僅用寥寥幾行即可解決。

該代碼倉(cāng)庫(kù)中的“掃雷(Minesweeper)”部分很有趣,內(nèi)容包含:創(chuàng)建DataFrame,使其內(nèi)含掃雷游戲的必要數(shù)據(jù),包括方格坐標(biāo)值、格內(nèi)是否含雷及其相鄰方格中的含雷數(shù)量。“掃雷”中等偏難,對(duì)于已完成之前練習(xí)的人來(lái)說(shuō),仍屬力所能及之范圍。有別于傳統(tǒng)的數(shù)據(jù)分析,該部分考察了在特殊場(chǎng)景中運(yùn)用DataFrame的能力,頗具趣味性。

作者也指出了題目列表尚不完整,有意完善題目的人可以提出申請(qǐng),以獲取更多練習(xí)、做出更正和改進(jìn)。

Pycon 2019 Tutorial——中等難度(180 Forks)

該代碼倉(cāng)庫(kù)中含有一個(gè)極長(zhǎng)的notebook,其中有作者在自制的“使用Pandas的最佳數(shù)據(jù)科學(xué)實(shí)踐(Data Science Best Practices with Pandas)”視頻中討論到的代碼。該代碼倉(cāng)庫(kù)不含Pandas的基礎(chǔ)知識(shí),因此適合中等水平的Pandas用戶使用。

它共有八個(gè)主要部分,并不十分遵循“教程”模式,更類似于真實(shí)的數(shù)據(jù)分析項(xiàng)目,從數(shù)據(jù)檢驗(yàn)、數(shù)據(jù)清洗到創(chuàng)建初步可視化,以幫助解答一些具體的問(wèn)題,例如“平均來(lái)說(shuō),哪類職業(yè)的工作者發(fā)表的TED演講最為有趣?”等。

對(duì)于剛接觸Python和Pandas的數(shù)據(jù)分析項(xiàng)目的新手來(lái)說(shuō),可以觀看整個(gè)視頻來(lái)學(xué)習(xí)他人如何完成數(shù)據(jù)清洗、探索和分析等不同步驟,取其精華并活用于自己的項(xiàng)目之中。

學(xué)習(xí)的途徑多種多樣,你不妨從中選取符合自己Pandas水平的學(xué)習(xí)資源,在Github上一試身手。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6715

    瀏覽量

    88316
  • 源代碼
    +關(guān)注

    關(guān)注

    96

    文章

    2942

    瀏覽量

    66446
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    461

    瀏覽量

    16236
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    上傳本地項(xiàng)目代碼github

    概述 GitHub是一個(gè)面向開(kāi)源及私有軟件項(xiàng)目的托管平臺(tái),因?yàn)橹恢С謌it 作為唯一的版本庫(kù)格式進(jìn)行托管,故名GitHub。本文主要講解如何將本地代碼上傳至
    發(fā)表于 09-11 16:33

    一種常用嵌入式開(kāi)發(fā)代碼庫(kù)

    語(yǔ)言std庫(kù),工具庫(kù)等等。具有簡(jiǎn)單,通用,高效的特點(diǎn),目的為了學(xué)習(xí)以及在開(kāi)發(fā)中拿來(lái)就用,提高開(kāi)發(fā)效率以及代碼可靠穩(wěn)定性。
    的頭像 發(fā)表于 09-04 08:06 ?188次閱讀
    一種常用嵌入式開(kāi)發(fā)<b class='flag-5'>代碼</b><b class='flag-5'>庫(kù)</b>

    GitHub推出GitHub Models服務(wù),賦能開(kāi)發(fā)者智能選擇AI模型

    8月2日,全球領(lǐng)先的代碼托管平臺(tái)GitHub宣布了一項(xiàng)重大創(chuàng)新——GitHub Models服務(wù)的正式推出。該服務(wù)被定位為AI時(shí)代的工程師助手,旨在幫助全球超過(guò)1億的GitHub用戶輕
    的頭像 發(fā)表于 08-02 15:39 ?386次閱讀

    深度學(xué)習(xí)常用的Python庫(kù)

    深度學(xué)習(xí)作為人工智能的一個(gè)重要分支,通過(guò)模擬人類大腦中的神經(jīng)網(wǎng)絡(luò)來(lái)解決復(fù)雜問(wèn)題。Python作為一種流行的編程語(yǔ)言,憑借其簡(jiǎn)潔的語(yǔ)法和豐富的庫(kù)支持,成為了深度學(xué)習(xí)研究和應(yīng)用的首選工具。本文將深入探討
    的頭像 發(fā)表于 07-03 16:04 ?390次閱讀

    GitHub推出新功能:智能掃描代碼潛在漏洞

    代碼掃描”功能還能預(yù)防新手引入新的問(wèn)題,并支持在設(shè)定的日期和時(shí)間進(jìn)行掃描,或者讓特定事件(如推送到倉(cāng)庫(kù)中)觸發(fā)掃描。若AI判定代碼內(nèi)可能存在隱患,GitHub將在倉(cāng)庫(kù)中發(fā)出預(yù)警,待用戶修正引發(fā)求救信號(hào)的部分后,再撤銷警告。
    的頭像 發(fā)表于 03-21 14:55 ?441次閱讀

    MES實(shí)施的四大疑惑

    電子發(fā)燒友網(wǎng)站提供《MES實(shí)施的四大疑惑.docx》資料免費(fèi)下載
    發(fā)表于 03-01 15:35 ?0次下載

    GitHub Copilot Enterprise全線向企業(yè)客戶開(kāi)放,提供個(gè)性化定制服務(wù)

    在官方博客中,GitHub 詳細(xì)說(shuō)明了新版本 Enterprise 在標(biāo)準(zhǔn)版和商業(yè)版 GitHub Copilot 基礎(chǔ)上的差異點(diǎn)。Enterprise 特有功能包括依據(jù)企業(yè)特定代碼和知識(shí)庫(kù)
    的頭像 發(fā)表于 02-28 15:45 ?545次閱讀

    Python利用pandas讀寫Excel文件

    使用pandas模塊讀取Excel文件可以更為方便和快捷。pandas可以將Excel文件讀取為一個(gè)DataFrame對(duì)象,方便進(jìn)行數(shù)據(jù)處理和分析。
    的頭像 發(fā)表于 12-16 11:22 ?1032次閱讀
    Python利用<b class='flag-5'>pandas</b>讀寫Excel文件

    GitHub入門與實(shí)踐

    GitHub 是一個(gè)基于 Git 版本控制系統(tǒng)的代碼托管平臺(tái),它提供了許多功能和用途,主要面向軟件開(kāi)發(fā)和協(xié)作。以下是 GitHub 的主要用途和一些關(guān)鍵技術(shù):GitHub 的主要用途:
    發(fā)表于 12-14 09:53 ?4次下載

    GitHub底層數(shù)據(jù)庫(kù)無(wú)縫升級(jí)到MySQL 8.0的經(jīng)驗(yàn)

    GitHub 團(tuán)隊(duì)近日分享了他們將 GitHub.com 的底層數(shù)據(jù)庫(kù)無(wú)縫升級(jí)到 MySQL 8.0 的經(jīng)驗(yàn)。 據(jù)介紹,GitHub 使用 MySQL 來(lái)存儲(chǔ)大量關(guān)系數(shù)據(jù),因此在不影響
    的頭像 發(fā)表于 12-13 10:21 ?394次閱讀
    <b class='flag-5'>GitHub</b>底層數(shù)據(jù)<b class='flag-5'>庫(kù)</b>無(wú)縫升級(jí)到MySQL 8.0的經(jīng)驗(yàn)

    使用pandas進(jìn)行數(shù)據(jù)選擇和過(guò)濾的基本技術(shù)和函數(shù)

    Python pandas庫(kù)提供了幾種選擇和過(guò)濾數(shù)據(jù)的方法,如loc、iloc、[]括號(hào)操作符、query、isin、between等等
    的頭像 發(fā)表于 12-01 10:14 ?280次閱讀
    使用<b class='flag-5'>pandas</b>進(jìn)行數(shù)據(jù)選擇和過(guò)濾的基本技術(shù)和函數(shù)

    Pandas DataFrame的存儲(chǔ)格式性能對(duì)比

    Pandas 支持多種存儲(chǔ)格式,在本文中將對(duì)不同類型存儲(chǔ)格式下的Pandas Dataframe的讀取速度、寫入速度和大小的進(jìn)行測(cè)試對(duì)比。 創(chuàng)建測(cè)試Dataframe 首先創(chuàng)建一個(gè)包含不同類型數(shù)據(jù)
    的頭像 發(fā)表于 11-03 09:58 ?432次閱讀
    <b class='flag-5'>Pandas</b> DataFrame的存儲(chǔ)格式性能對(duì)比

    Black:自動(dòng)格式化代碼神器

    代碼規(guī)范?。?沒(méi)事,現(xiàn)在有Black這個(gè)神器,我們可以在終端中輸入一句命令就自動(dòng)格式化代碼!而且對(duì)于初學(xué)者來(lái)說(shuō),用Black來(lái)學(xué)習(xí)代碼規(guī)范也
    的頭像 發(fā)表于 11-02 14:51 ?1041次閱讀
    Black:自動(dòng)格式化<b class='flag-5'>代碼</b>的<b class='flag-5'>神器</b>

    如何利用Python和pandas來(lái)處理json數(shù)據(jù)

    了如何利用Python和pandas(Python的第三方庫(kù))來(lái)處理json數(shù)據(jù),主要內(nèi)容包含: json數(shù)據(jù)簡(jiǎn)介 常用json數(shù)據(jù)轉(zhuǎn)化網(wǎng)站 json數(shù)據(jù)和Python數(shù)據(jù)的轉(zhuǎn)化 pandas處理
    的頭像 發(fā)表于 11-01 10:59 ?1684次閱讀
    如何利用Python和<b class='flag-5'>pandas</b>來(lái)處理json數(shù)據(jù)

    NNI:自動(dòng)幫你做機(jī)器學(xué)習(xí)調(diào)參的神器

    NNI 自動(dòng)機(jī)器學(xué)習(xí)調(diào)參,是微軟開(kāi)源的又一個(gè)神器,它能幫助你找到最好的神經(jīng)網(wǎng)絡(luò)架構(gòu)或超參數(shù),支持 各種訓(xùn)練環(huán)境 。 它常用的 使用場(chǎng)景 如下: 想要在自己的代碼、模型中試驗(yàn) 不同的機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 10-30 10:28 ?2141次閱讀
    NNI:自動(dòng)幫你做機(jī)器<b class='flag-5'>學(xué)習(xí)</b>調(diào)參的<b class='flag-5'>神器</b>