0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用Python構(gòu)建基于web應(yīng)用程序的交互式儀表板

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:Ajay Thorve ? 2022-04-21 14:54 ? 次閱讀

使用 Plotly 的 Dash 、 RAPIDS 和 Data shader ,用戶可以構(gòu)建 viz 儀表板,既可以呈現(xiàn) 3 億多行的數(shù)據(jù)集,又可以保持高度的交互性,而無(wú)需預(yù)先計(jì)算聚合

使用 RAPIDS cuDF 和 Plotly Dash 在 GPU 上進(jìn)行實(shí)時(shí)交互式可視化分析

Dash 是來(lái)自 Plotly 的一個(gè)開(kāi)源框架,用于使用 Python 構(gòu)建基于 web 應(yīng)用程序的交互式儀表板。此外,開(kāi)放源碼軟件( OSS )庫(kù)的 RAPIDS 套件提供了完全在 GPU 上執(zhí)行端到端數(shù)據(jù)科學(xué)和分析管道的自由。將這兩個(gè)項(xiàng)目結(jié)合起來(lái),即使在單個(gè) GPU 上,也可以實(shí)現(xiàn)對(duì)數(shù)千兆字節(jié)數(shù)據(jù)集的實(shí)時(shí)、交互式可視化分析。

此人口普查可視化使用 dashapi 生成圖表及其回調(diào)函數(shù)。相反, RAPIDS cuDF 被用來(lái)加速這些回調(diào),以實(shí)現(xiàn)實(shí)時(shí)聚合和查詢操作。

使用 2010 年人口普查數(shù)據(jù)的修改版本,結(jié)合 2006-2010 年美國(guó)社區(qū)調(diào)查數(shù)據(jù)(獲得了 fantastic IPUMS.org 的許可),我們將 美國(guó)的每一個(gè)人 映射到位于相當(dāng)于一個(gè)城市街區(qū)的單個(gè)點(diǎn)(隨機(jī))。因此,每個(gè)人都有與之相關(guān)聯(lián)的獨(dú)特的人口統(tǒng)計(jì)屬性,這些屬性支持以前不可能的細(xì)粒度過(guò)濾和數(shù)據(jù)發(fā)現(xiàn)。我們的 GitHub 上公開(kāi)了代碼、安裝細(xì)節(jié)和數(shù)據(jù)警告。

第 1 部分:可視化的數(shù)據(jù)準(zhǔn)備

雖然不是最新的數(shù)據(jù)集,但我們選擇使用 2010 年人口普查,因?yàn)樗哂懈叩乩砜臻g分辨率、大尺寸和可用性。經(jīng)過(guò)一些修改, 3.08 億行× 7 列( int8 型) 的最終數(shù)據(jù)集足夠大,足以說(shuō)明 GPU 加速的好處。

Census 2010 SF1 +形狀文件數(shù)據(jù)

我們決定把重點(diǎn)放在人口普查數(shù)據(jù)集上;最明顯的選擇是搜索 census.gov 網(wǎng)站,其中包括許多表格文件供下載。最適用的概要文件 1 有一個(gè)人口計(jì)數(shù)部分,其屬性包括性別、年齡、種族等。但是,該數(shù)據(jù)集是按 普查區(qū)水平 列表的,而不是按單個(gè)級(jí)別(出于各種隱私原因)。結(jié)果是 只有 211267 排, 每個(gè)街區(qū)一個(gè),包括性別、年齡、種族。

我們選擇使用人口普查塊邊界形狀文件來(lái)擴(kuò)展行計(jì)數(shù),以使所有塊的人口計(jì)數(shù)相等。然后,在邊界內(nèi)隨機(jī)分配一個(gè) lat long ,并為每個(gè)人創(chuàng)建一個(gè)唯一的行。為每個(gè)狀態(tài)執(zhí)行此操作的腳本可以在 Plotly-dash-rapids-census-demo 中找到。切換到由 IPUMS NHGIS 站點(diǎn)上的 數(shù)據(jù)查找工具 提供的更為用戶友好的數(shù)據(jù)集文件( SF1 和 tiger 邊界文件)可以加快這個(gè)過(guò)程。

在整個(gè)數(shù)據(jù)挖掘過(guò)程中,除了重復(fù)檢查每個(gè)匹配塊的聚合外,我們還使用我們自己的 cuxfilter 進(jìn)行快速原型制作和視覺(jué)精度檢查。在本例中,為 3.08 億行創(chuàng)建一個(gè)交互式地理散點(diǎn)圖非常簡(jiǎn)單:

import cuxfilter

import cudf

df = cudf.read_parquet(‘。/data/census_data.parquet/*’)

#create cuxfilter dataframe

cux_df = cuxfilter.DataFrame.from_dataframe(df)

chart0 = cuxfilter.charts.scatter_geo(x=‘x’, y=‘y’)

chart1 = cuxfilter.charts.bar(‘a(chǎn)ge’)

chart2 = cuxfilter.charts.bar(‘sex’)

d = cux_df.dashboard([chart0, chart1, chart2], layout=cuxfilter.layouts.feature_and_double_base

d.show()

圖 1 : Cuxfilter census dashboard ver 。 1

ACS 2006 – 2010 數(shù)據(jù)

出于好奇,我們是否可以結(jié)合其他有趣的屬性進(jìn)行交叉篩選,例如收入、教育程度和工人階級(jí),我們添加了 5 年的 2006-2010 年美國(guó)社區(qū)調(diào)查( ACS )數(shù)據(jù)集。該數(shù)據(jù)集在普查區(qū)塊組上聚合(比普查區(qū)塊大一級(jí))。因此,我們決定在塊組上進(jìn)行聚合,并將其任意分布到每個(gè)個(gè)體上,同時(shí)仍保持塊組級(jí)別的聚合值。修改后的數(shù)據(jù)集包括:

按年齡劃分的性別。

按教育程度分列的 25 歲及以上人口的性別。

16 歲及以上人口過(guò)去 12 個(gè)月收入(按 2010 年通貨膨脹調(diào)整后的美元計(jì)算)的性別。

按工人階級(jí)分列的 16 歲及以上平民就業(yè)人口的性別。

公共列是 Sex ,用于合并所有數(shù)據(jù)集。然而,雖然這種方法提供了其他有趣的屬性來(lái)進(jìn)行過(guò)濾,但結(jié)果有幾個(gè)注意事項(xiàng):

在地理位置或單個(gè)列上進(jìn)行交叉過(guò)濾將為所有其他列生成準(zhǔn)確的計(jì)數(shù)。

同時(shí)交叉過(guò)濾多個(gè)非地理列不一定會(huì)產(chǎn)生真實(shí)的計(jì)數(shù)。

與個(gè)人相關(guān)的屬性只是統(tǒng)計(jì)性的,不能反映真實(shí)的人。但是,當(dāng)匯總到人口普查區(qū)塊組級(jí)別或更高級(jí)別時(shí),它們是準(zhǔn)確的。

執(zhí)行該過(guò)程的筆記本可以在 plotly-dash-rapids-census-demo 上找到。最終的數(shù)據(jù)集如下所示:

圖 2 :最終普查數(shù)據(jù)集的 Dataframe 視圖。

下面是一個(gè)用于驗(yàn)證數(shù)據(jù)集值的快速 cuxfilter 儀表板:

import cuxfilter

import cudf

df = cudf.read_parquet(‘。/data/census_data.parquet/*’)

#create cuxfilter dataframe

cux_df = cuxfilter.DataFrame.from_dataframe(df)

#declare charts

chart0 = cuxfilter.charts.scatter_geo(x=‘x’, y=‘y’)

chart1 = cuxfilter.charts.bar(‘a(chǎn)ge’)

chart2 = cuxfilter.charts.bar(‘sex’)

chart3 = cuxfilter.charts.bar(‘cow’)

chart4 = cuxfilter.charts.bar(‘income’)

chart5 = cuxfilter.charts.bar(‘education’)

d = cux_df.dashboard(

[chart0, chart1, chart2, chart3, chart4, chart5],

layout=cuxfilter.layouts.feature_and_five_edge,

d.show()

圖 3 : Cuxfilter census dashboard ver 。 2 。

資源鏈接:

最終修改數(shù)據(jù)集 (~ 2 。 9 GB 焦油拼花文件)

所有數(shù)據(jù)準(zhǔn)備代碼 ( GitHub )

第 2 部分:使用 Plotly Dash 構(gòu)建交互式儀表板

Dash 支持在儀表板中添加單獨(dú)的 Plotly chart 對(duì)象,以及使用 Python 為每個(gè)對(duì)象圖形、選擇和布局單獨(dú)回調(diào)。例如,儀表板中基于上述數(shù)據(jù)集的圖表如下:

Scattermapbox :個(gè)體的種群分布

此圖表由兩層組成:

Scattermapbox 層。

Datashader 在上面生成了一個(gè)輸出圖像。

‘data’: [{

‘type’: ‘scattermapbox’,

‘lat’: lat, ‘lon’: lon,

}],

‘layout’: {

‘mapbox’: {

‘layers‘: [{

“sourcetype”: “image”,

“source”: datashader_output_img,

}],

}

圖 4 :美國(guó)人口的破折號(hào)數(shù)據(jù)陰影+地圖框聚集人口過(guò)剩計(jì)數(shù)。

圖表更新回調(diào)在以下位置觸發(fā):

“重新布局?jǐn)?shù)據(jù)”(向內(nèi)滾動(dòng)、向外滾動(dòng)、鼠標(biāo)平移)根據(jù)縮放級(jí)別重新渲染數(shù)據(jù)陰影圖像,以便分辨率保持不變。

下拉選擇“顏色依據(jù)”。

教育、收入、工人階級(jí)和年齡圖表的方框選擇。

地圖上的方框選擇。

條形圖:教育程度、收入、工人階級(jí)、年齡

‘data’: [

{‘type’: bar, ‘x’: Education, ‘y’: Count},

{‘type’: bar, ‘x’: Education, ‘y’: Count},

{‘type’: bar, ‘x’: Education, ‘y’: Count},

{‘type’: bar, ‘x’: Education, ‘y’: Count}

圖 5 :教育、收入、工人階級(jí)和年齡直方圖。

圖表更新回調(diào)在以下位置觸發(fā):

教育、收入、工人階級(jí)和年齡圖表的方框選擇。

地圖上的方框選擇。

下拉選擇“顏色依據(jù)”。

GPU 的適用范圍和幫助方式:

此儀表板中的每個(gè)圖表都從 GPU 加速到 cuDF :使用 GPU – 加速模式,在 24GB NVIDIA Titan NVIDIA RTX 上進(jìn)行過(guò)濾或縮放交互通常需要 0.2 – 2 秒。在高端 CPU 和 64GB 系統(tǒng)內(nèi)存上運(yùn)行,相同的交互通常需要 10-80 秒。通常, cuDF GPU 模式比 pandas CPU 模式快 20 倍以上 根據(jù)圖表。 20 倍的不同之處在于將報(bào)表儀表板轉(zhuǎn)換為交互式可視分析應(yīng)用程序。

數(shù)據(jù)可視化是一個(gè)迭代設(shè)計(jì)過(guò)程

盡管像人口普查中這樣一個(gè)記錄良好且可用的數(shù)據(jù)集,但了解這些數(shù)據(jù)并制定一個(gè) viz 來(lái)有效地與之交互似乎總是比對(duì)數(shù)據(jù)集 MIG 的任何初步研究都要花費(fèi)更長(zhǎng)的時(shí)間。

與所有數(shù)據(jù)可視化一樣,最終結(jié)果通常取決于在可用的數(shù)據(jù)和圖表、您試圖傳達(dá)的故事以及您正在通過(guò)的媒介(和硬件)之間找到適當(dāng)?shù)钠胶狻@?,我們?duì)列格式進(jìn)行了多次迭代,以確保 GPU 的使用可靠地保持在 24GB 單個(gè) GPU 限制之下,同時(shí)仍然允許多個(gè)圖表之間的平滑交互。

處理數(shù)據(jù)是復(fù)雜的,而處理大型數(shù)據(jù)集則更為復(fù)雜,但通過(guò)將 Plotly Dash 與 RAPIDS 相結(jié)合,我們可以提高分析師和數(shù)據(jù)科學(xué)家的能力。這些庫(kù)允許用戶在熟悉的環(huán)境中工作,并生成更大、更快、更具交互性的可視化應(yīng)用程序,為開(kāi)箱即用的生產(chǎn)做好準(zhǔn)備—將傳統(tǒng)可視化分析的邊界推向高性能計(jì)算領(lǐng)域。

關(guān)于作者

Ajay Thorve 是 NVIDIA 的軟件工程師, RAPIDS 組織的可視化團(tuán)隊(duì)的一部分。 Ajay 的背景是全棧開(kāi)發(fā)和數(shù)據(jù)科學(xué),主要興趣包括 JavaScript / TypeScript 和 Python 。目前, Ajay 在 RAPIDS viz 團(tuán)隊(duì)的工作主要集中在為 cuXfilter 和 node- RAPIDS 項(xiàng)目做出貢獻(xiàn)。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • python
    +關(guān)注

    關(guān)注

    53

    文章

    4753

    瀏覽量

    84068
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1197

    瀏覽量

    24532
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    使用 TPS1HC100-Q1 高效驅(qū)動(dòng)汽車儀表板負(fù)載應(yīng)用說(shuō)明

    電子發(fā)燒友網(wǎng)站提供《使用 TPS1HC100-Q1 高效驅(qū)動(dòng)汽車儀表板負(fù)載應(yīng)用說(shuō)明.pdf》資料免費(fèi)下載
    發(fā)表于 09-12 10:41 ?0次下載
    使用 TPS1HC100-Q1 高效驅(qū)動(dòng)汽車<b class='flag-5'>儀表板</b>負(fù)載應(yīng)用說(shuō)明

    華納云:java web和java有什么區(qū)別java web和java有什么區(qū)別

    的平臺(tái),Java可以用于開(kāi)發(fā)桌面應(yīng)用程序、移動(dòng)應(yīng)用程序、企業(yè)級(jí)應(yīng)用程序等。 – Java Web是Java語(yǔ)言在Web開(kāi)發(fā)領(lǐng)域的應(yīng)用,它使用
    的頭像 發(fā)表于 07-16 13:35 ?325次閱讀
    華納云:java <b class='flag-5'>web</b>和java有什么區(qū)別java <b class='flag-5'>web</b>和java有什么區(qū)別

    深耕交互式人工智能領(lǐng)域,聲通科技為用戶提供更加智能的解決方案

    在數(shù)字化浪潮席卷全球的今天,人工智能已成為推動(dòng)社會(huì)進(jìn)步的重要力量。作為中國(guó)交互式人工智能(CoAI)領(lǐng)域的開(kāi)拓者與領(lǐng)軍者,上海聲通信息科技股份有限公司(以下簡(jiǎn)稱“聲通科技”)憑借其創(chuàng)新
    的頭像 發(fā)表于 05-16 09:42 ?206次閱讀

    使用Docker部署Go Web應(yīng)用程序步驟

    大多數(shù)情況下Go應(yīng)用程序被編譯成單個(gè)二進(jìn)制文件,web應(yīng)用程序則會(huì)包括模版和配置文件。而當(dāng)一個(gè)項(xiàng)目中有很多文件的時(shí)候,由于很多文件沒(méi)有同步就會(huì)導(dǎo)致錯(cuò)誤的發(fā)生并且產(chǎn)生很多的問(wèn)題。
    發(fā)表于 04-20 09:33 ?383次閱讀
    使用Docker部署Go <b class='flag-5'>Web</b><b class='flag-5'>應(yīng)用程序</b>步驟

    市場(chǎng)前景向好,交互式人工智能提供商聲通科技迎廣闊發(fā)展空間

    根據(jù)艾瑞咨詢報(bào)告,2022年中國(guó)企業(yè)級(jí)交互式人工智能解決方案的市場(chǎng)滲透率僅為10.4%,美國(guó)市場(chǎng)滲透率為16.7%。目前中國(guó)企業(yè)級(jí)交互式人工智能解決方案的市場(chǎng)滲透率仍有巨大提升空間,預(yù)計(jì)2027年
    的頭像 發(fā)表于 04-11 14:12 ?243次閱讀

    聲通科技全棧交互式人工智能,助力企業(yè)智能化升級(jí)

    的研發(fā)實(shí)力和創(chuàng)新能力,為企業(yè)級(jí)用戶打造了一套交互式人工智能解決方案,幫助企業(yè)實(shí)現(xiàn)智能化升級(jí),提升運(yùn)營(yíng)效率。 據(jù)聲通科技IPO招股書(shū)顯示,公司深耕企業(yè)級(jí)交互式解決方案近二十年,構(gòu)建了集融合融信、人工智能以及產(chǎn)品引
    的頭像 發(fā)表于 03-20 09:56 ?231次閱讀

    鑒源實(shí)驗(yàn)室 | Web應(yīng)用程序常見(jiàn)漏洞淺析

    在如今的數(shù)字化時(shí)代,Web應(yīng)用程序已經(jīng)滲透到我們生活的每個(gè)角落。從購(gòu)物平臺(tái)、社交媒體到企業(yè)級(jí)系統(tǒng),無(wú)論是用戶還是組織,都依賴于這些應(yīng)用程序來(lái)滿足各自的業(yè)務(wù)需求。
    的頭像 發(fā)表于 01-26 11:33 ?788次閱讀
    鑒源實(shí)驗(yàn)室 | <b class='flag-5'>Web</b><b class='flag-5'>應(yīng)用程序</b>常見(jiàn)漏洞淺析

    web前端開(kāi)發(fā)和前端開(kāi)發(fā)的區(qū)別

    、CSS和JavaScript等技術(shù)來(lái)構(gòu)建用戶界面,實(shí)現(xiàn)用戶與應(yīng)用程序交互。Web前端開(kāi)發(fā)包括網(wǎng)頁(yè)設(shè)計(jì)、網(wǎng)頁(yè)編碼、前端框架使用以及優(yōu)化頁(yè)面性能等任務(wù)。 前端開(kāi)發(fā)是一個(gè)更廣泛的概念,它
    的頭像 發(fā)表于 01-18 09:54 ?2514次閱讀

    如何構(gòu)建linux開(kāi)發(fā)環(huán)境和編譯軟件工程、應(yīng)用程序

    前文介紹了如何使用官方提供的鏡像文件啟動(dòng)開(kāi)發(fā),本文將說(shuō)明如何構(gòu)建linux開(kāi)發(fā)環(huán)境和編譯軟件工程、應(yīng)用程序。
    的頭像 發(fā)表于 01-03 12:31 ?1505次閱讀
    如何<b class='flag-5'>構(gòu)建</b>linux開(kāi)發(fā)環(huán)境和編譯軟件工程、<b class='flag-5'>應(yīng)用程序</b>

    Python Web框架Django 5.0新特性

    根據(jù) JetBrains 公布的 2022 Python 開(kāi)發(fā)者調(diào)查結(jié)果,Python Web 框架的三巨頭依舊是 Flask、Django 和 FastAPI。Django 和 Flask 的使用率排名并列第一。
    的頭像 發(fā)表于 12-06 13:37 ?966次閱讀

    python窗口圖形界面編程

    Python是一種功能強(qiáng)大而又簡(jiǎn)單易用的編程語(yǔ)言,支持多種編程范式,包括面向過(guò)程、面向?qū)ο蠛秃瘮?shù)編程。除了用于開(kāi)發(fā)各種類型的應(yīng)用程序和網(wǎng)絡(luò)服務(wù),Python還提供了豐富的圖形用戶界面
    的頭像 發(fā)表于 11-22 14:23 ?737次閱讀

    Python自帶的命令窗口

    Python自帶的命令窗口,也稱為Python交互式解釋器,是Python編程語(yǔ)言的一個(gè)重要工具,它允許用戶在命令行界面中輸入和執(zhí)行Python
    的頭像 發(fā)表于 11-22 14:02 ?707次閱讀

    python怎樣運(yùn)行代碼

    Python是一種廣泛使用的編程語(yǔ)言,用于開(kāi)發(fā)各種類型的應(yīng)用程序。它具有簡(jiǎn)單易學(xué)的語(yǔ)法和強(qiáng)大的功能,可以用于編寫(xiě)簡(jiǎn)單的腳本、開(kāi)發(fā)桌面應(yīng)用、構(gòu)建Web應(yīng)用、進(jìn)行科學(xué)計(jì)算等多種用途。在本文
    的頭像 發(fā)表于 11-22 10:31 ?985次閱讀

    如何實(shí)現(xiàn)Pandas的DataFrame轉(zhuǎn)換交互式表格

    Pivottablejs是一個(gè)通過(guò)IPython widgets集成到Python中的JavaScript庫(kù),允許用戶直接從DataFrame數(shù)據(jù)創(chuàng)建交互式和靈活的匯總報(bào)表??梢赃M(jìn)行高效、清晰的數(shù)據(jù)分析和表示,幫助將數(shù)據(jù)從Pandas DataFrame轉(zhuǎn)換為易于觀察的
    的頭像 發(fā)表于 11-21 16:15 ?676次閱讀
    如何實(shí)現(xiàn)Pandas的DataFrame轉(zhuǎn)換<b class='flag-5'>交互式</b>表格

    一行代碼將Python程序轉(zhuǎn)換為GUI應(yīng)用程序

    Gooey項(xiàng)目支持用一行代碼將(幾乎)任何Python 2或3控制臺(tái)程序轉(zhuǎn)換為GUI應(yīng)用程序。 1.快速開(kāi)始 開(kāi)始之前,你要確保Python和pip已經(jīng)成功安裝在電腦上,如果沒(méi)有,可以
    的頭像 發(fā)表于 10-17 11:41 ?788次閱讀
    一行代碼將<b class='flag-5'>Python</b><b class='flag-5'>程序</b>轉(zhuǎn)換為GUI<b class='flag-5'>應(yīng)用程序</b>