0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TransBigData與數(shù)據(jù)中的預(yù)處理

馬哥Linux運(yùn)維 ? 來(lái)源:馬哥Linux運(yùn)維 ? 作者:馬哥Linux運(yùn)維 ? 2022-09-29 09:39 ? 次閱讀

1、TransBigData簡(jiǎn)介

TransBigData是一個(gè)為交通時(shí)空大數(shù)據(jù)處理、分析和可視化而開(kāi)發(fā)的Python包。TransBigData為處理常見(jiàn)的交通時(shí)空大數(shù)據(jù)(如出租車GPS數(shù)據(jù)、共享單車數(shù)據(jù)和公交車GPS數(shù)據(jù)等)提供了快速而簡(jiǎn)潔的方法。TransBigData為交通時(shí)空大數(shù)據(jù)分析的各個(gè)階段提供了多種處理方法,代碼簡(jiǎn)潔、高效、靈活、易用,可以用簡(jiǎn)潔的代碼實(shí)現(xiàn)復(fù)雜的數(shù)據(jù)任務(wù)。

目前,TransBigData主要提供以下方法:

數(shù)據(jù)預(yù)處理:對(duì)數(shù)據(jù)集提供快速計(jì)算數(shù)據(jù)量、時(shí)間段、采樣間隔等基本信息的方法,也針對(duì)多種數(shù)據(jù)噪聲提供了相應(yīng)的清洗方法。

數(shù)據(jù)柵格化:提供在研究區(qū)域內(nèi)生成、匹配多種類型的地理柵格(矩形、三角形、六邊形及geohash柵格)的方法體系,能夠以向量化的方式快速算法將空間點(diǎn)數(shù)據(jù)映射到地理柵格上。

數(shù)據(jù)可視化:基于可視化包keplergl,用簡(jiǎn)單的代碼即可在Jupyter Notebook上交互式地可視化展示數(shù)據(jù)。

軌跡處理:從軌跡數(shù)據(jù)GPS點(diǎn)生成軌跡線型,軌跡點(diǎn)增密、稀疏化等。

地圖底圖、坐標(biāo)轉(zhuǎn)換與計(jì)算:加載顯示地圖底圖與各類特殊坐標(biāo)系之間的坐標(biāo)轉(zhuǎn)換。

特定處理方法:針對(duì)各類特定數(shù)據(jù)提供相應(yīng)處理方法,如從出租車GPS數(shù)據(jù)中提取訂單起訖點(diǎn),從手機(jī)信令數(shù)據(jù)中識(shí)別居住地與工作地,從地鐵網(wǎng)絡(luò)GIS數(shù)據(jù)構(gòu)建網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)并計(jì)算最短路徑等。

TransBigData可以通過(guò)pip或者conda安裝,在命令提示符中運(yùn)行下面代碼即可安裝:

pipinstall-Utransbigdata

安裝完成后,在Python中運(yùn)行如下代碼即可導(dǎo)入TransBigData包。

importtransbigdataastbd

2、數(shù)據(jù)預(yù)處理

TransBigData與數(shù)據(jù)處理中常用的Pandas和GeoPandas包能夠無(wú)縫銜接。首先我們引入Pandas包并讀取出租車GPS數(shù)據(jù):

importpandasaspd

#讀取數(shù)據(jù)
data=pd.read_csv('TaxiData-Sample.csv',header=None)
data.columns=['VehicleNum','time','lon','lat','OpenStatus','Speed']
data.head()

結(jié)果如圖2所示:

04615a28-3f35-11ed-9e49-dac502259ad0.png▲圖2 出租車GPS數(shù)據(jù)

然后,引入GeoPandas包,讀取研究范圍的區(qū)域信息并展示:

importgeopandasasgpd

#讀取研究范圍區(qū)域信息
sz=gpd.read_file(r'sz/sz.shp')
sz.plot()

結(jié)果如圖3所示:

0494d718-3f35-11ed-9e49-dac502259ad0.png▲圖3 研究范圍的區(qū)域信息

TransBigData包集成了交通時(shí)空數(shù)據(jù)的一些常用預(yù)處理方法。其中,tbd.clean_outofshape方法輸入數(shù)據(jù)和研究范圍區(qū)域信息,能夠剔除研究范圍外的數(shù)據(jù)。而tbd.clean_taxi_status方法則可以剔除出租車GPS數(shù)據(jù)中載客狀態(tài)瞬間變化的記錄。在使用預(yù)處理方法時(shí)需要傳入數(shù)據(jù)表中重要信息列所對(duì)應(yīng)的列名,代碼如下:

#數(shù)據(jù)預(yù)處理

#剔除研究范圍外的數(shù)據(jù),計(jì)算原理是在方法中先柵格化后柵格匹配研究范圍后實(shí)現(xiàn)對(duì)應(yīng)。因此這里需要同時(shí)定義柵格大小,越小則精度越高
data=tbd.clean_outofshape(data,sz,col=['lon','lat'],accuracy=500)

#剔除出租車數(shù)據(jù)中載客狀態(tài)瞬間變化的數(shù)據(jù)
data=tbd.clean_taxi_status(data,col=['VehicleNum','time','OpenStatus'])

經(jīng)過(guò)上面代碼的處理,我們就已經(jīng)將出租車GPS數(shù)據(jù)中研究范圍以外的數(shù)據(jù)和載客狀態(tài)瞬間變化的數(shù)據(jù)予以剔除。

3、數(shù)據(jù)柵格化

柵格形式(地理空間上相同大小的網(wǎng)格)是表達(dá)數(shù)據(jù)分布最基本的方法,GPS數(shù)據(jù)經(jīng)過(guò)柵格化后,每個(gè)數(shù)據(jù)點(diǎn)都含有其所在的柵格信息。采用柵格表達(dá)數(shù)據(jù)的分布時(shí),其表示的分布情況與真實(shí)情況接近。

TransBigData工具為我們提供了一套完整、快速、便捷的柵格處理體系。用TransBigData進(jìn)行柵格劃分時(shí),首先需要確定柵格化的參數(shù)(可以理解為定義了一個(gè)柵格坐標(biāo)系),參數(shù)可以幫助我們快速進(jìn)行柵格化:

#定義研究范圍邊界
bounds=[113.75,22.4,114.62,22.86]

#通過(guò)邊界獲取柵格化參數(shù)
params=tbd.area_to_params(bounds,accuracy=1000)
params

輸出:

{'slon': 113.75,
'slat': 22.4,
'deltalon': 0.00974336289289822,
'deltalat': 0.008993210412845813,
'theta': 0,
'method': 'rect',
'gridsize': 1000}

此時(shí)輸出的柵格化參數(shù)params的內(nèi)容存儲(chǔ)了柵格坐標(biāo)系的原點(diǎn)坐標(biāo)(slon、slat)、單個(gè)柵格的經(jīng)緯度長(zhǎng)寬 (deltalon、deltalat)、柵格的旋轉(zhuǎn)角度(theta)、柵格的形狀(method參數(shù),其值可以是方形rect、三角形tri和六邊形hexa)以及柵格的大?。╣ridsize參數(shù),單位為米)。

取得柵格化參數(shù)后,我們便可以用TransBigData中提供的方法對(duì)GPS數(shù)據(jù)進(jìn)行柵格匹配、生成等操作。

完整的柵格處理方法體系如圖4所示:

04d40ac8-3f35-11ed-9e49-dac502259ad0.png▲圖4 TransBigData所提供的柵格處理體系

使用tbd.GPS_to_grid方法能夠?yàn)槊恳粋€(gè)出租車GPS點(diǎn)生成,該方法會(huì)生成編號(hào)列LONCOL與 LATCOL,由這兩列共同指定所在的柵格:

#將GPS數(shù)據(jù)對(duì)應(yīng)至柵格,將生成的柵格編號(hào)列賦值到數(shù)據(jù)表上作為新的兩列
data['LONCOL'],data['LATCOL']=tbd.GPS_to_grids(data['lon'],data['lat'],params)

下一步,聚合集計(jì)每一柵格內(nèi)的數(shù)據(jù)量,并為柵格生成地理幾何圖形,構(gòu)建GeoDataFrame:

#聚合集計(jì)柵格內(nèi)數(shù)據(jù)量

grid_agg=data.groupby(['LONCOL','LATCOL'])['VehicleNum'].count().reset_index()

#生成柵格的幾何圖形
grid_agg['geometry']=tbd.grid_to_polygon([grid_agg['LONCOL'],grid_agg['LATCOL']],params)

#轉(zhuǎn)換為GeoDataFrame
grid_agg=gpd.GeoDataFrame(grid_agg)

#繪制柵格
grid_agg.plot(column='VehicleNum',cmap='autumn_r')

結(jié)果如圖5所示:

04e91670-3f35-11ed-9e49-dac502259ad0.png▲圖5 數(shù)據(jù)柵格化的結(jié)果

對(duì)于一個(gè)正式的數(shù)據(jù)可視化圖來(lái)說(shuō),我們還需要添加底圖、色條、指北針和比例尺。TransBigData也提供了相應(yīng)的功能,代碼如下:

importmatplotlib.pyplotasplt
fig=plt.figure(1,(8,8),dpi=300)
ax=plt.subplot(111)
plt.sca(ax)

#添加行政區(qū)劃邊界作為底圖
sz.plot(ax=ax,edgecolor=(0,0,0,0),facecolor=(0,0,0,0.1),linewidths=0.5)

#定義色條位置
cax=plt.axes([0.04,0.33,0.02,0.3])
plt.title('Datacount')
plt.sca(ax)

#繪制數(shù)據(jù)
grid_agg.plot(column='VehicleNum',cmap='autumn_r',ax=ax,cax=cax,legend=True)

#添加指北針和比例尺
tbd.plotscale(ax,bounds=bounds,textsize=10,compasssize=1,accuracy=2000,rect=[0.06,0.03],zorder=10)
plt.axis('off')
plt.xlim(bounds[0],bounds[2])
plt.ylim(bounds[1],bounds[3])
plt.show()

結(jié)果如圖6所示:

051eefb6-3f35-11ed-9e49-dac502259ad0.png▲圖6 tbd包繪制的出租車GPS數(shù)據(jù)分布

4、訂單起訖點(diǎn)OD提取與聚合集計(jì)

針對(duì)出租車GPS數(shù)據(jù),TransBigData提供了直接從數(shù)據(jù)中提取出出租車訂單起訖點(diǎn)(OD)信息的方法,代碼如下:

#從GPS數(shù)據(jù)提取OD

oddat=tbd.taxigps_to_od(data,col=['VehicleNum','time','Lng','Lat','OpenStatus'])
oddata

結(jié)果如圖7所示:

05c7584a-3f35-11ed-9e49-dac502259ad0.png▲圖7 tbd包提取的出租車OD

TransBigData包提供的柵格化方法可以讓我們快速地進(jìn)行柵格化定義,只需要修改accuracy參數(shù),即可快速定義不同大小粒度的柵格。我們重新定義一個(gè)2km*2km的柵格坐標(biāo)系,將其參數(shù)傳入tbd.odagg_grid方法對(duì)OD進(jìn)行柵格化聚合集計(jì)并生成GeoDataFrame:

#重新定義柵格,獲取柵格化參數(shù)
params=tbd.area_to_params(bounds,accuracy=2000)

#柵格化OD并集計(jì)
od_gdf=tbd.odagg_grid(oddata,params)
od_gdf.plot(column='count')

結(jié)果如圖8所示:

05fa8184-3f35-11ed-9e49-dac502259ad0.png▲圖8 tbd集計(jì)的柵格OD

添加地圖底圖,色條與比例尺指北針:

#創(chuàng)建圖框
importmatplotlib.pyplotasplt
fig=plt.figure(1,(8,8),dpi=300)
ax=plt.subplot(111)
plt.sca(ax)

#添加行政區(qū)劃邊界作為底圖
sz.plot(ax=ax,edgecolor=(0,0,0,1),facecolor=(0,0,0,0),linewidths=0.5)

#繪制colorbar
cax=plt.axes([0.05,0.33,0.02,0.3])
plt.title('Datacount')
plt.sca(ax)

#繪制OD
od_gdf.plot(ax=ax,column='count',cmap='Blues_r',linewidth=0.5,vmax=10,cax=cax,legend=True)

#添加比例尺和指北針
tbd.plotscale(ax,bounds=bounds,textsize=10,compasssize=1,accuracy=2000,rect=[0.06,0.03],zorder=10)
plt.axis('off')
plt.xlim(bounds[0],bounds[2])
plt.ylim(bounds[1],bounds[3])
plt.show()

結(jié)果如圖9所示:

06162510-3f35-11ed-9e49-dac502259ad0.png▲ 圖9 TransBigData繪制的柵格OD數(shù)據(jù)

同時(shí),TransBigData包也提供了將OD直接聚合集計(jì)到區(qū)域間的方法:

#OD集計(jì)到區(qū)域

#方法1:在不傳入柵格化參數(shù)時(shí),直接用經(jīng)緯度匹配
od_gdf=tbd.odagg_shape(oddata,sz,round_accuracy=6)

#方法2:傳入柵格化參數(shù)時(shí),程序會(huì)先柵格化后匹配以加快運(yùn)算速度,數(shù)據(jù)量大時(shí)建議使用
od_gdf=tbd.odagg_shape(oddata,sz,params=params)
od_gdf.plot(column='count')

結(jié)果如圖10所示:

063860bc-3f35-11ed-9e49-dac502259ad0.png▲圖10 tbd集計(jì)的小區(qū)OD

加載地圖底圖并調(diào)整出圖參數(shù):

#創(chuàng)建圖框
importmatplotlib.pyplotasplt
importplot_map
fig=plt.figure(1,(8,8),dpi=300)
ax=plt.subplot(111)
plt.sca(ax)

#添加行政區(qū)劃邊界作為底圖
sz.plot(ax=ax,edgecolor=(0,0,0,0),facecolor=(0,0,0,0.2),linewidths=0.5)

#繪制colorbar
cax=plt.axes([0.05,0.33,0.02,0.3])
plt.title('count')
plt.sca(ax)

#繪制OD
od_gdf.plot(ax=ax,vmax=100,column='count',cax=cax,cmap='autumn_r',linewidth=1,legend=True)

#添加比例尺和指北針
tbd.plotscale(ax,bounds=bounds,textsize=10,compasssize=1,accuracy=2000,rect=[0.06,0.03],zorder=10)
plt.axis('off')
plt.xlim(bounds[0],bounds[2])
plt.ylim(bounds[1],bounds[3])
plt.show()

結(jié)果如圖11所示:

065ce5f4-3f35-11ed-9e49-dac502259ad0.png▲ 圖11區(qū)域間OD可視化結(jié)果

5、交互可視化

在TransBigData中,我們可以對(duì)出租車數(shù)據(jù)使用簡(jiǎn)單的代碼在jupyter notebook中快速進(jìn)行交互可視化。這些可視化方法底層依托了keplergl包,可視化的結(jié)果不再是靜態(tài)的圖片,而是能夠與鼠標(biāo)響應(yīng)交互的地圖應(yīng)用。

tbd.visualization_data方法可以實(shí)現(xiàn)數(shù)據(jù)分布的可視化,將數(shù)據(jù)傳入該方法后,TransBigData會(huì)首先對(duì)數(shù)據(jù)點(diǎn)進(jìn)行柵格集計(jì),然后生成數(shù)據(jù)的柵格,并將數(shù)據(jù)量映射至顏色上。代碼如下:

#可視化數(shù)據(jù)點(diǎn)分布
tbd.visualization_data(data,col=['lon','lat'],accuracy=1000,height=500)

結(jié)果如圖12所示:

0680fc1e-3f35-11ed-9e49-dac502259ad0.gif▲ 圖12數(shù)據(jù)分布的柵格可視化

對(duì)于出租車數(shù)據(jù)中所提取出的出行OD,也可使用tbd.visualization_od方法實(shí)現(xiàn)OD的弧線可視化。該方法也會(huì)對(duì)OD數(shù)據(jù)進(jìn)行柵格聚合集計(jì),生成OD弧線,并將不同大小的OD出行量映射至不同顏色。代碼如下:

#可視化數(shù)據(jù)點(diǎn)分布
tbd.visualization_od(oddata,accuracy=2000,height=500)

結(jié)果如圖13所示:

07876774-3f35-11ed-9e49-dac502259ad0.gif▲ 圖13 OD分布的弧線可視化

對(duì)個(gè)體級(jí)的連續(xù)追蹤數(shù)據(jù),tbd.visualization_trip方法可以將數(shù)據(jù)點(diǎn)處理為帶有時(shí)間戳的軌跡信息并動(dòng)態(tài)地展示,代碼如下:

#動(dòng)態(tài)可視化軌跡

tbd.visualization_trip(data,col=['lon','lat','VehicleNum','time'],height=500)

結(jié)果圖14所示。點(diǎn)擊其中的播放鍵,可以看到出租車運(yùn)行的動(dòng)態(tài)軌跡效果。

0e230d0e-3f35-11ed-9e49-dac502259ad0.gif▲ 圖14出租車軌跡動(dòng)態(tài)可視化

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gps
    gps
    +關(guān)注

    關(guān)注

    22

    文章

    2879

    瀏覽量

    165911
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6795

    瀏覽量

    88730
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4219

    瀏覽量

    85565

原文標(biāo)題:酷炫,Python實(shí)現(xiàn)交通數(shù)據(jù)可視化!

文章出處:【微信號(hào):magedu-Linux,微信公眾號(hào):馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    機(jī)器學(xué)習(xí)為什么需要數(shù)據(jù)預(yù)處理

    數(shù)據(jù)預(yù)處理是準(zhǔn)備原始數(shù)據(jù)并使其適合機(jī)器學(xué)習(xí)模型的過(guò)程。這是創(chuàng)建機(jī)器學(xué)習(xí)模型的第一步也是關(guān)鍵的一步。 創(chuàng)建機(jī)器學(xué)習(xí)項(xiàng)目時(shí),我們并不總是遇到干凈且格式化的數(shù)據(jù)。在對(duì)
    的頭像 發(fā)表于 08-24 09:20 ?1767次閱讀
    機(jī)器學(xué)習(xí)為什么需要<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>預(yù)處理</b>

    請(qǐng)教大家一下關(guān)于數(shù)據(jù)預(yù)處理

    一般將獲得的加速度數(shù)據(jù)得進(jìn)行數(shù)據(jù)預(yù)處理,常見(jiàn)的預(yù)處理方法有去掉趨勢(shì)相、還得將離散的數(shù)值積分獲得振幅。請(qǐng)問(wèn)有做過(guò)的沒(méi),請(qǐng)教一下。
    發(fā)表于 06-07 11:16

    拿到數(shù)據(jù)后的數(shù)據(jù)理解和預(yù)處理工作

    深度解析數(shù)據(jù)挖掘數(shù)據(jù)理解和預(yù)處理
    發(fā)表于 04-19 16:51

    Python數(shù)據(jù)預(yù)處理方法

    機(jī)器學(xué)習(xí)-Python實(shí)踐Day3(特征工程--數(shù)據(jù)預(yù)處理2)
    發(fā)表于 06-03 15:55

    數(shù)據(jù)探索與數(shù)據(jù)預(yù)處理

    目錄1數(shù)據(jù)探索與數(shù)據(jù)預(yù)處理21.1 賽題回顧21.2 數(shù)據(jù)探索性分析與異常值處理21.3 相關(guān)性分析52特征工程82.1 光伏發(fā)電領(lǐng)域特征8
    發(fā)表于 07-12 08:37

    使用Bionconductor完成基因芯片預(yù)處理的流程

    的整體框架,自行學(xué)習(xí)其他廠商或種類(例如SNP芯片或CHIP-chip芯片)的芯片處理方法5.1快速入門例5-1 從數(shù)據(jù)包CLL載入芯片數(shù)據(jù),完成
    發(fā)表于 07-23 07:38

    數(shù)據(jù)預(yù)處理故障信息獲取

    數(shù)據(jù)預(yù)處理故障信息獲取1.目前,常用的故障診斷參數(shù)有電流、電壓、功率、轉(zhuǎn)矩、磁通、溫度、振動(dòng)等物理量。其中定子電流信號(hào)相對(duì)于其它參數(shù)受環(huán)境等外界影響最小,也因?yàn)殡娏鱾鞲衅靼惭b方便而最容易獲取,因此
    發(fā)表于 09-06 08:43

    C預(yù)處理與C語(yǔ)言基本數(shù)據(jù)類型

    嵌入式系統(tǒng)設(shè)計(jì)師學(xué)習(xí)筆記二十九:嵌入式程序設(shè)計(jì)④——C預(yù)處理預(yù)處理指令表:(編碼規(guī)范:GB/T 28169-2011)關(guān)于宏定義 #denfine 詳解可點(diǎn)擊連接查看博主的另一篇文章 預(yù)定義宏預(yù)處理
    發(fā)表于 12-21 08:29

    C語(yǔ)言的編譯預(yù)處理

    在將一個(gè)C源程序轉(zhuǎn)換為可執(zhí)行程序的過(guò)程, 編譯預(yù)處理是最初的步驟. 這一步驟是由預(yù)處理器(preprocessor)來(lái)完成的. 在源流程序被編譯器處理之前,
    發(fā)表于 09-20 18:17 ?47次下載

    Web使用挖掘數(shù)據(jù)預(yù)處理模塊、實(shí)現(xiàn)方法及發(fā)展前景

    數(shù)據(jù)預(yù)處理是Web使用挖掘的第一個(gè)環(huán)節(jié)。預(yù)處理的對(duì)象是Web 日志文件。由于Web 日志文件的格式是半結(jié)構(gòu)化的,且日志數(shù)據(jù)不夠完整,因此
    的頭像 發(fā)表于 11-06 09:32 ?3528次閱讀
    Web使用挖掘<b class='flag-5'>中</b>的<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>預(yù)處理</b>模塊、實(shí)現(xiàn)方法及發(fā)展前景

    什么是大數(shù)據(jù)采集和預(yù)處理

    一般情況下,大數(shù)據(jù)處理的流程為:數(shù)據(jù)采集和預(yù)處理、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析和數(shù)據(jù)可視化。
    的頭像 發(fā)表于 02-15 14:22 ?3818次閱讀

    PyTorch教程之數(shù)據(jù)預(yù)處理

    電子發(fā)燒友網(wǎng)站提供《PyTorch教程之數(shù)據(jù)預(yù)處理.pdf》資料免費(fèi)下載
    發(fā)表于 06-02 14:11 ?0次下載
    PyTorch教程之<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>預(yù)處理</b>

    圖像預(yù)處理方法研究

    圖像預(yù)處理的主要目的是消除圖像無(wú)關(guān)的信息,恢復(fù)有用的真實(shí)信息,增強(qiáng)有關(guān)信息的可檢測(cè)性、最大限度地簡(jiǎn)化數(shù)據(jù),從而改進(jìn)特征提取、圖像分割、匹配和識(shí)別的可靠性。一般的預(yù)處理流程為:1灰度化
    發(fā)表于 09-20 09:35 ?482次閱讀

    C語(yǔ)言有哪些預(yù)處理操作?

    C語(yǔ)言的預(yù)處理是在編譯之前對(duì)源代碼進(jìn)行處理的階段,它主要由預(yù)處理器完成。預(yù)處理器是一個(gè)獨(dú)立的程序,它負(fù)責(zé)對(duì)源代碼進(jìn)行一些文本替換和處理,生成
    的頭像 發(fā)表于 12-08 15:40 ?564次閱讀
    C語(yǔ)言有哪些<b class='flag-5'>預(yù)處理</b>操作?

    機(jī)器學(xué)習(xí)數(shù)據(jù)預(yù)處理與特征工程

    在機(jī)器學(xué)習(xí)的整個(gè)流程,數(shù)據(jù)預(yù)處理與特征工程是兩個(gè)至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量,進(jìn)而影響模型的訓(xùn)練效果和泛化能力。本文將從數(shù)據(jù)預(yù)處理
    的頭像 發(fā)表于 07-09 15:57 ?267次閱讀