如何用R處理進行數(shù)據(jù)清洗

R是進行運算、清洗、匯總及生成概率統(tǒng)計等數(shù)據(jù)處理的一個絕佳選擇。此外，由于它獨立于平臺、短期內不會消失，所以生成的程序可以在任何地方運行。并且，它具備非常棒的輔助資源。

本文摘錄自James D.Miller撰寫的《數(shù)據(jù)科學統(tǒng)計學》（Statistics for Data Science）一書，該書由Packt Publishing出版。

R是一種易上手的語言和環(huán)境，它本身很靈活且專注于統(tǒng)計計算，因此成為運算、清洗、匯總及生成概率統(tǒng)計等數(shù)據(jù)處理的一個絕佳選擇。

此外，以下是用R進行數(shù)據(jù)清洗的其他原因：

由于大量數(shù)據(jù)科學家都在使用R，所以它短時間內不會消失。

R獨立于平臺，因此可以在任意地方運行程序。

R有絕佳的輔助資源---Google一下，你就可以看到。

注：盡管作者將示例數(shù)據(jù)命名為“賭博數(shù)據(jù)”（Gamming Data），它只是用來演示代碼的賭博數(shù)據(jù)。

離群點

對離群點最簡單的解釋是：離群點是和其余數(shù)據(jù)不匹配的數(shù)據(jù)點。按照慣例，任何過高、過低或者異常（基于項目背景）的數(shù)據(jù)都是離群點。作為數(shù)據(jù)清洗的一部分，數(shù)據(jù)科學家通常要識別出離群點并用通用的方法解決它：

刪除離群點的值，甚至是離群點對應的實際變量。

轉換變量值或變量本身。

讓我們來看一下實際案例中如何用R識別并解決數(shù)據(jù)離群點。

老虎機在賭博界十分流行（老虎機的操作方法是把硬幣投入到機器中，并拉動把手來決定回報）。如今大部分老虎機都電子化了，編程使它們的所有活動都能被持續(xù)追蹤。在本文的案例中，賭場的投資者希望利用這些數(shù)據(jù)（以及各種補充數(shù)據(jù)）來調整盈利策略。換句話說，什么能讓老虎機賺更多錢？是機器的主題還是類型？新機器比舊機器或老式機器更有利可圖嗎？機器的位置會產(chǎn)生怎樣的影響？低面額的機器會賺更多錢嗎？我們嘗試用離群點來找到答案。

給定一個集合或賭博數(shù)據(jù)庫（格式為逗號分隔或CSV文本文件），其中包括的數(shù)據(jù)如老虎機的位置、錢的面額、月份、日、年、機器類型、機器的年齡、促銷、優(yōu)惠券、天氣和投幣量（投幣量是放入機器的錢幣總額減去支付的數(shù)額）。

作為一個數(shù)據(jù)科學家，第一步要對數(shù)據(jù)進行綜評（有時稱為概述），此時我們要確定是否存在異常值，第二步是解決這些離群點。

步驟一數(shù)據(jù)概述

R使這一步驟變得非常簡單。盡管可以通過很多方式編程求解，但我們要嘗試用最少的程序代碼或腳本來解決問題。將CSV文件定義為R的變量（命名為MyFile）并將文件讀入為數(shù)據(jù)框（命名為Mydata）：

MyFile《-“C:/GammingData/SlotsResults.csv” MyData《- read.csv（file=MyFile， header=TRUE， sep=“，”）

在統(tǒng)計學上，箱型圖是一種簡單的方式以得到統(tǒng)計數(shù)據(jù)集的分布、變異性和中心（或中位數(shù)）相關信息，所以我們將用箱型圖來研究我們能否識別出中位數(shù)Coin-in以及能否找到離群點。為了達成這些，我們可以讓R畫出文件中每個老虎機的Coin-in值，繪制箱型圖的函數(shù)如下：

boxplot（MyData［11］，main=‘GammingData Review’， ylab = “Coin-in”）

注：Coin-in是文件中的第11列，所以直接將它作為boxplot函數(shù)的參數(shù)。此外還添加了一個可選擇的參數(shù)（再次強調，本文已盡量保持代碼的簡潔度），以便在可視化圖中添加標題。

執(zhí)行前文的代碼可以得到下圖效果，包括中位數(shù)（中位數(shù)在箱型圖中是中間橫穿的線）以及四個離群點：

如何用R處理進行數(shù)據(jù)清洗

步驟2-處理離群點

現(xiàn)在我們發(fā)現(xiàn)數(shù)據(jù)中確實存在離群點，我們要解決這些點以保證它們不會對本研究產(chǎn)生負面影響。首先，我們知道Coin-in有負值是不合理的，因為機器輸出的錢幣一定不會比投入到機器中的硬幣多?；谶@個原則，我們可以從文件中刪除Coin-in為負值的記錄。此外，R可以幫助我們用subset生成一個新的數(shù)據(jù)框，新數(shù)據(jù)集中只有Coin-in中的非負值。

我們要將subset數(shù)據(jù)框命名為noNegs：

noNegs《- subset（MyData， MyData［11］》0）

接下來，我們要再一次畫圖以確定已經(jīng)刪除負值離群點：

boxplot（noNegs［11］，main=‘GammingData Review’， ylab = “Coin-in”）

這就產(chǎn)生了新的箱型圖，如下圖中所示：

如何用R處理進行數(shù)據(jù)清洗

我們可以用同樣的方法去除Coin-in中極端的正值（大于1500美元）得到另一個數(shù)據(jù)子集并再次畫圖：

noOutliers《-subset（noNegs， noNegs［11］《1500） boxplot（noOutliers［11］，main=‘GammingData Review’， ylab = “Coin-in”）

當你對數(shù)據(jù)進行不同的迭代后，建議你保存大部分版本的數(shù)據(jù)（如果不是最重要的）。你可以用write.csv這個R函數(shù)：

write.csv（noOutliers，file=“C:/GammingData/MyData_lessOutliers.csv”）

注：大部分數(shù)據(jù)科學家在整個項目中采取通用的命名規(guī)律。文件的名字應該盡可能清晰以便今后幫助你節(jié)省時間。此外，特別是在處理大量數(shù)據(jù)時，你需要注意內存空間的問題。

以上代碼的輸出結果如下：

如何用R處理進行數(shù)據(jù)清洗

領域知識

接下來，另一個數(shù)據(jù)清洗的技術是基于領域知識清理數(shù)據(jù)。這并不復雜，這種技術的關鍵是使用數(shù)據(jù)中無法察覺的信息。例如，當我們知道Coin-in不可能有負值時，我們排除了Coin-in負值的情況。另一個案例是颶風Sandy襲擊美國東北部的時間。在這段時間內，機器的Coin-in值都很低（非零）。數(shù)據(jù)科學家應該基于信息判斷是否要移除某段特定時期內的數(shù)據(jù)。

有效性檢查

交叉驗證是一種幫助數(shù)據(jù)科學家在數(shù)據(jù)庫中使用規(guī)則的技術。

注：有效性檢查是統(tǒng)計數(shù)據(jù)清洗中最普遍的形式，并且是數(shù)據(jù)開發(fā)者和數(shù)據(jù)科學家都非常熟悉的流程。

數(shù)據(jù)清洗時可以設定任意數(shù)量的有效性原則，這些原則要遵循數(shù)據(jù)科學家的意圖或目標。例如有如下原則：數(shù)據(jù)類型（例如，某個字段一定要是數(shù)值型），范圍限制（數(shù)據(jù)或日期要在一個特定范圍內），要求（某個字段不能為空或沒有值），唯一性（一個字段，或字段的結合，一定是數(shù)據(jù)庫中唯一的），組成員（這個值一定是列表中的值），外鍵（案例中一定要被定義的明確的值或滿足特殊規(guī)則），正則表達式模式（簡單地說就是這個值的格式滿足預設的格式），交叉字段驗證（案例中的字段組合要滿足特定標準）。

按照前文提到的內容，我們來看一些案例，從數(shù)據(jù)類型開始（也稱為強制原則）。R提供的六個強制函數(shù)如下：

as.numeric

as.integer

as.character

as.logical

as.factor

as.ordered

as.Date

這些函數(shù)，結合一些R的知識，使得在數(shù)據(jù)庫中轉換數(shù)據(jù)變得簡單。例如，以前文的賭博數(shù)據(jù)為例，我們可以生成新的賭博結果文件，其中年齡值被存為字符型（或文本值）。為清理它，我們需要將其轉化為數(shù)據(jù)型。我們可以運用以下R代碼完成快速轉化：

noOutliers［“Age”］《-as.numeric（noOutliers［“Age”］）

一個需要注意的地方：用這種簡單方法時，如果有數(shù)據(jù)不能轉化，需要將其設定為NA值。在類型轉換中，最大的工作是理解需要輸入什么數(shù)據(jù)以及哪些數(shù)據(jù)類型是合法的;R有很廣泛的數(shù)據(jù)類型，包括標量、向量（數(shù)值型，字符型，邏輯型），矩陣，數(shù)據(jù)框及列表。

數(shù)據(jù)清洗中我們要關注的另一個領域是正則表達式。在實踐中，特別是當處理的數(shù)據(jù)來源于很多渠道時，數(shù)據(jù)科學家確實面對如下問題：字段不是理想的格式（對于當下目標而言）或者字段值的格式不一致（可能會引發(fā)錯誤的結果）。例如日期、社會安全號碼（SSN）以及手機號碼?；跀?shù)據(jù)的來源，你不得不重新輸入（如前文描述），但是通常情況下，你需要基于目標將數(shù)據(jù)重新定義為可以使用的模式。

注：重新輸入數(shù)據(jù)是很重要的，這樣R就知道將值作為目前的數(shù)據(jù)并且你可以正確使用各種R數(shù)據(jù)函數(shù)。

一個常見的案例是當數(shù)據(jù)包括形式為YYYY/MM/DD的日期數(shù)據(jù)時，你想按每周匯總的形式呈現(xiàn)出時間序列分析，或者其他需要日期值的操作但是可能需要重新定義日期格式，或者你需要將其變?yōu)镽日期類型。所以，假定一個新的賭博文件——只有兩列數(shù)據(jù)：日期和投幣量，這個文件是一個老虎機每天的投幣量。

新的文件記錄如下截圖所示：

如何用R處理進行數(shù)據(jù)清洗

數(shù)據(jù)科學家可以用各種數(shù)據(jù)清洗的案例。從驗證每個數(shù)據(jù)點的數(shù)據(jù)類型入手，我們可以用R函數(shù)class來驗證文檔的數(shù)據(jù)類型。首先（如我們在前文案例中所作），讀入CSV文件存為數(shù)據(jù)框：

MyFile《-“C:/GammingData/SlotsByMachine.csv” MyData《- read.csv（file=MyFile， header=TRUE， sep=“，”）

隨后，我們可以使用class函數(shù)，如下圖截圖所示：

如何用R處理進行數(shù)據(jù)清洗

從上圖中可以看到用class來顯示數(shù)據(jù)類型。

MyData是用來保存賭博數(shù)據(jù)的數(shù)據(jù)框，日期Date是向量類型，投幣量Coinin是一個整數(shù)。所以，數(shù)據(jù)框和整數(shù)是有意義的，但是要注意R將日期設置為向量（factor）類型。向量是分類變量，在匯總統(tǒng)計、繪圖和回歸中非常有用，但它不是非常適用日期型。為了解決這個問題，我們可以使用R函數(shù)substr和paste，如下所示：

MyData$Date《-paste（substr（MyData$Date，6，7），substr（MyData$Date，9，10）， substr（MyData$Date，1，4），sep=“/”）

以上代碼重新定義了日期字段的格式。它將數(shù)據(jù)字段值分成三部分（月、日和年）然后按照理想的順序（/分隔符（sep））粘貼在一起，如下截圖所示：

如何用R處理進行數(shù)據(jù)清洗

我們發(fā)現(xiàn)這一行腳本將日期字段轉換為字符類型，最后我們可以用as.Date函數(shù)將值重設為日期（Date）類型：

如何用R處理進行數(shù)據(jù)清洗

稍微嘗試一下，就可以重新格式化來得到理想的字符串或字符數(shù)據(jù)點。

改善數(shù)據(jù)

通過改善進行數(shù)據(jù)清理是另一種常見的技術，添加相關信息、事實或數(shù)據(jù)使得數(shù)據(jù)變得完整（可能更有價值）。這些附加數(shù)據(jù)的來源可以是用數(shù)據(jù)中現(xiàn)有信息或從其他來源添加信息進行計算。數(shù)據(jù)科學家花費時間完善數(shù)據(jù)的原因有很多。

基于當前的目的或目標，數(shù)據(jù)科學家補充的信息可能用于參考、比較、對比或發(fā)現(xiàn)趨勢。

典型的用例包括：

衍生事實計算

對比日歷與財政年度的使用

轉換時區(qū)

貨幣轉換

添加當前和前期指標

計算價值，如每天總出貨量

保持緩慢變化的維度

注：作為數(shù)據(jù)科學家，你要經(jīng)常用腳本來改善數(shù)據(jù)，這個方法要比直接編輯數(shù)據(jù)文檔好得多，因為這樣出錯的可能性更低并且可以維持原始文件的完整性。此外，建立腳本可讓你將改善的過程重復應用于多個文件或收到的新版文件中，不需要重做同樣的工作。

回到我們的賭博數(shù)據(jù)中，假定我們在接收老虎機的投幣量文檔，同時公司在美國大陸外的地方設立賭場。這些新地點正在向我們發(fā)送文件，并且數(shù)據(jù)將納入到我們的統(tǒng)計分析中。我們發(fā)現(xiàn)這些國際文件是以當?shù)刎泿庞嬎愕耐稁帕俊榱苏_地對數(shù)據(jù)建模，我們要將數(shù)據(jù)轉化為美元。

場景如下：

文件來源：英國

使用貨幣：英鎊

將英鎊轉化為美元的公式十分簡單，只要用數(shù)額乘以匯率即可。所以，在R中：

MyData$Coinin《-MyData$Coinin* 1.4

以上代碼可以完成我們想要的轉換;然而，數(shù)據(jù)科學家要決定那種貨幣將被轉化（英鎊）以及匯率應當是多少。這并不是什么大問題，但是我們可以嘗試創(chuàng)建一個用戶定義的函數(shù)來確定要使用的匯率，如下所示：

getRate《- function（arg）{ if（arg==“GPB”） { myRate 《- 1.4 } if（arg==“CAD”） { myRate 《-1.34 } return（myRate） }

盡管之前的代碼更簡單，但以上代碼說明了創(chuàng)建邏輯的要點，以便我們今后可以重復使用：

如何用R處理進行數(shù)據(jù)清洗

最終，為了使整個過程更完美，我們要將函數(shù)儲存（在R文檔中）以便將來使用：

source（“C:/GammingData/CurerncyLogic.R”）

隨后：

MyFile《-“C:/GammingData/SlotsByMachine.csv” MyData《- read.csv（file=MyFile， header=TRUE， sep=“，”） MyData$Coin《- MyData$Coinin * getRate（“CAD”）

注：當然，在最理想的情況下，我們可改進函數(shù)以便在表或文件中根據(jù)國家代碼查找匯率，這樣匯率能夠隨即時價值而改變并且可以從程序中解耦數(shù)據(jù)。

數(shù)據(jù)調和

基于研究分析的整體目標，數(shù)據(jù)科學家可以通過數(shù)據(jù)調和來轉換、翻譯、或將數(shù)據(jù)值映射到其他理想值。最普遍的案例是性別或國家代碼。例如，如果你的文檔中將性別編碼為0和1或M和F，你想將數(shù)據(jù)轉化為一致的MALE或FEMALE。

關于國家代碼，數(shù)據(jù)科學家想要繪制地區(qū)的匯總：北美、南美和歐洲，而不是分開的美國、加拿大、墨西哥、巴西、智利、英國、法國和德國。在這種情況下，將產(chǎn)生合計值如下：

北美=美國+加拿大+墨西哥

南美=巴西+智利

歐洲=英國+法國+德國

需要強調的是，數(shù)據(jù)科學家可能會將所有包括性別的調查文檔合并在一起，稱為gender.txt，但是文檔中的性別編碼不同（1，0，M，F(xiàn)，Male和Female）。如果我們嘗試用R函數(shù)表，我們會看到如下可理解的結果：

如何用R處理進行數(shù)據(jù)清洗

如果在最理想的狀態(tài)下進行可視化分析：

lbs= c（“Male”， “Female”） pie（table（MyData），main=“Gambling by Gender”）

我們看到如下截圖：

如何用R處理進行數(shù)據(jù)清洗

為了解決性別數(shù)據(jù)編碼不一致的問題，我借用了前文案例中的概念并生成簡單的函數(shù)來幫助我們重新編碼：

setGender《- function（arg）{ if（substr（arg，1，1）==“0”| toupper（substr（arg，1，1））==“M”） { Gender 《- “MALE” } if（substr（arg，1，1）==“1”| toupper（substr（arg，1，1））==“F”） { Gender 《- “FEMALE” } return（Gender） }

此次，我加入了toupper函數(shù)，因此我們不必擔憂大小寫，并且有substr來控制長度大于一個字符的值。

注：假定參數(shù)的值是0，1，m，M，f，F(xiàn)，Male或Female，否則將會引發(fā)報錯。

由于R將性別作為向量類型，我發(fā)現(xiàn)很難應用簡單的函數(shù)，所以我決定生成新的R數(shù)據(jù)框來容納調和后的數(shù)據(jù)。并且用一個循環(huán)來讀入文檔中的記錄并將其轉化為Male 或Female：

MyFile《-“C:/GammingData/Gender.txt” MyData《- read.csv（file=MyFile， header=TRUE， sep=“，”） GenderData《-data.frame（nrow（MyData）） for（iin 2:nrow（MyData）） { x《-as.character（MyData［i，1］） GenderData［i，1］《-setGender（x） }

現(xiàn)在我們將通過以下語句得到更適合的可視化結果：

lbls= c（“Male”， “Female”） pie（table（GenderData），labels=lbls， main=“Gambling by Gender”）

以上代碼的輸出結果如下所示：

如何用R處理進行數(shù)據(jù)清洗

標準化

大多數(shù)主流數(shù)據(jù)科學家都已經(jīng)注意到在開始統(tǒng)計研究或分析項目之前，將數(shù)據(jù)標準化作為數(shù)據(jù)清理過程一部分的重要性。這是很重要的，如果沒有標準化，量綱不同的數(shù)據(jù)點對分析的貢獻會不均等。

如果你認為在0到100之間的數(shù)據(jù)點比0到1范圍內的變量影響更大，你可以理解數(shù)據(jù)標準化的重要性。使用這些未經(jīng)過標準化的變量，事實上在分析中賦予較大范圍的變量更多的權重。為了解決這一問題并均衡這些變量，數(shù)據(jù)科學家試圖將數(shù)據(jù)轉化為可比的量綱。

數(shù)據(jù)點的中心化是數(shù)據(jù)標準化中最常見的例子（盡管還有很多）。為了使數(shù)據(jù)點中心化，數(shù)據(jù)科學家把文件中的每個數(shù)據(jù)點減去所有數(shù)據(jù)的平均值。

R不是做運算，它提供了scale函數(shù)，其默認方法可以通過一行代碼將文件中的數(shù)值中心化或縮減。讓我們來看一個簡單的例子。

回到老虎機的案例中！在我們的賭博文件中，你可能還記得有一個字段叫投幣量（Coinin），它是一個表示投入到機器中美元總額的值，這被看作衡量機器盈利能力的指標。這似乎是我們盈利能力分析中使用的一個重要的數(shù)據(jù)點。然而這些金額可能是誤導性的，因為不同的機器有不同面額（換句話說，一些機器接受美分，而其他機器接受一角硬幣或美元）。也許機器面值的差別造成了不同的量綱，我們可以使用scale函數(shù)來解決這種情況。首先，我們在下面的截圖中看到，Coin.in的值：

如何用R處理進行數(shù)據(jù)清洗

我們可以通過以下語句對數(shù)據(jù)點Coin.in進行中心化處理：

scale（MyData［11］，center = TRUE， scale = TRUE）

center的值決定了如何行中心化。center為TRUE是需要對應的行減去Coin.in均值（省略NA）。scale的值決定了如何行縮放（在中心化之后）。如果scale的值是TRUE且center值是TRUE，那么縮放是通過除以（中心化后的）Coin.in的標準差來進行的。如果center值是False，將得到均方根值。

在下圖截屏中看到了差別：

如何用R處理進行數(shù)據(jù)清洗

閱讀全文

數(shù)據(jù)處理(28212) 數(shù)據(jù)處理(28212)
r語言(6170) r語言(6170)

AD7606能否實現(xiàn)使用DMA進行數(shù)據(jù)讀取？

因為AD7606它沒有內部寄存器，所以我想知道它能否實現(xiàn)使用DMA進行數(shù)據(jù)讀??？？

2023-12-08 08:22:59

DMA進行數(shù)據(jù)傳輸和CPU進行數(shù)據(jù)傳輸?shù)囊蓡?/a>

求大佬解答，本人正在學習STM32單片機中DMA直接數(shù)據(jù)存儲部分的內容看了DMA簡介后，也上手過實例代碼，但是沒有實際的項目經(jīng)驗，所以有以下疑問： DMA外設在進行數(shù)據(jù)傳輸?shù)牟僮?，是否也是需要?jīng)過

2023-05-25 17:18:32

DSP怎么在進行數(shù)據(jù)處理的同時進行串口通信

DM642的學習版中，怎么在進行數(shù)據(jù)處理的同時進行串口通信？求大神指導啊糾結了好長時間了

2014-02-24 15:42:30

HX711如何進行數(shù)據(jù)處理？

HX711如何進行數(shù)據(jù)處理？

2016-11-21 22:03:43

LabView可以進行數(shù)據(jù)的即時無損壓縮嗎？

LabView可以進行數(shù)據(jù)的即時無損壓縮嗎？

2015-04-24 10:57:24

MCCdaq進行數(shù)據(jù)采集遇到點問題

請問哪位大神用過MCCdaq進行數(shù)據(jù)采集，我現(xiàn)在遇到點問題，希望可以幫助一下

2015-05-27 08:38:44

PCBA的清洗工藝介紹

　　1、全自動化的在線式清洗機　　一種全自動化的在線式清洗機，該清洗機針對SMT/THT的PCBA焊接后表面殘留的松香助焊劑、水溶性助焊劑、免清洗性助焊劑/焊膏等有機、無機污染物進行徹底有效的清洗

2021-02-05 15:27:50

STM32 USART串口是如何進行數(shù)據(jù)處理的呢

STM32 USART串口接收數(shù)據(jù)的具體步驟有哪些？STM32 USART串口是如何進行數(shù)據(jù)處理的呢？

2021-11-25 08:56:51

TensorFlow object detect如何修改配置文件進行數(shù)據(jù)增強處理

TensorFlow object_detect 修改配置文件進行數(shù)據(jù)增強處理

2020-04-27 13:10:27

arduino可以對OV7670攝像頭進行數(shù)據(jù)采集和處理嗎？

arduino可以對OV7670攝像頭進行數(shù)據(jù)采集和處理嗎？

2017-08-07 09:23:08

fpga和DSP之間進行數(shù)據(jù)傳輸有幾種方案

進行高速數(shù)據(jù)傳輸有幾種方案我知道可以用雙口RAM 或者協(xié)議的方式但是不知道還有沒有其他的方式要求之間的通信速度要快相互之間進行數(shù)據(jù)的交換其實就是FPGA把數(shù)據(jù)交給DSP進行處理處理完了之后再有FPGA進行實時的圖像顯示而已

2012-08-06 10:56:57

labview實時處理數(shù)據(jù)出現(xiàn)的問題

我現(xiàn)在可以用labview將單片機采集的數(shù)據(jù)通過串口visa函數(shù)上傳在labview中，然后才可以進行數(shù)據(jù)處理，也就是發(fā)送完數(shù)據(jù)才可以進行數(shù)據(jù)處理，怎樣可以在發(fā)送數(shù)據(jù)的同時進行數(shù)據(jù)處理呢？請各位指教。

2014-09-11 15:05:38

labview調用dll進行數(shù)據(jù)采集

有一個非NI的數(shù)據(jù)采集卡，求哪位大神指導一下調用dll進行數(shù)據(jù)采集，謝謝拉。QQ：495916189

2017-03-01 19:22:34

mysql是根據(jù)哪些原則來進行數(shù)據(jù)類型選擇的？

mysql應該根據(jù)那些原則來進行數(shù)據(jù)類型的選擇！

2019-07-23 06:32:51

wearable的js工程怎么打印日志進行數(shù)據(jù)調試

創(chuàng)建wearable的js工程打印日志console.log的時候報錯怎么進行數(shù)據(jù)調試

2020-10-18 21:30:36

利用Python進行數(shù)據(jù)分析之時間序列基礎

《利用Python進行數(shù)據(jù)分析》 112時間序列基礎

2020-03-20 09:30:20

在labview中如何進行數(shù)據(jù)存儲？

在labview中如何進行數(shù)據(jù)存儲？

2013-07-26 09:19:08

如何用C++做一個TCP的服務器進行數(shù)據(jù)觀察及采集呢

如何用C++做一個TCP的服務器進行數(shù)據(jù)觀察及采集呢？有哪些設計步驟？

2021-12-23 09:41:34

如何用KeilAssistant工具對ADC采集的數(shù)據(jù)進行調試呢

如何使用STM32去開發(fā)一個測量系統(tǒng)呢？如何用KeilAssistant工具對ADC采集的數(shù)據(jù)進行調試呢？

2021-11-05 06:30:40

如何用Multisim10進行數(shù)據(jù)采集？如何用LabVIEW顯示單結晶體管伏安特性？

2021-04-09 06:13:03

如何用OpenMv進行圖像處理？

為什么使用串口？如何用OpenMv進行圖像處理？

2021-12-07 07:39:38

如何用STM32CUBEMX去配置USART串口進行數(shù)據(jù)的收發(fā)呢

如何用STM32CUBEMX去配置USART串口進行數(shù)據(jù)的收發(fā)呢？

2021-12-14 07:08:47

如何用labview和電腦聲卡進行數(shù)據(jù)采集

各位大大，感覺遇到了瓶頸啊……如何用電腦聲卡進行聲音數(shù)據(jù)的采集呢？求教TAT

2013-12-05 18:51:04

如何進行數(shù)字信號處理呢？有哪幾個基本步驟呢？

數(shù)字信號處理是如何定義的？如何進行數(shù)字信號處理呢？有哪幾個基本步驟呢？

2021-06-22 06:46:45

如何使用STM32與PC進行數(shù)據(jù)的相互發(fā)送、接收？

USART發(fā)送接收的基本方式是什么？如何使用STM32與PC進行數(shù)據(jù)的相互發(fā)送、接收？

2022-02-18 07:38:26

如何使用STM32與PC進行數(shù)據(jù)的相互發(fā)送接收？

2021-12-06 06:00:58

如何利用PIP對象進行數(shù)據(jù)通信？

本文在對各種通信方式進行簡要介紹的基礎上，對各種通信方式進行比較，并給出利用PIP對象進行數(shù)據(jù)通信的1個例子。

2021-05-27 06:00:07

如何利用Python進行數(shù)據(jù)分析

《利用Python進行數(shù)據(jù)分析》 122高階GroupBy應用

2020-04-23 07:29:16

如何通過TXD、RXD與上位機進行數(shù)據(jù)交換？

如何通過TXD、RXD與上位機進行數(shù)據(jù)交換？

2021-10-09 07:43:31

如何通過UART1進行數(shù)據(jù)發(fā)送？

2021-12-06 07:31:56

實現(xiàn) Labview 和SQL server進行數(shù)據(jù)的讀取和寫入

行數(shù)據(jù)不變。現(xiàn)在實現(xiàn)了 Labview 和SQL server進行數(shù)據(jù)的讀取和寫入，但怎樣選中某行，顏色變深，以及怎樣保存數(shù)據(jù)進入該行，有請高人指點，有案例更好，謝謝

2017-09-07 09:25:09

對AD7091r-8進行寄存器寫，讀回都正確，唯獨進行數(shù)據(jù)采集是沒有輸出是為什么？

對AD7091r-8進行寄存器寫，并讀回都正確，唯獨進行數(shù)據(jù)采集是沒有輸出，發(fā)出采集命令0x00XX后，sdo返回為0；對CHANNEL SEQUENCER進行寫操作后，也沒有輸出，讀CHANNEL SEQUENCER為寫入數(shù)據(jù)。實在不解？

2023-12-14 07:49:54

對高速電主軸振動進行數(shù)據(jù)的采集，但不知怎么對數(shù)據(jù)處理

我想對高速電主軸振動進行數(shù)據(jù)的采集，然后對他進行然后對數(shù)據(jù)進行數(shù)據(jù)的分析，請大神幫給這個程序加一個濾波然后在進行時域分析，頻譜分析，功率譜分析，做一個圖表能顯示其振動加速的大小的波形圖，求大神幫幫忙？相關源程序如下連接！http://pan.baidu.com/s/1eQ9tajK

2014-07-25 11:18:02

怎么使用CR2032進行數(shù)據(jù)記錄

你好，我與PIC18F67J94一起工作，使用熱敏電阻進行數(shù)據(jù)記錄，使用的電源是CR2032電池。我使用兩個發(fā)光二極管作為指示，并將數(shù)據(jù)存儲在控制器存儲器中。誰能告訴我cr2032電池在負溫下

2019-09-06 06:42:43

怎么用Labview進行數(shù)據(jù)采集

2015-05-21 16:32:20

怎么用串口進行數(shù)據(jù)采集

本帖最后由 sushu 于 2013-7-16 15:45 編輯怎么用串口進行數(shù)據(jù)采集PCB打樣找華強 http://www.hqpcb.com 樣板2天出貨

2013-07-15 13:35:28

怎么解決人工神經(jīng)網(wǎng)絡并行數(shù)據(jù)處理的問題

本文提出了一個基于FPGA 的信息處理的實例：一個簡單的人工神經(jīng)網(wǎng)絡應用Verilog 語言描述，該數(shù)據(jù)流采用模塊化的程序設計，并考慮了模塊間數(shù)據(jù)傳輸信號同步的問題，有效地解決了人工神經(jīng)網(wǎng)絡并行數(shù)據(jù)處理的問題。

2021-05-06 07:22:07

怎樣使用SPI的DMA模式進行數(shù)據(jù)的收發(fā)呢？

處理器是：STM32F407的想實現(xiàn)SPI+DMA進行數(shù)據(jù)收發(fā)，讀取ADC芯片；我看DMA配置文件中有SPI的配置，但是不知道怎么配置。

2023-03-29 15:41:56

怎樣使用STM32的串口進行數(shù)據(jù)的接收或者發(fā)送呢

STM32串口通信可分為哪幾類？怎樣使用STM32的串口進行數(shù)據(jù)的接收或者發(fā)送呢？

2021-12-06 07:09:52

怎樣在其他的數(shù)據(jù)幀發(fā)送完畢后進行數(shù)據(jù)的發(fā)送？

判斷線忙的主要方法有哪幾種？如何進行數(shù)據(jù)的總線判“忙”檢測？怎樣在其他的數(shù)據(jù)幀發(fā)送完畢后進行數(shù)據(jù)的發(fā)送？如何寫一個真的隨機數(shù)而不是偽隨機數(shù)呢？如何產(chǎn)生一個真正隨機的隨機種子呢？

2021-07-08 06:44:35

有關攝像頭采集數(shù)據(jù)進行分割處理

如何將攝像頭所采集的數(shù)據(jù)進行分割處理后，然后進行數(shù)據(jù)處理 找到圖片上需要找到的一點?。?！

2013-07-20 18:07:10

求大神！??！如何用labview讀取，處理數(shù)據(jù)進行線性擬合

小白一個，求大神告知?。。?b class="flag-6" style="color: red">數(shù)據(jù)都存在一個文件里，如何把它們讀進labview？如何用labview對這些數(shù)據(jù)進行線性擬合？

2017-05-06 15:33:51

求救！如何用PIC單片機實現(xiàn)GPRS模塊進行數(shù)據(jù)傳輸

如何用PIC單片機實現(xiàn)GPRS模塊進行數(shù)據(jù)傳輸，從網(wǎng)上了解到要通過AT指令，沒用過啊，請大俠指點，最好給個例子，謝謝！

2012-12-14 13:59:07

簡述主機與外設進行數(shù)據(jù)交換的幾種常用方式

在8086的微計算機系統(tǒng)中，存儲器是如何組織的？是如何與處理器總線連接的？BHE信號起什么作用？簡述主機與外設進行數(shù)據(jù)交換的幾種常用方式？

2021-09-27 06:49:01

設備與IoT中心之間進行數(shù)據(jù)交換的功能

本次示例程序將展示設備與IoT中心之間進行數(shù)據(jù)交換的功能。

2021-03-30 07:35:40

請問AD7606能否實現(xiàn)使用DMA進行數(shù)據(jù)讀??？

因為AD7606它沒有內部寄存器，所以我想知道它能否實現(xiàn)使用DMA進行數(shù)據(jù)讀??？？

2019-01-28 13:47:32

請問STM32超聲波定高返回的高度數(shù)據(jù)如何用PID算法處理？

STM32超聲波定高返回的高度數(shù)據(jù)如何用PID算法處理？STM32超聲波模塊定高返回的高度值如何用PID算法進行處理，然后輸出PWM信號？?

2020-08-03 04:10:06

請問下位機采集多通道數(shù)據(jù)怎么通過VISA串口上傳到labview進行數(shù)據(jù)處理？

請問我想用單片機stm32采集兩個通道的數(shù)據(jù)通過labview串口上傳，然后進行數(shù)據(jù)處理，比如說：波形顯示、保存數(shù)據(jù)，單通道的我會弄程序，但是多通道的就不知道怎么做了。VISA是不是只能接收一個通道的數(shù)據(jù)？

2018-07-28 11:33:42

請問在DSP和PRU進行數(shù)據(jù)交互時需要什么設置？

斷事件，DSP進中斷服務函數(shù)并讀取對應內存（0x01C30000）中的數(shù)據(jù)，發(fā)現(xiàn)數(shù)據(jù)并沒有翻倍，請問在DSP和PRU進行數(shù)據(jù)交互時需要什么設置，基本流程是什么？其中PRU中獲取數(shù)據(jù)的處理如下：LBCOr16

2019-09-29 11:27:17

風電機組異常數(shù)據(jù)識別與清洗

風電機組異常數(shù)據(jù)識別與清洗-baseline比賽類型：數(shù)據(jù)挖掘比賽數(shù)據(jù)：表格題（csv）學習方式：無監(jiān)督主辦方：國家電力投資集團有限公司科技與創(chuàng)新部比賽鏈接比賽任務：依據(jù)提供的8臺風力電機1年

2021-07-12 07:15:22

（R語言）風電機組運行數(shù)據(jù)分析精選資料分享

風電機組運行數(shù)據(jù)分析基于R語言，對德國某風電場7臺850kw的風電機組運行數(shù)據(jù)進行分析。約5萬條數(shù)據(jù)。部分數(shù)據(jù)：讀取數(shù)據(jù)：> datahead(data)PCTimeStamp11/1/132

2021-07-12 07:10:38

用MatLab進行數(shù)字信號處理

附錄B 用MatLab進行數(shù)字信號處理一、 Matlab簡介在科學研究和工程應用中，往往要進行大量的數(shù)學計算，這些運算一般來說難以用手工精確和快捷地進行，而要借助計算機編制

2009-05-10 10:03:25

如何用CAXA線切割進行數(shù)控加工自動編程

如何用CAXA線切割進行數(shù)控加工自動編程 CAXA線切割是一個面向線切割機床數(shù)控編程的軟件系統(tǒng)，在我國線切割加工領域有廣泛的

2009-10-18 18:44:14

14875

如何更好地進行數(shù)據(jù)采集

如何更好地進行數(shù)據(jù)采集工程師經(jīng)常需要進行數(shù)據(jù)采集來驗證產(chǎn)品的性能和指標，或者對一些特定的應用進行監(jiān)測和控制，以便確定其物理參數(shù)，例如溫度、應力、壓

2010-01-04 10:32:54

1587

什么是信號處理?如何進行數(shù)字信號處理呢？

什么是信號處理?如何進行數(shù)字信號處理呢？在我們的周圍存在著為數(shù)眾多的"信號"。如：從茫茫宇宙中的天體發(fā)出的微弱電波信號，移動電話發(fā)出

2010-03-06 10:13:51

3045

使用LabVIEW軟件進行數(shù)據(jù)采集和信號處理的10大理由

使用LabVIEW軟件進行數(shù)據(jù)采集和信號處理的10大理由，很直得一看哦。

2011-09-03 17:27:53

4786

如何清洗激光頭

如何清洗激光頭，本文講述了如何用超聲波清洗機來清洗激光頭

2012-05-07 14:42:54

15771

游客游跡RFID數(shù)據(jù)處理與清洗方法研究與實現(xiàn)

針對游客游跡跟蹤與追溯系統(tǒng)，本文深入分析了游客游跡不確定數(shù)據(jù)產(chǎn)生的原因，根據(jù)景區(qū)應用特點，提出了一種游客游跡RFID數(shù)據(jù)處理與清洗方法。在數(shù)據(jù)處理時，引入事件概念，設計

2013-07-25 17:52:31

企業(yè)數(shù)據(jù)中臺如何進行數(shù)據(jù)的清洗和處理？#數(shù)據(jù)中臺 #光點科技

數(shù)據(jù)

光點科技發(fā)布于 2023-11-30 09:28:53

Python在音頻（Audio）領域中，如何進行數(shù)據(jù)擴充呢？

經(jīng)典的深度學習網(wǎng)絡AlexNet使用數(shù)據(jù)擴充（Data Augmentation）的方式擴大數(shù)據(jù)集，取得較好的分類效果。在深度學習的圖像領域中，通過平移、翻轉、加噪等方法進行數(shù)據(jù)擴充。但是，在音頻（Audio）領域中，如何進行數(shù)據(jù)擴充呢？

2018-04-15 10:35:48

10069

為什么要進行數(shù)據(jù)清洗呢？

在實際項目中，當我們確定需求后就會去找相應的數(shù)據(jù)，拿到數(shù)據(jù)后，首先要對數(shù)據(jù)進行描述性統(tǒng)計分析，查看哪些數(shù)據(jù)是不合理的，也可以知道數(shù)據(jù)的基本情況。如果是銷售額數(shù)據(jù)可以通過分析不同商品的銷售總額、人均消費額、人均消費次數(shù)等，同一商品的不同時間的消費額、消費頻次等等，了解數(shù)據(jù)的基本情況。

2018-07-27 17:17:23

25886

數(shù)據(jù)庫教程之如何進行數(shù)據(jù)庫設計

本文檔的主要內容詳細介紹的是數(shù)據(jù)庫教程之如何進行數(shù)據(jù)庫設計內容包括了：1 數(shù)據(jù)庫設計概述，2 數(shù)據(jù)庫需求分析，3 數(shù)據(jù)庫結構設計，4 數(shù)據(jù)庫行為設計，5 數(shù)據(jù)庫實施，6數(shù)據(jù)庫的運行和維護

2018-10-19 10:41:00

數(shù)據(jù)清洗的步驟是什么

數(shù)據(jù)清洗是指重復。多余的數(shù)據(jù)篩選和清除，完整地補充丟失的數(shù)據(jù)，糾正或刪除錯誤的數(shù)據(jù)，最后整理成我們可以進一步處理和使用的數(shù)據(jù)。

2021-10-18 17:05:26

17886

三菱PLC如何用網(wǎng)關去進行數(shù)據(jù)采集

，遠程運行和維護，遠程PLC程序上下載，物通博聯(lián)推出的三菱PLC網(wǎng)關能夠很好的去和工業(yè)設備內置的PLC進行對接，那么三菱PLC如何用網(wǎng)關去進行數(shù)據(jù)采集的呢?

2022-01-17 16:18:49

1452

成功進行數(shù)據(jù)整合的案例

預置數(shù)十個開箱即用連接器，基于SDK和熱插拔的連接器擴展技術，快速啟動數(shù)據(jù)集成，然后利用低代碼、自動化數(shù)據(jù)處理管道方式進行數(shù)據(jù)建模。

2022-08-19 14:14:48

618

使用tf.data進行數(shù)據(jù)集處理

在進行AI模型訓練過程前，需要對數(shù)據(jù)集進行處理, Tensorflow提供了tf.data數(shù)據(jù)集處理模塊，通過該接口能夠輕松實現(xiàn)數(shù)據(jù)集預處理。tf.data支持對數(shù)據(jù)集進行大量處理，如圖片裁剪、圖片打亂、圖片分批次處理等操作。

2022-11-29 15:34:59

838