0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

面向工程師和科學家的大數(shù)據(jù)

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Dave Oswill ? 2022-10-06 07:52 ? 次閱讀

使用大數(shù)據(jù)正迅速成為科學發(fā)現(xiàn)和工程過程中的關(guān)鍵步驟。隨著智能傳感器物聯(lián)網(wǎng)IoT) 等技術(shù)能夠從科學儀器、制造系統(tǒng)、聯(lián)網(wǎng)汽車和飛機中收集大量詳細數(shù)據(jù),這種情況正在發(fā)生。

這些數(shù)據(jù)具有重要價值,因為它可以顯示重要的物理現(xiàn)象或提供有關(guān)系統(tǒng)運行環(huán)境、效率和健康狀況的信息。借助適當?shù)墓ぞ吆图夹g(shù),這些數(shù)據(jù)可用于進行快速的科學發(fā)現(xiàn),并在您的產(chǎn)品、服務(wù)和制造過程中開發(fā)和整合更多智能。這可以使您的公司以性能更好的產(chǎn)品或服務(wù)脫穎而出,并有助于符合法規(guī)要求(例如滿足發(fā)動機燃油效率標準或提供輔助駕駛能力)。

獲得訪問權(quán)和使用數(shù)據(jù)可能聽起來很有趣,但也很艱巨。由于這些數(shù)據(jù)的價值和大小,它通常在大型文件共享、數(shù)據(jù)庫或 Hadoop 或 Spark 等大數(shù)據(jù)系統(tǒng)中存儲和管理。不久前,為了將機器學習等先進技術(shù)應(yīng)用于大量數(shù)據(jù),具有 IT 系統(tǒng)經(jīng)驗的計算機科學家將與工程和科學專家一起工作。該團隊將共同支持一個工作流程,其中包括:

訪問文件、數(shù)據(jù)庫或 Hadoop 分布式文件系統(tǒng) (HDFS) 中的大數(shù)據(jù)

在專門的計算集群上探索、處理和分析這些數(shù)據(jù)

創(chuàng)建用于嵌入式系統(tǒng)、業(yè)務(wù)應(yīng)用程序和其他服務(wù)的算法

如今,MATLAB等軟件分析和建模工具已通過處理大數(shù)據(jù)的新功能得到增強。這使具有領(lǐng)域知識和經(jīng)驗的工程師和科學家能夠利用這些數(shù)據(jù)做出設(shè)計和業(yè)務(wù)決策。然后,工程師和科學家無論身在何處都可以方便地訪問這些數(shù)據(jù),并使用熟悉的語法和功能輕松使用它。

讓我們看一個工程師如何使用大數(shù)據(jù)的實際示例。貝克休斯的工程師為石油和天然氣運營商提供服務(wù)的供應(yīng)商,需要開發(fā)一種預(yù)測性維護系統(tǒng),以降低泵設(shè)備成本和石油和天然氣開采卡車的停機時間。如果活動現(xiàn)場的卡車出現(xiàn)泵故障,貝克休斯必須立即更換卡車以確保連續(xù)運行。向每個站點發(fā)送備用卡車會使公司損失數(shù)千萬美元的收入,如果它們在另一個站點積極使用,這些收入可能會在其他地方產(chǎn)生。無法準確預(yù)測閥門和泵何時需要維護是其他成本的基礎(chǔ)。過于頻繁的維護會浪費精力,并導(dǎo)致零件在仍然可用時被更換,而過于不頻繁的維護可能會損壞泵而無法修復(fù)。

從石油和天然氣開采卡車上收集了數(shù) TB 的數(shù)據(jù),這些數(shù)據(jù)用于開發(fā)一個應(yīng)用程序,該應(yīng)用程序可以預(yù)測設(shè)備何時需要維護或更換。MATLAB 為 Baker Hughes 的工程師提供了開發(fā)預(yù)測模型和將多種數(shù)據(jù)(包括來自專有文件格式的傳感器數(shù)據(jù))合并到一個分析應(yīng)用程序中所需的功能。

訪問大量數(shù)據(jù)

處理大數(shù)據(jù)的第一個挑戰(zhàn)是確定如何訪問大型數(shù)據(jù)集,因為它們有多種不同的形式并存儲在各種類型的系統(tǒng)中。

文件

許多大型工程和科學數(shù)據(jù)集由大量中小型文件組成,盡管文件變得越來越大,并且無法放入單臺計算機的內(nèi)存中。這些文件通常位于共享驅(qū)動器上的一個或多個目錄中,可能包含分隔文本、電子表格、圖像、視頻和各種專有格式。

數(shù)據(jù)庫

有多種數(shù)據(jù)庫類型可用于存儲和管理大量數(shù)據(jù):

關(guān)系型 (SQL):廣泛用于業(yè)務(wù)應(yīng)用程序,在 IT 開發(fā)人員中很受歡迎。

數(shù)據(jù)倉庫:基于關(guān)系 (SQL) 數(shù)據(jù)庫,存儲關(guān)鍵業(yè)務(wù)數(shù)據(jù),并為關(guān)鍵業(yè)務(wù)應(yīng)用程序提供分析能力和快速訪問。

NoSQL:針對不適合關(guān)系數(shù)據(jù)庫的數(shù)據(jù)進行了優(yōu)化。

數(shù)據(jù)歷史學家:針對通常從工業(yè)設(shè)備收集的基于時間的生產(chǎn)和過程數(shù)據(jù)進行了優(yōu)化。

物聯(lián)網(wǎng)數(shù)據(jù)聚合器:通常包括基于云的服務(wù),用于聚合來自連接的傳感器和設(shè)備的時間序列數(shù)據(jù)。這些服務(wù)通常通過 Web 服務(wù)調(diào)用來訪問。

Hadoop

Hadoop是一種基于分布式計算和存儲原理的大數(shù)據(jù)集存儲和處理系統(tǒng)。它由在計算服務(wù)器集群上共存的兩個主要子系統(tǒng)組成:

HDFS:一種大型、抗故障的文件系統(tǒng),稱為 Hadoop 分布式文件系統(tǒng)。

YARN:管理在 Hadoop 上運行的應(yīng)用程序,包括批處理框架,例如 MapReduce 和 Spark,以及 SQL 接口,例如 Hive 和 Impala。

為了有效地利用大數(shù)據(jù)的優(yōu)勢,工程師和科學家需要一個可擴展的工具,例如 MATLAB,以提供對用于存儲和管理數(shù)據(jù)的各種系統(tǒng)和格式的訪問。這在可能使用不止一種類型的系統(tǒng)和格式的情況下尤其重要。存儲在共享驅(qū)動器文件中的傳感器或圖像數(shù)據(jù)可能需要與存儲在數(shù)據(jù)庫中的元數(shù)據(jù)相結(jié)合;就貝克休斯而言,許多不同格式的數(shù)據(jù)必須一起使用,以了解系統(tǒng)的行為并開發(fā)預(yù)測模型。

處理大數(shù)據(jù)的能力正迅速成為科學發(fā)現(xiàn)和工程的一個重要方面。這些數(shù)據(jù)集中包含寶貴的數(shù)據(jù),提供了區(qū)分您的產(chǎn)品和服務(wù)的方法。作為科學家或工程師,您擁有使用這些數(shù)據(jù)做出設(shè)計和業(yè)務(wù)決策的領(lǐng)域知識和經(jīng)驗,但可能需要易于使用的軟件分析和建模工具。使用 MATLAB 等工具可提供可擴展性和效率,同時為您的公司提供在全球市場上的競爭優(yōu)勢。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2545

    文章

    50445

    瀏覽量

    751045
  • matlab
    +關(guān)注

    關(guān)注

    181

    文章

    2960

    瀏覽量

    230024
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8854

    瀏覽量

    137210
收藏 人收藏

    評論

    相關(guān)推薦

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    了傳統(tǒng)學科界限,使得科學家們能夠從更加全面和深入的角度理解生命的奧秘。同時,AI技術(shù)的引入也催生了一種全新的科學研究范式,即數(shù)據(jù)驅(qū)動的研究范式,這種范式強調(diào)從大量數(shù)據(jù)中提取有價值的信息
    發(fā)表于 10-14 09:21

    正是拼的年紀|65歲電子工程師上班VLOG #65歲退休 #電子工程師 #搞笑 #上班vlog

    電子工程師
    安泰小課堂
    發(fā)布于 :2024年07月25日 11:31:02

    新華社:突破性成果!祝賀我國科學家成功研發(fā)這一傳感器!

    6月25日,新華社以《突破性成果!祝賀我國科學家》為標題,報道了由我國科學家研發(fā)的傳感器成果。 我國科學家研發(fā)高通道神經(jīng)探針實現(xiàn)獼猴全腦尺度神經(jīng)活動監(jiān)測 神經(jīng)探針是一種用來記錄神經(jīng)活動的針狀電傳
    的頭像 發(fā)表于 06-27 18:03 ?397次閱讀
    新華社:突破性成果!祝賀我國<b class='flag-5'>科學家</b>成功研發(fā)這一傳感器!

    前OpenAI首席科學家創(chuàng)辦新的AI公司

    消息在業(yè)界引起了廣泛關(guān)注,因為蘇茨克維曾是OpenAI的聯(lián)合創(chuàng)始人及首席科學家,并在去年在OpenAI董事會上扮演了重要角色。
    的頭像 發(fā)表于 06-21 10:42 ?482次閱讀

    嵌入式軟件工程師和硬件工程師的區(qū)別?

    通常需要具備強大的問題解決能力,以及對新技術(shù)的學習和應(yīng)用能力。他們的工作通常涉及到多個領(lǐng)域,如計算機科學、電子工程、機械工程等。 嵌入式硬件工程師 嵌入式硬件
    發(fā)表于 05-16 11:00

    本源量子參與的國家重點研發(fā)計劃青年科學家項目啟動會順利召開

    2024年4月23日,國家重點研發(fā)計劃“先進計算與新興軟件”重點專項“面向復(fù)雜物理系統(tǒng)求解的量子科學計算算法、軟件、應(yīng)用與驗證”青年科學家項目啟動會暨實施方案論證會在合肥順利召開。該項目由合肥綜合性國家
    的頭像 發(fā)表于 05-11 08:22 ?514次閱讀
    本源量子參與的國家重點研發(fā)計劃青年<b class='flag-5'>科學家</b>項目啟動會順利召開

    大廠電子工程師常見面試題#電子工程師 #硬件工程師 #電路知識 #面試題

    電子工程師電路
    安泰小課堂
    發(fā)布于 :2024年04月30日 17:33:15

    谷歌DeepMind科學家欲建AI初創(chuàng)公司

    據(jù)知情人士透露,谷歌人工智能部門DeepMind的兩名杰出科學家Laurent Sifre和Karl Tuyls正在與投資者商討在巴黎成立一家新的人工智能初創(chuàng)公司的事宜。
    的頭像 發(fā)表于 01-22 14:41 ?441次閱讀

    飛騰首席科學家竇強榮獲 “國家卓越工程師” 稱號

    ? ? ?飛騰首席科學家竇強榮獲 “國家卓越工程師” 稱號 1月19日上午,首屆 “國家工程師獎” 表彰大會在北京人民大會堂隆重舉行。81 名個人被授予 “國家卓越工程師” 稱號,50
    的頭像 發(fā)表于 01-19 19:22 ?1597次閱讀
    飛騰首席<b class='flag-5'>科學家</b>竇強榮獲 “國家卓越<b class='flag-5'>工程師</b>” 稱號

    釋放積極信號!“國家工程師獎”首次開評

    近期,國家卓越工程師及卓越工程師團隊擬定表彰名單頒布,共包含83位獲選為國家卓越工程師、50家團隊榮獲國家卓越工程師團隊稱號。從本年度起,首次設(shè)立“國家
    的頭像 發(fā)表于 12-11 11:02 ?628次閱讀