大數(shù)據(jù)的核心有哪些？

大數(shù)據(jù)技術(shù)的體系龐大且復(fù)雜，基礎(chǔ)的技術(shù)包含數(shù)據(jù)的采集、數(shù)據(jù)預(yù)處理、分布式存儲(chǔ)、NoSQL數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、機(jī)器學(xué)習(xí)、并行計(jì)算、可視化等各種技術(shù)范疇和不同的技術(shù)層面。首先給出一個(gè)通用化的大數(shù)據(jù)處理框架，主要分為下面幾個(gè)方面：數(shù)據(jù)采集與預(yù)處理、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)清洗、數(shù)據(jù)查詢分析和數(shù)據(jù)可視化。

一、數(shù)據(jù)采集與預(yù)處理

對(duì)于各種來(lái)源的數(shù)據(jù)，包括移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)、社交網(wǎng)絡(luò)的數(shù)據(jù)等，這些結(jié)構(gòu)化和非結(jié)構(gòu)化的海量數(shù)據(jù)是零散的，也就是所謂的數(shù)據(jù)孤島，此時(shí)的這些數(shù)據(jù)并沒(méi)有什么意義，數(shù)據(jù)采集就是將這些數(shù)據(jù)寫入數(shù)據(jù)倉(cāng)庫(kù)中，把零散的數(shù)據(jù)整合在一起，對(duì)這些數(shù)據(jù)綜合起來(lái)進(jìn)行分析。數(shù)據(jù)采集包括文件日志的采集、數(shù)據(jù)庫(kù)日志的采集、關(guān)系型數(shù)據(jù)庫(kù)的接入和應(yīng)用程序的接入等。在數(shù)據(jù)量比較小的時(shí)候，可以寫個(gè)定時(shí)的腳本將日志寫入存儲(chǔ)系統(tǒng)，但隨著數(shù)據(jù)量的增長(zhǎng)，這些方法無(wú)法提供數(shù)據(jù)安全保障，并且運(yùn)維困難，需要更強(qiáng)壯的解決方案。

Flume NG作為實(shí)時(shí)日志收集系統(tǒng)，支持在日志系統(tǒng)中定制各類數(shù)據(jù)發(fā)送方，用于收集數(shù)據(jù)，同時(shí)，對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單處理，并寫到各種數(shù)據(jù)接收方(比如文本，HDFS，Hbase等)。Flume NG采用的是三層架構(gòu)：Agent層，Collector層和Store層，每一層均可水平拓展。其中Agent包含Source，Channel和 Sink，source用來(lái)消費(fèi)(收集)數(shù)據(jù)源到channel組件中，channel作為中間臨時(shí)存儲(chǔ)，保存所有source的組件信息，sink從channel中讀取數(shù)據(jù)，讀取成功之后會(huì)刪除channel中的信息。

NDC，Netease Data Canal，直譯為網(wǎng)易數(shù)據(jù)運(yùn)河系統(tǒng)，是網(wǎng)易針對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)的數(shù)據(jù)實(shí)時(shí)遷移、同步和訂閱的平臺(tái)化解決方案。它整合了網(wǎng)易過(guò)去在數(shù)據(jù)傳輸領(lǐng)域的各種工具和經(jīng)驗(yàn)，將單機(jī)數(shù)據(jù)庫(kù)、分布式數(shù)據(jù)庫(kù)、OLAP系統(tǒng)以及下游應(yīng)用通過(guò)數(shù)據(jù)鏈路串在一起。除了保障高效的數(shù)據(jù)傳輸外，NDC的設(shè)計(jì)遵循了單元化和平臺(tái)化的設(shè)計(jì)哲學(xué)。

Logstash是開(kāi)源的服務(wù)器端數(shù)據(jù)處理管道，能夠同時(shí)從多個(gè)來(lái)源采集數(shù)據(jù)、轉(zhuǎn)換數(shù)據(jù)，然后將數(shù)據(jù)發(fā)送到您最喜歡的 “存儲(chǔ)庫(kù)” 中。一般常用的存儲(chǔ)庫(kù)是Elasticsearch。Logstash 支持各種輸入選擇，可以在同一時(shí)間從眾多常用的數(shù)據(jù)來(lái)源捕捉事件，能夠以連續(xù)的流式傳輸方式，輕松地從您的日志、指標(biāo)、Web 應(yīng)用、數(shù)據(jù)存儲(chǔ)以及各種 AWS 服務(wù)采集數(shù)據(jù)。

Sqoop，用來(lái)將關(guān)系型數(shù)據(jù)庫(kù)和Hadoop中的數(shù)據(jù)進(jìn)行相互轉(zhuǎn)移的工具，可以將一個(gè)關(guān)系型數(shù)據(jù)庫(kù)(例如Mysql、Oracle)中的數(shù)據(jù)導(dǎo)入到Hadoop(例如HDFS、Hive、Hbase)中，也可以將Hadoop(例如HDFS、Hive、Hbase)中的數(shù)據(jù)導(dǎo)入到關(guān)系型數(shù)據(jù)庫(kù)(例如Mysql、Oracle)中。Sqoop 啟用了一個(gè) MapReduce 作業(yè)(極其容錯(cuò)的分布式并行計(jì)算)來(lái)執(zhí)行任務(wù)。Sqoop 的另一大優(yōu)勢(shì)是其傳輸大量結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)的過(guò)程是完全自動(dòng)化的。

流式計(jì)算是行業(yè)研究的一個(gè)熱點(diǎn)，流式計(jì)算對(duì)多個(gè)高吞吐量的數(shù)據(jù)源進(jìn)行實(shí)時(shí)的清洗、聚合和分析，可以對(duì)存在于社交網(wǎng)站、新聞等的數(shù)據(jù)信息流進(jìn)行快速的處理并反饋，目前大數(shù)據(jù)流分析工具有很多，比如開(kāi)源的strom，spark streaming等。

Strom集群結(jié)構(gòu)是有一個(gè)主節(jié)點(diǎn)(nimbus)和多個(gè)工作節(jié)點(diǎn)(supervisor)組成的主從結(jié)構(gòu)，主節(jié)點(diǎn)通過(guò)配置靜態(tài)指定或者在運(yùn)行時(shí)動(dòng)態(tài)選舉，nimbus與supervisor都是Storm提供的后臺(tái)守護(hù)進(jìn)程，之間的通信是結(jié)合Zookeeper的狀態(tài)變更通知和監(jiān)控通知來(lái)處理。nimbus進(jìn)程的主要職責(zé)是管理、協(xié)調(diào)和監(jiān)控集群上運(yùn)行的topology(包括topology的發(fā)布、任務(wù)指派、事件處理時(shí)重新指派任務(wù)等)。supervisor進(jìn)程等待nimbus分配任務(wù)后生成并監(jiān)控worker(jvm進(jìn)程)執(zhí)行任務(wù)。supervisor與worker運(yùn)行在不同的jvm上，如果由supervisor啟動(dòng)的某個(gè)worker因?yàn)殄e(cuò)誤異常退出(或被kill掉)，supervisor會(huì)嘗試重新生成新的worker進(jìn)程。

當(dāng)使用上游模塊的數(shù)據(jù)進(jìn)行計(jì)算、統(tǒng)計(jì)、分析時(shí)，就可以使用消息系統(tǒng)，尤其是分布式消息系統(tǒng)。Kafka使用Scala進(jìn)行編寫，是一種分布式的、基于發(fā)布/訂閱的消息系統(tǒng)。Kafka的設(shè)計(jì)理念之一就是同時(shí)提供離線處理和實(shí)時(shí)處理,以及將數(shù)據(jù)實(shí)時(shí)備份到另一個(gè)數(shù)據(jù)中心，Kafka可以有許多的生產(chǎn)者和消費(fèi)者分享多個(gè)主題，將消息以topic為單位進(jìn)行歸納;Kafka發(fā)布消息的程序稱為producer，也叫生產(chǎn)者，預(yù)訂topics并消費(fèi)消息的程序稱為consumer，也叫消費(fèi)者;當(dāng)Kafka以集群的方式運(yùn)行時(shí)，可以由一個(gè)服務(wù)或者多個(gè)服務(wù)組成，每個(gè)服務(wù)叫做一個(gè)broker，運(yùn)行過(guò)程中producer通過(guò)網(wǎng)絡(luò)將消息發(fā)送到Kafka集群，集群向消費(fèi)者提供消息。Kafka通過(guò)Zookeeper管理集群配置，選舉leader，以及在Consumer Group發(fā)生變化時(shí)進(jìn)行rebalance。Producer使用push模式將消息發(fā)布到broker，Consumer使用pull模式從broker訂閱并消費(fèi)消息。Kafka可以和Flume一起工作，如果需要將流式數(shù)據(jù)從Kafka轉(zhuǎn)移到hadoop，可以使用Flume代理agent，將Kafka當(dāng)做一個(gè)來(lái)源source，這樣可以從Kafka讀取數(shù)據(jù)到Hadoop。

Zookeeper是一個(gè)分布式的，開(kāi)放源碼的分布式應(yīng)用程序協(xié)調(diào)服務(wù)，提供數(shù)據(jù)同步服務(wù)。它的作用主要有配置管理、名字服務(wù)、分布式鎖和集群管理。配置管理指的是在一個(gè)地方修改了配置，那么對(duì)這個(gè)地方的配置感興趣的所有的都可以獲得變更，省去了手動(dòng)拷貝配置的繁瑣，還很好的保證了數(shù)據(jù)的可靠和一致性，同時(shí)它可以通過(guò)名字來(lái)獲取資源或者服務(wù)的地址等信息，可以監(jiān)控集群中機(jī)器的變化，實(shí)現(xiàn)了類似于心跳機(jī)制的功能。

二、數(shù)據(jù)存儲(chǔ)

Hadoop作為一個(gè)開(kāi)源的框架，專為離線和大規(guī)模數(shù)據(jù)分析而設(shè)計(jì)，HDFS作為其核心的存儲(chǔ)引擎，已被廣泛用于數(shù)據(jù)存儲(chǔ)。

HBase，是一個(gè)分布式的、面向列的開(kāi)源數(shù)據(jù)庫(kù)，可以認(rèn)為是hdfs的封裝，本質(zhì)是數(shù)據(jù)存儲(chǔ)、NoSQL數(shù)據(jù)庫(kù)。HBase是一種Key/Value系統(tǒng)，部署在hdfs上，克服了hdfs在隨機(jī)讀寫這個(gè)方面的缺點(diǎn)，與hadoop一樣，Hbase目標(biāo)主要依靠橫向擴(kuò)展，通過(guò)不斷增加廉價(jià)的商用服務(wù)器，來(lái)增加計(jì)算和存儲(chǔ)能力。

Phoenix，相當(dāng)于一個(gè)Java中間件，幫助開(kāi)發(fā)工程師能夠像使用JDBC訪問(wèn)關(guān)系型數(shù)據(jù)庫(kù)一樣訪問(wèn)NoSQL數(shù)據(jù)庫(kù)HBase。

Yarn是一種Hadoop資源管理器，可為上層應(yīng)用提供統(tǒng)一的資源管理和調(diào)度，它的引入為集群在利用率、資源統(tǒng)一管理和數(shù)據(jù)共享等方面帶來(lái)了巨大好處。Yarn由下面的幾大組件構(gòu)成：一個(gè)全局的資源管理器ResourceManager、ResourceManager的每個(gè)節(jié)點(diǎn)代理NodeManager、表示每個(gè)應(yīng)用的Application以及每一個(gè)ApplicationMaster擁有多個(gè)Container在NodeManager上運(yùn)行。

Mesos是一款開(kāi)源的集群管理軟件，支持Hadoop、ElasticSearch、Spark、Storm 和Kafka等應(yīng)用架構(gòu)。

Redis是一種速度非常快的非關(guān)系數(shù)據(jù)庫(kù)，可以存儲(chǔ)鍵與5種不同類型的值之間的映射，可以將存儲(chǔ)在內(nèi)存的鍵值對(duì)數(shù)據(jù)持久化到硬盤中，使用復(fù)制特性來(lái)擴(kuò)展性能，還可以使用客戶端分片來(lái)擴(kuò)展寫性能。

Atlas是一個(gè)位于應(yīng)用程序與MySQL之間的中間件。在后端DB看來(lái)，Atlas相當(dāng)于連接它的客戶端，在前端應(yīng)用看來(lái)，Atlas相當(dāng)于一個(gè)DB。Atlas作為服務(wù)端與應(yīng)用程序通訊，它實(shí)現(xiàn)了MySQL的客戶端和服務(wù)端協(xié)議，同時(shí)作為客戶端與MySQL通訊。它對(duì)應(yīng)用程序屏蔽了DB的細(xì)節(jié)，同時(shí)為了降低MySQL負(fù)擔(dān)，它還維護(hù)了連接池。Atlas啟動(dòng)后會(huì)創(chuàng)建多個(gè)線程，其中一個(gè)為主線程，其余為工作線程。主線程負(fù)責(zé)監(jiān)聽(tīng)所有的客戶端連接請(qǐng)求，工作線程只監(jiān)聽(tīng)主線程的命令請(qǐng)求。

Kudu是圍繞Hadoop生態(tài)圈建立的存儲(chǔ)引擎，Kudu擁有和Hadoop生態(tài)圈共同的設(shè)計(jì)理念，它運(yùn)行在普通的服務(wù)器上、可分布式規(guī)?；渴稹⒉⑶覞M足工業(yè)界的高可用要求。其設(shè)計(jì)理念為fast analytics on fast data。作為一個(gè)開(kāi)源的存儲(chǔ)引擎，可以同時(shí)提供低延遲的隨機(jī)讀寫和高效的數(shù)據(jù)分析能力。Kudu不但提供了行級(jí)的插入、更新、刪除API，同時(shí)也提供了接近Parquet性能的批量掃描操作。使用同一份存儲(chǔ)，既可以進(jìn)行隨機(jī)讀寫，也可以滿足數(shù)據(jù)分析的要求。Kudu的應(yīng)用場(chǎng)景很廣泛，比如可以進(jìn)行實(shí)時(shí)的數(shù)據(jù)分析，用于數(shù)據(jù)可能會(huì)存在變化的時(shí)序數(shù)據(jù)應(yīng)用等。

在數(shù)據(jù)存儲(chǔ)過(guò)程中，涉及到的數(shù)據(jù)表都是成千上百列，包含各種復(fù)雜的Query，推薦使用列式存儲(chǔ)方法，比如parquent,ORC等對(duì)數(shù)據(jù)進(jìn)行壓縮。Parquet 可以支持靈活的壓縮選項(xiàng)，顯著減少磁盤上的存儲(chǔ)。

三、數(shù)據(jù)清洗

MapReduce作為Hadoop的查詢引擎，用于大規(guī)模數(shù)據(jù)集的并行計(jì)算，”Map(映射)”和”Reduce(歸約)”，是它的主要思想。它極大的方便了編程人員在不會(huì)分布式并行編程的情況下，將自己的程序運(yùn)行在分布式系統(tǒng)中。

隨著業(yè)務(wù)數(shù)據(jù)量的增多，需要進(jìn)行訓(xùn)練和清洗的數(shù)據(jù)會(huì)變得越來(lái)越復(fù)雜，這個(gè)時(shí)候就需要任務(wù)調(diào)度系統(tǒng)，比如oozie或者azkaban，對(duì)關(guān)鍵任務(wù)進(jìn)行調(diào)度和監(jiān)控。

Oozie是用于Hadoop平臺(tái)的一種工作流調(diào)度引擎，提供了RESTful API接口來(lái)接受用戶的提交請(qǐng)求(提交工作流作業(yè))，當(dāng)提交了workflow后，由工作流引擎負(fù)責(zé)workflow的執(zhí)行以及狀態(tài)的轉(zhuǎn)換。用戶在HDFS上部署好作業(yè)(MR作業(yè))，然后向Oozie提交Workflow，Oozie以異步方式將作業(yè)(MR作業(yè))提交給Hadoop。這也是為什么當(dāng)調(diào)用Oozie 的RESTful接口提交作業(yè)之后能立即返回一個(gè)JobId的原因，用戶程序不必等待作業(yè)執(zhí)行完成(因?yàn)橛行┐笞鳂I(yè)可能會(huì)執(zhí)行很久(幾個(gè)小時(shí)甚至幾天))。Oozie在后臺(tái)以異步方式，再將workflow對(duì)應(yīng)的Action提交給hadoop執(zhí)行。

Azkaban也是一種工作流的控制引擎，可以用來(lái)解決有多個(gè)hadoop或者spark等離線計(jì)算任務(wù)之間的依賴關(guān)系問(wèn)題。azkaban主要是由三部分構(gòu)成：Relational Database，Azkaban Web Server和Azkaban Executor Server。azkaban將大多數(shù)的狀態(tài)信息都保存在MySQL中，Azkaban Web Server提供了Web UI，是azkaban主要的管理者，包括project的管理、認(rèn)證、調(diào)度以及對(duì)工作流執(zhí)行過(guò)程中的監(jiān)控等;Azkaban Executor Server用來(lái)調(diào)度工作流和任務(wù)，記錄工作流或者任務(wù)的日志。

流計(jì)算任務(wù)的處理平臺(tái)Sloth，是網(wǎng)易首個(gè)自研流計(jì)算平臺(tái)，旨在解決公司內(nèi)各產(chǎn)品日益增長(zhǎng)的流計(jì)算需求。作為一個(gè)計(jì)算服務(wù)平臺(tái)，其特點(diǎn)是易用、實(shí)時(shí)、可靠，為用戶節(jié)省技術(shù)方面(開(kāi)發(fā)、運(yùn)維)的投入，幫助用戶專注于解決產(chǎn)品本身的流計(jì)算需求。

四、數(shù)據(jù)查詢分析

Hive的核心工作就是把SQL語(yǔ)句翻譯成MR程序，可以將結(jié)構(gòu)化的數(shù)據(jù)映射為一張數(shù)據(jù)庫(kù)表，并提供 HQL(Hive SQL)查詢功能。Hive本身不存儲(chǔ)和計(jì)算數(shù)據(jù)，它完全依賴于HDFS和MapReduce?？梢詫ive理解為一個(gè)客戶端工具，將SQL操作轉(zhuǎn)換為相應(yīng)的MapReduce jobs，然后在hadoop上面運(yùn)行。Hive支持標(biāo)準(zhǔn)的SQL語(yǔ)法，免去了用戶編寫MapReduce程序的過(guò)程，它的出現(xiàn)可以讓那些精通SQL技能、但是不熟悉MapReduce 、編程能力較弱與不擅長(zhǎng)Java語(yǔ)言的用戶能夠在HDFS大規(guī)模數(shù)據(jù)集上很方便地利用SQL 語(yǔ)言查詢、匯總、分析數(shù)據(jù)。

Hive是為大數(shù)據(jù)批量處理而生的，Hive的出現(xiàn)解決了傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)(MySql、Oracle)在大數(shù)據(jù)處理上的瓶頸。Hive 將執(zhí)行計(jì)劃分成map->shuffle->reduce->map->shuffle->reduce…的模型。如果一個(gè)Query會(huì)被編譯成多輪MapReduce，則會(huì)有更多的寫中間結(jié)果。由于MapReduce執(zhí)行框架本身的特點(diǎn)，過(guò)多的中間過(guò)程會(huì)增加整個(gè)Query的執(zhí)行時(shí)間。在Hive的運(yùn)行過(guò)程中，用戶只需要?jiǎng)?chuàng)建表，導(dǎo)入數(shù)據(jù)，編寫SQL分析語(yǔ)句即可。剩下的過(guò)程由Hive框架自動(dòng)的完成。

Impala是對(duì)Hive的一個(gè)補(bǔ)充，可以實(shí)現(xiàn)高效的SQL查詢。使用Impala來(lái)實(shí)現(xiàn)SQL on Hadoop，用來(lái)進(jìn)行大數(shù)據(jù)實(shí)時(shí)查詢分析。通過(guò)熟悉的傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的SQL風(fēng)格來(lái)操作大數(shù)據(jù)，同時(shí)數(shù)據(jù)也是可以存儲(chǔ)到HDFS和HBase中的。Impala沒(méi)有再使用緩慢的Hive+MapReduce批處理，而是通過(guò)使用與商用并行關(guān)系數(shù)據(jù)庫(kù)中類似的分布式查詢引擎(由Query Planner、Query Coordinator和Query Exec Engine三部分組成)，可以直接從HDFS或HBase中用SELECT、JOIN和統(tǒng)計(jì)函數(shù)查詢數(shù)據(jù)，從而大大降低了延遲。Impala將整個(gè)查詢分成一執(zhí)行計(jì)劃樹(shù)，而不是一連串的MapReduce任務(wù)，相比Hive沒(méi)了MapReduce啟動(dòng)時(shí)間。

Hive 適合于長(zhǎng)時(shí)間的批處理查詢分析，而Impala適合于實(shí)時(shí)交互式SQL查詢，Impala給數(shù)據(jù)人員提供了快速實(shí)驗(yàn)，驗(yàn)證想法的大數(shù)據(jù)分析工具，可以先使用Hive進(jìn)行數(shù)據(jù)轉(zhuǎn)換處理，之后使用Impala在Hive處理好后的數(shù)據(jù)集上進(jìn)行快速的數(shù)據(jù)分析?？偟膩?lái)說(shuō)：Impala把執(zhí)行計(jì)劃表現(xiàn)為一棵完整的執(zhí)行計(jì)劃樹(shù)，可以更自然地分發(fā)執(zhí)行計(jì)劃到各個(gè)Impalad執(zhí)行查詢，而不用像Hive那樣把它組合成管道型的map->reduce模式，以此保證Impala有更好的并發(fā)性和避免不必要的中間sort與shuffle。但是Impala不支持UDF，能處理的問(wèn)題有一定的限制。

Spark擁有Hadoop MapReduce所具有的特點(diǎn)，它將Job中間輸出結(jié)果保存在內(nèi)存中，從而不需要讀取HDFS。Spark 啟用了內(nèi)存分布數(shù)據(jù)集，除了能夠提供交互式查詢外，它還可以優(yōu)化迭代工作負(fù)載。Spark 是在 Scala 語(yǔ)言中實(shí)現(xiàn)的，它將 Scala 用作其應(yīng)用程序框架。與 Hadoop 不同，Spark 和 Scala 能夠緊密集成，其中的 Scala 可以像操作本地集合對(duì)象一樣輕松地操作分布式數(shù)據(jù)集。

Nutch 是一個(gè)開(kāi)源Java 實(shí)現(xiàn)的搜索引擎。它提供了我們運(yùn)行自己的搜索引擎所需的全部工具，包括全文搜索和Web爬蟲(chóng)。

Solr用Java編寫、運(yùn)行在Servlet容器(如Apache Tomcat或Jetty)的一個(gè)獨(dú)立的企業(yè)級(jí)搜索應(yīng)用的全文搜索服務(wù)器。它對(duì)外提供類似于Web-service的API接口，用戶可以通過(guò)http請(qǐng)求，向搜索引擎服務(wù)器提交一定格式的XML文件，生成索引;也可以通過(guò)Http Get操作提出查找請(qǐng)求，并得到XML格式的返回結(jié)果。

Elasticsearch是一個(gè)開(kāi)源的全文搜索引擎，基于Lucene的搜索服務(wù)器，可以快速的儲(chǔ)存、搜索和分析海量的數(shù)據(jù)。設(shè)計(jì)用于云計(jì)算中，能夠達(dá)到實(shí)時(shí)搜索，穩(wěn)定，可靠，快速，安裝使用方便。

還涉及到一些機(jī)器學(xué)習(xí)語(yǔ)言，比如，Mahout主要目標(biāo)是創(chuàng)建一些可伸縮的機(jī)器學(xué)習(xí)算法，供開(kāi)發(fā)人員在Apache的許可下免費(fèi)使用;深度學(xué)習(xí)框架Caffe以及使用數(shù)據(jù)流圖進(jìn)行數(shù)值計(jì)算的開(kāi)源軟件庫(kù)TensorFlow等，常用的機(jī)器學(xué)習(xí)算法比如，貝葉斯、邏輯回歸、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、協(xié)同過(guò)濾等。

五、數(shù)據(jù)可視化

對(duì)接一些BI平臺(tái)，將分析得到的數(shù)據(jù)進(jìn)行可視化，用于指導(dǎo)決策服務(wù)。主流的BI平臺(tái)比如，國(guó)外的敏捷BI Tableau、Qlikview、PowrerBI等，國(guó)內(nèi)的SmallBI和新興的網(wǎng)易有數(shù)等。

在上面的每一個(gè)階段，保障數(shù)據(jù)的安全是不可忽視的問(wèn)題。

基于網(wǎng)絡(luò)身份認(rèn)證的協(xié)議Kerberos，用來(lái)在非安全網(wǎng)絡(luò)中，對(duì)個(gè)人通信以安全的手段進(jìn)行身份認(rèn)證，它允許某實(shí)體在非安全網(wǎng)絡(luò)環(huán)境下通信，向另一個(gè)實(shí)體以一種安全的方式證明自己的身份。

控制權(quán)限的ranger是一個(gè)Hadoop集群權(quán)限框架，提供操作、監(jiān)控、管理復(fù)雜的數(shù)據(jù)權(quán)限，它提供一個(gè)集中的管理機(jī)制，管理基于yarn的Hadoop生態(tài)圈的所有數(shù)據(jù)權(quán)限?？梢詫?duì)Hadoop生態(tài)的組件如Hive，Hbase進(jìn)行細(xì)粒度的數(shù)據(jù)訪問(wèn)控制。通過(guò)操作Ranger控制臺(tái)，管理員可以輕松的通過(guò)配置策略來(lái)控制用戶訪問(wèn)HDFS文件夾、HDFS文件、數(shù)據(jù)庫(kù)、表、字段權(quán)限。這些策略可以為不同的用戶和組來(lái)設(shè)置，同時(shí)權(quán)限可與hadoop無(wú)縫對(duì)接。

簡(jiǎn)單說(shuō)有三大核心技術(shù)：拿數(shù)據(jù)，算數(shù)據(jù)，賣數(shù)據(jù)。

首先做為大數(shù)據(jù)，拿不到大量數(shù)據(jù)都白扯?，F(xiàn)在由于機(jī)器學(xué)習(xí)的興起，以及萬(wàn)金油算法的崛起，導(dǎo)致算法地位下降，數(shù)據(jù)地位提高了。舉個(gè)通俗的例子，就好比由于教育的發(fā)展，導(dǎo)致個(gè)人智力重要性降低，教育背景變重要了，因?yàn)橐话闳税礃?biāo)準(zhǔn)流程讀個(gè)書，就能比牛頓懂得多了。谷歌就說(shuō)：拿牛逼的數(shù)據(jù)喂給一個(gè)一般的算法，很多情況下好于拿傻傻的數(shù)據(jù)喂給牛逼的算法。而且知不知道弄個(gè)牛逼算法有多困難?一般人連這個(gè)困難度都搞不清楚好不好……拿數(shù)據(jù)很重要，巧婦難為無(wú)米之炊呀!所以為什么好多公司要燒錢搶入口，搶用戶，是為了爭(zhēng)奪數(shù)據(jù)源呀!不過(guò)運(yùn)營(yíng)，和產(chǎn)品更關(guān)注這個(gè)，我是程序員，我不管……

其次就是算數(shù)據(jù)，如果數(shù)據(jù)拿到直接就有價(jià)值地話，那也就不需要公司了，政府直接賺外快就好了。蘋果落地都能看到，人家牛頓能整個(gè)萬(wàn)有引力，我就只能撿來(lái)吃掉，差距呀……所以數(shù)據(jù)在那里擺著，能挖出啥就各憑本事了。算數(shù)據(jù)就需要計(jì)算平臺(tái)了，數(shù)據(jù)怎么存(HDFS, S3, HBase, Cassandra)，怎么算(Hadoop, Spark)就靠咱們程序猿了……

再次就是賣得出去才能變現(xiàn)，否則就是搞公益了，比如《疑犯追蹤》里面的李四和大錘他們……見(jiàn)人所未見(jiàn)，預(yù)測(cè)未來(lái)并趨利避害才是智能的終極目標(biāo)以及存在意義，對(duì)吧?這個(gè)得靠大家一塊兒琢磨。

其實(shí)我覺(jué)得最后那個(gè)才是“核心技術(shù)”，什么Spark，Storm，Deep-Learning，都是第二梯隊(duì)的……當(dāng)然，沒(méi)有強(qiáng)大的算力做支撐，智能應(yīng)該也無(wú)從說(shuō)起吧。

閱讀全文

云計(jì)算(135407) 云計(jì)算(135407)
物聯(lián)網(wǎng)(357099) 物聯(lián)網(wǎng)(357099)
大數(shù)據(jù)(136505) 大數(shù)據(jù)(136505)
云儲(chǔ)存(56517) 云儲(chǔ)存(56517)

評(píng)論

相關(guān)推薦

2019國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)跟大數(shù)據(jù)一起賽跑大數(shù)據(jù)應(yīng)用云計(jì)算電子商務(wù)

、大數(shù)據(jù)、高速寬帶、物聯(lián)網(wǎng)、智慧城市為代表的ICT新浪潮，進(jìn)一步推動(dòng)了數(shù)據(jù)中心市場(chǎng)規(guī)模擴(kuò)大。Gartner最新發(fā)布的全球IT支出預(yù)測(cè)認(rèn)為，2016年數(shù)據(jù)中心系統(tǒng)支出預(yù)計(jì)將達(dá)1430億美元，與2015年相比

2018-10-10 13:55:02

5分鐘告訴你為什么要學(xué)大數(shù)據(jù)

`科技公司飛速發(fā)展和數(shù)字科技日益重要的今天，萬(wàn)物互聯(lián)、人工智能的時(shí)代業(yè)已到來(lái)，海量數(shù)據(jù)資產(chǎn)被創(chuàng)造出來(lái)并亟待分析，從而衍生出了很多前所未有的業(yè)務(wù)需求，而大數(shù)據(jù)計(jì)算技術(shù)完美地解決了海量數(shù)據(jù)的收集、存儲(chǔ)

2021-07-04 10:01:42

大數(shù)據(jù)Kafka數(shù)據(jù)處理過(guò)程

大數(shù)據(jù)-Kafka數(shù)據(jù)處理

2020-03-27 11:42:41

大數(shù)據(jù)hadoop生態(tài)系統(tǒng)概念簡(jiǎn)單介紹

零基礎(chǔ)大數(shù)據(jù)入門3--大數(shù)據(jù)生態(tài)系統(tǒng)及其各組件簡(jiǎn)介

2019-05-05 14:34:49

大數(shù)據(jù)與萬(wàn)物互聯(lián)如何定義未來(lái)？

大數(shù)據(jù)與萬(wàn)物互聯(lián)重新定義未來(lái)

2021-02-23 06:20:34

大數(shù)據(jù)與云計(jì)算之間有何關(guān)系

大數(shù)據(jù)與云計(jì)算之間有何關(guān)系？

2021-10-09 06:06:03

大數(shù)據(jù)與物聯(lián)網(wǎng)如何相互協(xié)作

來(lái)源：互聯(lián)網(wǎng)隨著物聯(lián)網(wǎng)不斷的發(fā)展的趨于成熟期，我們同時(shí)也收集了更多的信息數(shù)據(jù)，其實(shí)就是所謂的大數(shù)據(jù)。換個(gè)說(shuō)法，也就是說(shuō)物聯(lián)網(wǎng)和大數(shù)據(jù)可以互相協(xié)作。據(jù)統(tǒng)計(jì)《福布斯》預(yù)測(cè)，到2025年，生成的數(shù)據(jù)量將增加到175 ZB。這將對(duì)收集、分析和報(bào)告數(shù)據(jù)的方式產(chǎn)生巨大的影響。

2020-10-22 06:01:50

大數(shù)據(jù)專業(yè)技術(shù)學(xué)習(xí)之大數(shù)據(jù)處理流程

隨著互聯(lián)網(wǎng)的發(fā)展，大數(shù)據(jù)也在逐漸彰顯出自己的優(yōu)勢(shì)特點(diǎn)，那么關(guān)于大數(shù)據(jù)的處理流程，你是否了解?第一，數(shù)據(jù)采集定義：利用多種輕型數(shù)據(jù)庫(kù)來(lái)接收發(fā)自客戶端的數(shù)據(jù)，并且用戶可以通過(guò)這些數(shù)據(jù)庫(kù)來(lái)進(jìn)行簡(jiǎn)單的查詢

2018-06-11 16:41:53

大數(shù)據(jù)之Hive數(shù)據(jù)倉(cāng)庫(kù)

大數(shù)據(jù) Hive數(shù)據(jù)倉(cāng)庫(kù)

2019-03-19 11:10:06

大數(shù)據(jù)從入門到精通

尋找新未來(lái)，大數(shù)據(jù)從入門到精通其實(shí)難度并不大

2019-10-22 10:35:15

大數(shù)據(jù)分析邏輯

大數(shù)據(jù)分析邏輯，全英文，請(qǐng)勿公開(kāi)

2018-10-08 17:08:52

大數(shù)據(jù)和物聯(lián)網(wǎng)是如何影響數(shù)據(jù)中心的？

大數(shù)據(jù)和物聯(lián)網(wǎng)是如何影響數(shù)據(jù)中心的？

2021-05-21 06:24:04

大數(shù)據(jù)在未來(lái)的優(yōu)勢(shì)

大數(shù)據(jù)時(shí)代的到來(lái)，Java大數(shù)據(jù)才是未來(lái)的高富帥！

2019-04-29 17:05:57

大數(shù)據(jù)處理和分析能力的提高

如何提高大數(shù)據(jù)處理和分析的能力

2019-08-23 13:07:24

大數(shù)據(jù)學(xué)習(xí)之Hbase shell的基本操作

所有的表以上為hbase shell腳本的基礎(chǔ)操作，學(xué)習(xí)大數(shù)據(jù)過(guò)程中需掌握的知識(shí)點(diǎn)，在掌握hbaseshell腳本的基礎(chǔ)上學(xué)習(xí)hbase 的java api，會(huì)更加的容易！老男孩教育在大數(shù)據(jù)開(kāi)發(fā)培訓(xùn)方面

2018-06-15 15:06:44

大數(shù)據(jù)學(xué)習(xí)之Linux基礎(chǔ)

大數(shù)據(jù)學(xué)習(xí)之路：Linux基礎(chǔ)

2020-06-02 16:53:57

大數(shù)據(jù)學(xué)習(xí)必看書籍

大數(shù)據(jù)學(xué)*** 這幾本書一定要看

2019-06-10 15:27:20

大數(shù)據(jù)平臺(tái)開(kāi)發(fā)公司有哪些？

的關(guān)鍵。越來(lái)越多的企業(yè)開(kāi)始重視大數(shù)據(jù)戰(zhàn)略布局，并重新定義了自己的核心競(jìng)爭(zhēng)力。這里就給大家整理一些國(guó)內(nèi)的站在大數(shù)據(jù)風(fēng)口的公司。如果在網(wǎng)絡(luò)上查一下“國(guó)內(nèi)大數(shù)據(jù)公司”，你就會(huì)發(fā)現(xiàn)各式各樣的排行版都有。本文給

2018-11-15 15:17:14

大數(shù)據(jù)應(yīng)用開(kāi)發(fā)如何入門需要知道這些

`前幾天和三個(gè)學(xué)計(jì)算機(jī)專業(yè)的學(xué)生聊天時(shí)聊到了大數(shù)據(jù)開(kāi)發(fā)方面的話題，他們?nèi)齻€(gè)人中，有兩個(gè)已經(jīng)進(jìn)入企業(yè)開(kāi)始工作，另外一個(gè)還是大二學(xué)生，但已經(jīng)開(kāi)設(shè)了自己的工作室。他們都是從事程序開(kāi)發(fā)方面工作的。大數(shù)據(jù)開(kāi)發(fā)

2018-11-26 14:49:03

大數(shù)據(jù)開(kāi)發(fā)核心技術(shù)詳解

數(shù)據(jù)的核心是云技術(shù)和BI。關(guān)于大數(shù)據(jù)和云計(jì)算的關(guān)系人們通常會(huì)有誤解，而且也會(huì)把它們混起來(lái)說(shuō)，分別做一句話直白解釋就是：云計(jì)算就是硬件資源的虛擬化;大數(shù)據(jù)就是海量數(shù)據(jù)的高效處理。如果做一個(gè)更形象的解釋

2018-07-26 16:26:24

大數(shù)據(jù)技術(shù)與應(yīng)用是學(xué)什么的?

大數(shù)據(jù)技術(shù)與應(yīng)用是學(xué)什么的?大數(shù)據(jù)是指無(wú)法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)技術(shù)，是指從各種各樣類型的數(shù)據(jù)中，快速獲得有價(jià)值信息的能力。適用于大數(shù)據(jù)的技術(shù)，包括

2021-07-27 07:47:44

大數(shù)據(jù)技術(shù)專家的學(xué)習(xí)歷程分享

從小白到大數(shù)據(jù)技術(shù)專家的學(xué)習(xí)歷程，你準(zhǔn)備好了嗎

2020-04-22 14:37:39

大數(shù)據(jù)技術(shù)經(jīng)驗(yàn)交流場(chǎng)景化數(shù)據(jù)算法

可視化數(shù)據(jù)指導(dǎo)，讓每一個(gè)人看懂大數(shù)據(jù)；多場(chǎng)景數(shù)據(jù)算法，讓所有數(shù)據(jù)都有跡可循；大數(shù)據(jù)技術(shù)經(jīng)驗(yàn)交流群，洞悉行業(yè)數(shù)據(jù)，引領(lǐng)未來(lái)方向，快來(lái)加入我們吧?。≦Q群號(hào)257449299）

2017-06-01 17:12:21

大數(shù)據(jù)推動(dòng)可穿戴設(shè)備的發(fā)展

軟硬結(jié)合的模式已經(jīng)成為移動(dòng)互聯(lián)網(wǎng)時(shí)代的必需品。從蘋果開(kāi)創(chuàng)的手機(jī)加APP模式，到現(xiàn)在智能可穿戴設(shè)備與大數(shù)據(jù)的結(jié)合，軟硬兼施讓人類就范更加具有開(kāi)創(chuàng)性的社會(huì)生活。沒(méi)有普適計(jì)算，就沒(méi)有智能可穿戴設(shè)備的今天

2014-09-10 20:55:51

大數(shù)據(jù)的數(shù)據(jù)類型

大數(shù)據(jù)不僅僅是一個(gè)數(shù)據(jù)，它是大數(shù)據(jù)集的集合，不能使用傳統(tǒng)的計(jì)算技術(shù)來(lái)處理，宏觀上來(lái)講，它不僅包括需處理的數(shù)據(jù)，還包括各種工具、技術(shù)和框架。大數(shù)據(jù)涉及由不同設(shè)備和應(yīng)用程序產(chǎn)生的數(shù)據(jù)，主要包括以下幾個(gè)

2018-05-11 15:57:46

大數(shù)據(jù)的四種思維方式

大數(shù)據(jù)所帶來(lái)的四種思維方式的轉(zhuǎn)變

2019-08-12 11:37:02

大數(shù)據(jù)的定義及其應(yīng)用

目錄1、大數(shù)據(jù)概述1.1. 概述1.2. 大數(shù)據(jù)定義1.3. 大數(shù)據(jù)技術(shù)發(fā)展2、大數(shù)據(jù)應(yīng)用2.1. 大數(shù)據(jù)應(yīng)用闡述2.2. 大數(shù)據(jù)應(yīng)用架構(gòu)2.3. 大數(shù)據(jù)行業(yè)應(yīng)用2.3.1. 醫(yī)療行業(yè)2.3.2.

2021-07-12 06:12:11

大數(shù)據(jù)的就業(yè)方向

大數(shù)據(jù)就業(yè)方向有哪些

2019-07-04 17:23:21

大數(shù)據(jù)的來(lái)源分析

Hadoop教程：大數(shù)據(jù)概述

2019-08-27 10:52:24

大數(shù)據(jù)監(jiān)控binlog組件的maxwell組件

大數(shù)據(jù)實(shí)時(shí)監(jiān)控mysql數(shù)據(jù)庫(kù)binlog（二）

2019-05-16 11:24:38

大數(shù)據(jù)系列之Spark

大數(shù)據(jù)系列Spark初探

2020-04-30 08:08:56

大數(shù)據(jù)計(jì)算服務(wù)MaxCompute的使用教程

阿里云大數(shù)據(jù)計(jì)算服務(wù)MaxCompute使用教程

2020-04-30 07:57:08

大數(shù)據(jù)運(yùn)用的技術(shù)

是大數(shù)據(jù)開(kāi)發(fā)的重要框架，其核心是HDFS和MapReduce，HDFS為海量的數(shù)據(jù)提供了存儲(chǔ)，MapReduce為海量的數(shù)據(jù)提供了計(jì)算，因此，需要重點(diǎn)掌握，除此之外，還需要掌握Hadoop集群

2018-04-08 16:50:41

BAW技術(shù)推進(jìn)大數(shù)據(jù)發(fā)展

近日，德州儀器的Ahmad Bahai博士發(fā)表文章《Disruptive TI BAW technology accelerates big data on the information superhighway》，解析TI體聲波(BAW)技術(shù)對(duì)于大數(shù)據(jù)發(fā)展的巨大作用，以下為譯文：

2019-07-29 07:34:35

DKHadoop大數(shù)據(jù)平臺(tái)架構(gòu)詳解

大數(shù)據(jù)的時(shí)代已經(jīng)來(lái)了，信息的爆炸式增長(zhǎng)使得越來(lái)越多的行業(yè)面臨這大量數(shù)據(jù)需要存儲(chǔ)和分析的挑戰(zhàn)。Hadoop作為一個(gè)開(kāi)源的分布式并行處理平臺(tái)，以其高拓展、高效率、高可靠等優(yōu)點(diǎn)越來(lái)越受到歡迎。這同時(shí)也帶動(dòng)

2018-10-17 15:12:09

DKHadoop大數(shù)據(jù)開(kāi)發(fā)框架的構(gòu)成模塊

方面新聞的人應(yīng)該知道，大數(shù)據(jù)已經(jīng)上升到了國(guó)家戰(zhàn)略的高度?？梢哉f(shuō)這是時(shí)代發(fā)展的必然趨勢(shì)，從國(guó)家戰(zhàn)略層面推進(jìn)大數(shù)據(jù)技術(shù)的普及與應(yīng)用，一個(gè)至關(guān)重要且非常核心的問(wèn)題——數(shù)據(jù)安全問(wèn)題就非常突出。解決數(shù)據(jù)安全問(wèn)題

2018-10-19 15:12:26

DKH企業(yè)級(jí)大數(shù)據(jù)解決方案的優(yōu)勢(shì)分析

:以大數(shù)據(jù)云計(jì)算技術(shù)為核心的，統(tǒng)一數(shù)據(jù)管控解決方案以大快的DKH為基礎(chǔ)，增加數(shù)據(jù)可視化，異構(gòu)數(shù)據(jù)全文搜索，跨平臺(tái)數(shù)據(jù)整合，NLP以及人工只能等基礎(chǔ)功能，面向大中型企業(yè)及***機(jī)構(gòu)，提供的基于大數(shù)據(jù)與云

2018-11-02 13:25:40

DKhadoop大數(shù)據(jù)平臺(tái)基礎(chǔ)框架方案概述

大數(shù)據(jù)作為當(dāng)下最為熱門的事件之一，其實(shí)已經(jīng)不算是很新鮮的事情了。如果是三五年前在討論大數(shù)據(jù)，那可能會(huì)給人一種很新鮮的感覺(jué)。大數(shù)據(jù)作為當(dāng)下最為重要的一項(xiàng)戰(zhàn)略資源，已經(jīng)是越來(lái)越得到國(guó)家和企業(yè)的高度重視

2018-10-31 13:58:17

NLPIR大數(shù)據(jù)KGB知識(shí)圖譜引擎智能挖掘各行數(shù)據(jù)

、清洗去噪以及進(jìn)一步的集成存儲(chǔ)。首先將這些結(jié)構(gòu)復(fù)雜的數(shù)據(jù)轉(zhuǎn)換為單一的或是便于處理的結(jié)構(gòu)。還需對(duì)這些數(shù)據(jù)進(jìn)行“去噪”和清洗，以保證數(shù)據(jù)的質(zhì)量以及可靠性。　　數(shù)據(jù)分析：這是整個(gè)大數(shù)據(jù)處理流程的核心。因?yàn)樵?b class="flag-6" style="color: red">數(shù)據(jù)

2018-11-02 14:08:08

Quick BI助力云上大數(shù)據(jù)分析---深圳云棲大會(huì)

、需求響應(yīng)時(shí)間長(zhǎng)、本地化現(xiàn)象嚴(yán)重、專業(yè)人才緊缺等挑戰(zhàn)，急需構(gòu)建一個(gè)面向業(yè)務(wù)人員的自助式大數(shù)據(jù)分析工具，讓業(yè)務(wù)人員自助式實(shí)現(xiàn)在線數(shù)據(jù)分析，助力企業(yè)業(yè)務(wù)的數(shù)據(jù)化。Quick BI核心能力一、如何保障高性能

2018-04-03 11:42:18

VLFFT加入PCIE實(shí)現(xiàn)大數(shù)據(jù)量計(jì)算

我買了一個(gè)研華的8681E開(kāi)發(fā)板，核心用的是C6678，我想使用PCIE接口，結(jié)合VLFFT程序，實(shí)現(xiàn)持續(xù)的大數(shù)據(jù)量的FFT變換，但是我不知道如何在VLFFT程序的基礎(chǔ)上進(jìn)行修改，加入PCIE的傳輸

2018-06-19 06:11:55

WIFi模塊大數(shù)據(jù)丟幀

1.從原子淘寶店買的串口wifi傳送大數(shù)據(jù)（約8K），在透?jìng)髂Ｊ较掳l(fā)現(xiàn)丟幀。如果把仿真器插上(SWD)，仿真器和電腦USB不連接，這時(shí)候電腦收到的數(shù)據(jù)就是對(duì)的，如果直接把SWD4線拔掉，收到的數(shù)據(jù)

2019-04-17 03:40:20

WitSight工業(yè)大數(shù)據(jù)云平臺(tái)如何在技術(shù)和架構(gòu)層面上運(yùn)作？

WitSight是什么?WitSight提供了哪些核心功能和優(yōu)勢(shì)？WitSight工業(yè)大數(shù)據(jù)云平臺(tái)如何在技術(shù)和架構(gòu)層面上運(yùn)作？

2021-06-16 09:29:19

ZYNQ核心板

ZYNQ核心板 DEVB_45X60MM 5V

2023-03-28 13:06:25

labview怎么做大數(shù)據(jù)的回放

想做一個(gè)大數(shù)據(jù)回放的系統(tǒng)，要求系統(tǒng)運(yùn)行功能較多，最關(guān)鍵的是運(yùn)行比較流暢，不知道誰(shuí)可以幫下。

2013-11-06 18:48:46

“阿里巴巴大數(shù)據(jù)系統(tǒng)體系”四大層次

“你是做什么的？”“數(shù)據(jù)產(chǎn)品經(jīng)理”看到對(duì)方一臉懵逼之后，再補(bǔ)充一句“大數(shù)據(jù)相關(guān)的工作”“哦～，高大上，不懂”過(guò)去5年，“大數(shù)據(jù)”是最火的一個(gè)概念，被紛繁解讀。在我看來(lái)，數(shù)據(jù)跟石油、煤炭一樣是一種資源

2018-08-29 16:19:20

【教學(xué)基地】labview大數(shù)據(jù)處理(初步分析部分)

` 本帖最后由 a156789156782 于 2018-6-14 10:11 編輯【教學(xué)基地實(shí)驗(yàn)小屋】03008虛擬儀器大數(shù)據(jù)處理初步分析部分通過(guò)本節(jié)學(xué)習(xí)對(duì)文檔的操作來(lái)入門大數(shù)據(jù)分析，直接

2018-06-13 21:45:35

為什么小數(shù)據(jù)比大數(shù)據(jù)更重要

大數(shù)據(jù)在2015年一年的收集量比有史以來(lái)人類總共收集到的數(shù)據(jù)總和都要多，可是有90%都沒(méi)有被利用，成了廢數(shù)據(jù)。問(wèn)題出在哪里？請(qǐng)看下文：早在2014年，加州大學(xué)戴維斯分校的技術(shù)管理學(xué)教授巴格瓦

2017-12-27 14:54:28

什么是大數(shù)據(jù)

近幾年,"大數(shù)據(jù)"這個(gè)詞以烈火燎原之勢(shì)，在互聯(lián)網(wǎng)領(lǐng)域迅速的扎根生長(zhǎng)。尤其是"大數(shù)據(jù)"時(shí)代的到來(lái)，刺激了各大行業(yè)發(fā)展，也增加了很多相關(guān)崗位。許多人了解情況之后

2021-08-31 08:52:38

什么是大數(shù)據(jù)？

幾分鐘看懂什么是大數(shù)據(jù)？

2020-04-30 14:24:58

什么是大數(shù)據(jù)？大數(shù)據(jù)的特點(diǎn)有哪些

大數(shù)據(jù)(big data)目錄1什么是大數(shù)據(jù)2大數(shù)據(jù)的定義3大數(shù)據(jù)的特點(diǎn)[1]4大數(shù)據(jù)的作用[2]5大數(shù)據(jù)的分析6大數(shù)據(jù)的技術(shù)7大數(shù)據(jù)的處理8大數(shù)據(jù)的常見(jiàn)誤解9大數(shù)據(jù)時(shí)代存儲(chǔ)所面對(duì)的問(wèn)題[3]10大數(shù)據(jù)應(yīng)用與案例分析11相關(guān)條目12參考文獻(xiàn)什么是大數(shù)據(jù)...

2021-07-12 06:52:21

介紹一種大數(shù)據(jù)的六維度分類方法

什么是大數(shù)據(jù)？大數(shù)據(jù)產(chǎn)生于哪里？大數(shù)據(jù)有何功能？

2021-09-02 06:34:34

以DKHadoop為基礎(chǔ)的城市運(yùn)河大數(shù)據(jù)政務(wù)管理平臺(tái)案例解讀

通用計(jì)算平臺(tái)的示意圖核心特點(diǎn)介紹：“城市數(shù)據(jù)運(yùn)河-政務(wù)大數(shù)據(jù)管理運(yùn)營(yíng)平臺(tái)”通過(guò)大快搜索研發(fā)的DKH平臺(tái)提供的大數(shù)據(jù)框架，實(shí)現(xiàn)了政務(wù)數(shù)據(jù)和社會(huì)數(shù)據(jù)的統(tǒng)一的融合。通過(guò)數(shù)據(jù)交換平臺(tái)對(duì)接上下級(jí)數(shù)據(jù)中心，實(shí)現(xiàn)

2018-12-24 13:32:24

華為大數(shù)據(jù)學(xué)習(xí)資料

`華為認(rèn)證大數(shù)據(jù)HCNA課件部分，有要的請(qǐng)微信或留下郵箱，有完整的。`

2018-01-18 09:43:59

圖解大數(shù)據(jù)處理架構(gòu)

大數(shù)據(jù)處理架構(gòu)

2019-05-09 17:11:42

基于hadoop的免費(fèi)大數(shù)據(jù)平臺(tái)有哪些？

早些時(shí)候（5月28號(hào)）由社科文獻(xiàn)出版社初版的《大數(shù)據(jù)藍(lán)皮書：中國(guó)大數(shù)據(jù)發(fā)展報(bào)告No.2》正式發(fā)布了。以“數(shù)化萬(wàn)物智在融合”為主題的中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)也京舉行中?；究梢灶A(yù)見(jiàn)，在接下來(lái)的一段

2018-11-07 14:10:20

如何從零學(xué)大數(shù)據(jù)？

新如何學(xué)習(xí)大數(shù)據(jù)技術(shù)？大數(shù)據(jù)怎么入門？怎么做大數(shù)據(jù)分析？數(shù)據(jù)科學(xué)需要學(xué)習(xí)那些技術(shù)？大數(shù)據(jù)的應(yīng)用前景等等問(wèn)題，已成為熱門大數(shù)據(jù)領(lǐng)域熱門問(wèn)題，以下是對(duì)新手如何學(xué)習(xí)大數(shù)據(jù)技術(shù)問(wèn)題的解答！大數(shù)據(jù)開(kāi)發(fā)學(xué)習(xí)可以

2018-03-01 15:41:13

如何建立物聯(lián)網(wǎng)和大數(shù)據(jù)之間的聯(lián)系？

如何建立物聯(lián)網(wǎng)和大數(shù)據(jù)之間的聯(lián)系？大數(shù)據(jù)使用案例中的物聯(lián)網(wǎng)數(shù)據(jù)規(guī)則是什么？

2021-06-15 08:19:21

如何成功實(shí)施工業(yè)大數(shù)據(jù)

如何成功實(shí)施工業(yè)大數(shù)據(jù)？

2021-09-30 08:45:29

嵌入式好還是大數(shù)據(jù)好

　　首先，大數(shù)據(jù)和嵌入式專業(yè)都具有廣闊的發(fā)展前景。當(dāng)前正處在大數(shù)據(jù)時(shí)代，未來(lái)大數(shù)據(jù)將逐漸落地應(yīng)用，因此大數(shù)據(jù)領(lǐng)域會(huì)釋放出大量的就業(yè)崗位，而嵌入式作為物聯(lián)網(wǎng)領(lǐng)域的重要技術(shù)組成部分，在產(chǎn)業(yè)互聯(lián)網(wǎng)階段也會(huì)

2020-06-28 10:54:35

工業(yè)大數(shù)據(jù)

工業(yè)大數(shù)據(jù)是未來(lái)工業(yè)在全球市場(chǎng)競(jìng)爭(zhēng)中發(fā)揮優(yōu)勢(shì)的關(guān)鍵。無(wú)論是德國(guó)工業(yè)4.0、美國(guó)工業(yè)互聯(lián)網(wǎng)還是《中國(guó)制造2025》，各國(guó)制造業(yè)創(chuàng)新戰(zhàn)略的實(shí)施基礎(chǔ)都是工業(yè)大數(shù)據(jù)的搜集和特征分析，及以此為未來(lái)制造系統(tǒng)搭建

2016-06-19 17:43:37

工業(yè)大數(shù)據(jù)分析平臺(tái)的應(yīng)用價(jià)值探討

的地方。工業(yè)大數(shù)據(jù)作為工業(yè)互聯(lián)網(wǎng)平臺(tái)的核心組成部分，是當(dāng)今工業(yè)轉(zhuǎn)型升級(jí)的必然選擇。大數(shù)據(jù)以及現(xiàn)在大火的人工智能技術(shù)對(duì)于傳統(tǒng)行業(yè)轉(zhuǎn)型升級(jí)可謂影響深遠(yuǎn)，工業(yè)大數(shù)據(jù)分析平臺(tái)功不可沒(méi)！那么工業(yè)大數(shù)據(jù)分析平臺(tái)在

2018-11-12 15:56:57

常用大數(shù)據(jù)處理技術(shù)歸類

“21世紀(jì)最缺的是什么?人才!”。在大數(shù)據(jù)發(fā)展如此之快的今天，大數(shù)據(jù)工程師已經(jīng)成為一個(gè)新興職業(yè)。大數(shù)據(jù)是信息技術(shù)，是人和人、人和機(jī)器、機(jī)器和機(jī)器交互的內(nèi)容特征，是最底層的信息技術(shù)，是基本標(biāo)配。今天

2018-02-28 17:02:51

常用大數(shù)據(jù)技術(shù)課程內(nèi)容

關(guān)于大數(shù)據(jù)的概念，指的是無(wú)法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。而大數(shù)據(jù)技術(shù)，是指從各種各樣類型的數(shù)據(jù)中，快速獲得有價(jià)值信息的能力。那么關(guān)于大數(shù)據(jù)的技術(shù)大致包含哪些內(nèi)容

2018-07-26 16:27:42

常見(jiàn)大數(shù)據(jù)應(yīng)用有哪些?

大數(shù)據(jù)技術(shù)為決策提供依據(jù)，在***、企業(yè)、科研項(xiàng)目等決策中扮演著重要的角色，在社會(huì)治理和企業(yè)管理中起到了不容忽視的作用，很多國(guó)家，如中國(guó)、美國(guó)以及歐盟等都已將大數(shù)據(jù)列入國(guó)家發(fā)展戰(zhàn)略，微軟、谷歌、百度

2018-03-13 16:50:40

怎么才能編程大數(shù)據(jù)技術(shù)專家

從小白到大數(shù)據(jù)技術(shù)專家的學(xué)習(xí)歷程

2020-04-24 09:06:25

探尋大數(shù)據(jù)時(shí)代的商業(yè)變革

`科技的進(jìn)步在很多時(shí)候總會(huì)超出我們的想象。近年來(lái)，“大數(shù)據(jù)”一詞逐漸被大眾所熟知，人們用它來(lái)描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù)，并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。大數(shù)據(jù)時(shí)代已然來(lái)臨，它在迅速發(fā)展也

2017-05-27 17:11:11

未來(lái)，是大數(shù)據(jù)的時(shí)代

這樣才能讓企業(yè)徹底擺脫賣貨思維，從生產(chǎn)型走向服務(wù)型。未來(lái)是物聯(lián)網(wǎng)的時(shí)代，大數(shù)據(jù)的時(shí)代。在這個(gè)信息爆發(fā)的時(shí)代里，我們的生活中充斥著各種各樣的數(shù)據(jù)，這些數(shù)據(jù)有一些是我們需要的，有一些不需要。如果，我們需要

2014-09-24 20:54:32

盤點(diǎn)基本大數(shù)據(jù)相關(guān)書籍

想學(xué)大數(shù)據(jù)？先看完這幾本書再說(shuō)

2019-04-19 12:55:00

請(qǐng)問(wèn)使用microblaze和使用vhdl核心有什么區(qū)別？

你好我試圖在xilinx spartan 3e啟動(dòng)器上實(shí)現(xiàn)以太網(wǎng)我注意到兩個(gè)選項(xiàng)使用microblaze和使用vhdl核心有什么區(qū)別？我真的不了解微光澤制造它的優(yōu)點(diǎn)并且易于實(shí)現(xiàn)，因?yàn)閙ac核心可以

2019-09-09 09:55:33

貴州數(shù)據(jù)寶:做大數(shù)據(jù)行業(yè)的“淘寶”

``公司簡(jiǎn)介數(shù)據(jù)寶核心優(yōu)勢(shì) 選擇數(shù)據(jù)寶選擇合作共贏數(shù)據(jù)寶公司目前得到各大官方媒體的密切關(guān)注。貴州日?qǐng)?bào)報(bào)道—數(shù)據(jù)寶要做大數(shù)據(jù)行業(yè)的“支付寶” 數(shù)據(jù)寶真誠(chéng)期待與您攜手共進(jìn)、合作共贏 數(shù)據(jù)寶—首個(gè)省部共建的大數(shù)據(jù)資產(chǎn)運(yùn)營(yíng)管理平臺(tái)``

2016-07-04 11:41:22

資料下載：大數(shù)據(jù)應(yīng)用及其解決方案

1大數(shù)據(jù)概述 1.1. 概述 大數(shù)據(jù)，IT行業(yè)的又一次技術(shù)變革，大數(shù)據(jù)的浪潮洶涌而至，對(duì)國(guó)家治理、企業(yè)決策和個(gè)人生活都在產(chǎn)生深遠(yuǎn)的影響，并將成為云計(jì)算、物聯(lián)網(wǎng)之后信息技術(shù)產(chǎn)業(yè)領(lǐng)域又一重大創(chuàng)新變革

2021-07-05 06:40:16

Doris大數(shù)據(jù)-03-Doris的核心特性

大數(shù)據(jù)

電子學(xué)習(xí)發(fā)布于 2023-01-06 23:05:33

大數(shù)據(jù)是工業(yè)的核心資源企業(yè)入局需合理把握

工業(yè)大數(shù)據(jù)已經(jīng)成為大數(shù)據(jù)產(chǎn)業(yè)內(nèi)具有實(shí)際意義的領(lǐng)域，吸引著各方資本入局。 大數(shù)據(jù)是工業(yè)的核心資源企業(yè)入局需合理把握近日，在無(wú)錫召開(kāi)的工業(yè)大數(shù)據(jù)峰會(huì)，將預(yù)知性維護(hù)作為主題，吸引了華潤(rùn)電力、金風(fēng)科技、中船重工、西門子等業(yè)內(nèi)領(lǐng)先企業(yè)參與。

2016-11-28 13:44:11

384

基于大數(shù)據(jù)的流式計(jì)算

流式計(jì)算是大數(shù)據(jù)的一種重要計(jì)算模式，大數(shù)據(jù)流式計(jì)算已成為研究熱點(diǎn)。任務(wù)管理是大數(shù)據(jù)流式計(jì)算的核心功能之一，負(fù)責(zé)對(duì)流式計(jì)算的任務(wù)進(jìn)行資源調(diào)度及全生命周期管理。目前對(duì)于大數(shù)據(jù)流式計(jì)算的技術(shù)調(diào)研工作

2017-11-22 17:34:03

大數(shù)據(jù)技術(shù)原理與應(yīng)用

本文介紹了關(guān)于大數(shù)據(jù)的相關(guān)概念、大數(shù)據(jù)的結(jié)構(gòu)、大數(shù)據(jù)的特點(diǎn)以及大數(shù)據(jù)技術(shù)的十大原理及詳細(xì)的說(shuō)明了大數(shù)據(jù)的用途。

2017-12-19 14:29:37

106422

百度大數(shù)據(jù)怎么使用

百度大數(shù)據(jù)+連接垂直行業(yè)，深挖用戶價(jià)值精準(zhǔn)拓展客戶，高效經(jīng)營(yíng)管理百度大數(shù)據(jù)+，是百度開(kāi)放的新商業(yè)“能源庫(kù)”，旨在面向行業(yè)關(guān)鍵訴求，開(kāi)放百度大數(shù)據(jù)核心能力，幫助企業(yè)先人一步創(chuàng)造新商業(yè)機(jī)會(huì)、實(shí)現(xiàn)用戶體驗(yàn)的升級(jí)換代。

2018-12-18 16:11:53

9165

工業(yè)大數(shù)據(jù)將成為智能制造和工業(yè)互聯(lián)網(wǎng)的核心動(dòng)力

在"中國(guó)制造2025"的技術(shù)路線圖中，工業(yè)大數(shù)據(jù)是作為重要突破點(diǎn)來(lái)規(guī)劃的，而在未來(lái)的十年，以數(shù)據(jù)為核心構(gòu)建的智能化體系會(huì)成為支撐智能制造和工業(yè)互聯(lián)網(wǎng)的核心動(dòng)力。工業(yè)大數(shù)據(jù)的重要性眾所周知，但究其根本，大數(shù)據(jù)是手段而不是目的，人工智能也是如此。

2019-02-11 09:18:04

717

大數(shù)據(jù)的核心就是預(yù)測(cè)

它通常被視為人工智能的一部分，或者更確切地說(shuō)，被視為一種機(jī)器學(xué)習(xí)。但是這種定義是有誤導(dǎo)性的。大數(shù)據(jù)不是要教機(jī)器像人一樣思考。相反，它是把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上來(lái)預(yù)測(cè)事情發(fā)生的可能性。

2019-01-29 11:22:46

5340

工業(yè)大數(shù)據(jù)和互聯(lián)網(wǎng)大數(shù)據(jù)區(qū)別

工業(yè)大數(shù)據(jù)與互聯(lián)網(wǎng)大數(shù)據(jù)最大的區(qū)別在于工業(yè)大數(shù)據(jù)有非常強(qiáng)的目的性，而互聯(lián)網(wǎng)大數(shù)據(jù)更多的是一種關(guān)聯(lián)的挖掘，是更加發(fā)散的一種分析。除此之外，兩者在數(shù)據(jù)的特征和面臨的問(wèn)題方面也有不同。有別于互聯(lián)網(wǎng)大數(shù)據(jù)，工業(yè)大數(shù)據(jù)的分析技術(shù)核心要解決 “3B” 問(wèn)題

2019-03-28 14:08:55

10724

大數(shù)據(jù)是5G時(shí)代產(chǎn)業(yè)創(chuàng)新的核心驅(qū)動(dòng)力

中國(guó)聯(lián)通集團(tuán)副總經(jīng)理梁寶俊出席本次論壇并帶來(lái)了精彩的發(fā)言，從運(yùn)營(yíng)商的角度深度剖析“5G＋大數(shù)據(jù)賦能產(chǎn)業(yè)創(chuàng)新”。他認(rèn)為，大數(shù)據(jù)是5G時(shí)代產(chǎn)業(yè)創(chuàng)新的核心驅(qū)動(dòng)力。中國(guó)聯(lián)通力求賦能產(chǎn)業(yè)創(chuàng)新，勇當(dāng)數(shù)字中國(guó)主力軍。福建省作為中國(guó)聯(lián)通的主要戰(zhàn)略合作省份，雙方的淵源由來(lái)已久。

2019-05-07 09:10:23

1914

區(qū)塊鏈能否解救大數(shù)據(jù)風(fēng)控

眾所周知，大數(shù)據(jù)風(fēng)控是指利用大數(shù)據(jù)技術(shù)對(duì)交易過(guò)程中的海量數(shù)據(jù)進(jìn)行量化分析，進(jìn)而更好地進(jìn)行風(fēng)險(xiǎn)識(shí)別和風(fēng)險(xiǎn)管理。大數(shù)據(jù)風(fēng)控的核心原則是小額和分散，即預(yù)防資金相關(guān)者過(guò)度集中。小額的設(shè)計(jì)原則主要是針對(duì)海量

2019-05-22 11:50:13

1505

大數(shù)據(jù)是什么_大數(shù)據(jù)技術(shù)和應(yīng)用的現(xiàn)狀與前景

本文首先介紹了大數(shù)據(jù)和大數(shù)據(jù)技術(shù)與應(yīng)用的概念然后說(shuō)明了大數(shù)據(jù)的優(yōu)勢(shì)和部分應(yīng)用前景最后分析了大數(shù)據(jù)技術(shù)與應(yīng)用的發(fā)展前景。

2019-07-30 15:04:54

23284

大數(shù)據(jù)在物流的應(yīng)用怎樣的

大數(shù)據(jù)技術(shù)已成為物流市場(chǎng)的新“藍(lán)?！保x能倉(cāng)儲(chǔ)物流，提高倉(cāng)儲(chǔ)效率，只是大數(shù)據(jù)技術(shù)應(yīng)用的第一步，融合物聯(lián)網(wǎng)、人工智能等技術(shù)在具體倉(cāng)儲(chǔ)場(chǎng)景中解決問(wèn)題，還將進(jìn)一步激發(fā)大數(shù)據(jù)的價(jià)值，提高企業(yè)核心競(jìng)爭(zhēng)力。

2019-10-25 10:17:57

7097

梳理匯總大數(shù)據(jù)的核心具體價(jià)值

隨著移動(dòng)互聯(lián)網(wǎng)的飛速發(fā)展，信息的傳輸日益方便快捷，端到端的需求也日益突出，縱觀整個(gè)移動(dòng)互聯(lián)網(wǎng)領(lǐng)域，數(shù)據(jù)已被認(rèn)為是繼云計(jì)算、物聯(lián)網(wǎng)之后的又一大顛覆性的技術(shù)性革命，毋庸置疑，大數(shù)據(jù)市場(chǎng)是待挖掘的金礦，其價(jià)值不言而喻。可以說(shuō)誰(shuí)能掌握和合理運(yùn)用用戶大數(shù)據(jù)的核心資源，誰(shuí)就能在接下來(lái)的技術(shù)變革中進(jìn)一步發(fā)展壯大。

2020-08-27 12:48:43

2845

基于大數(shù)據(jù)的智慧消防，它的優(yōu)勢(shì)是什么

影響，同時(shí)也對(duì)工作機(jī)制與知識(shí)體系有所改變。就消防工作而言，借助大數(shù)據(jù)、云計(jì)算等*信息技術(shù)，能夠創(chuàng)建出與傳統(tǒng)消防體系全然不同的一種工作機(jī)制：智慧消防。智慧消防是以大數(shù)據(jù)為核心，利用社會(huì)資源、不斷豐富消防內(nèi)、外數(shù)據(jù)的來(lái)源

2020-09-14 14:31:40

998

大數(shù)據(jù)推動(dòng)產(chǎn)業(yè)發(fā)展，成為智能制造核心動(dòng)力

當(dāng)前，大數(shù)據(jù)已成為業(yè)界公認(rèn)的工業(yè)升級(jí)的關(guān)鍵技術(shù)要素。在＂中國(guó)制造2025＂的技術(shù)路線圖中，工業(yè)大數(shù)據(jù)是作為重要突破點(diǎn)來(lái)規(guī)劃的，而在未來(lái)的十年，以數(shù)據(jù)為核心構(gòu)建的智能化體系會(huì)成為支撐智能制造和工業(yè)

2020-12-29 12:25:56

1736

萌新學(xué)習(xí)大數(shù)據(jù)前需要具備什么編程基礎(chǔ)？

學(xué)大數(shù)據(jù)需要具備什么基礎(chǔ)？學(xué)大數(shù)據(jù)應(yīng)具備編程開(kāi)發(fā)經(jīng)驗(yàn)，今天主要介紹學(xué)大數(shù)據(jù)應(yīng)具備的基礎(chǔ)，學(xué)員從java基礎(chǔ)開(kāi)始，學(xué)習(xí)大數(shù)據(jù)開(kāi)發(fā)過(guò)程中的離線數(shù)據(jù)分析、實(shí)時(shí)數(shù)據(jù)分析和內(nèi)存數(shù)據(jù)計(jì)算等重要內(nèi)容;涵蓋大數(shù)據(jù)

2020-10-13 15:41:49

1994

大數(shù)據(jù)核心技術(shù)/特點(diǎn)/通用應(yīng)用

大數(shù)據(jù)技術(shù)追求的不是精確性的樣本數(shù)據(jù)，而是面向全體的數(shù)據(jù)，這部分數(shù)據(jù)可能是不精確的、非結(jié)構(gòu)化的，但大數(shù)據(jù)技術(shù)正是利用這些之前未被利用的數(shù)據(jù)，創(chuàng)造新的價(jià)值。

2021-01-17 11:51:44

3508

關(guān)于大數(shù)據(jù)的75個(gè)核心術(shù)語(yǔ)下篇（50 個(gè)術(shù)語(yǔ)）

Ramesh Dontha 曾在 DataConomy 上連發(fā)兩篇文章，扼要而全面地介紹了關(guān)于大數(shù)據(jù)的 75 個(gè)核心術(shù)語(yǔ)，這不僅是大數(shù)據(jù)初學(xué)者很好的入門資料，對(duì)于高階從業(yè)人員也可以起到查漏補(bǔ)缺的作用。

2021-04-07 18:03:38

2395

大數(shù)據(jù)領(lǐng)域75個(gè)核心術(shù)語(yǔ)詳解（上）

Ramesh Dontha 曾在 DataConomy 上連發(fā)兩篇文章，扼要而全面地介紹了關(guān)于大數(shù)據(jù)的 75 個(gè)核心術(shù)語(yǔ)，這不僅是大數(shù)據(jù)初學(xué)者很好的入門資料，

2021-04-28 14:51:29

1473

大數(shù)據(jù)技術(shù)主要學(xué)什么大數(shù)據(jù)技術(shù)就業(yè)方向

數(shù)據(jù)的技術(shù)。　　數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)： 數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)是大數(shù)據(jù)處理的核心技術(shù)。學(xué)習(xí)數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)可以幫助專業(yè)人員處理和分析大規(guī)模的數(shù)據(jù)集，發(fā)現(xiàn)數(shù)據(jù)中的模式和規(guī)律。

2023-04-14 17:21:35

5316

該如何理解大數(shù)據(jù)？

大數(shù)據(jù)是當(dāng)今數(shù)字時(shí)代的一個(gè)重要概念。它指的是如此龐大和復(fù)雜的數(shù)據(jù)集，以至于傳統(tǒng)數(shù)據(jù)處理方法無(wú)法處理它們。大數(shù)據(jù)的概念自20世紀(jì)90年代以來(lái)不斷發(fā)展，如今已成為各個(gè)行業(yè)的核心，從金融和制造業(yè)到醫(yī)療保健和社交媒體。理解大數(shù)據(jù)的意義和潛力對(duì)于個(gè)人和企業(yè)來(lái)說(shuō)都至關(guān)重要。

2023-04-19 10:46:16

1105

大數(shù)據(jù)技術(shù)是干嘛的大數(shù)據(jù)核心技術(shù)有哪些

的核心技術(shù)，包括數(shù)據(jù)采集、存儲(chǔ)與管理、處理與分析等方面。一、大數(shù)據(jù)技術(shù)背景和概念 1.1 背景隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展，人們可以通過(guò)各種途徑產(chǎn)生、獲取和傳輸數(shù)據(jù)，使數(shù)據(jù)量呈現(xiàn)爆炸式增長(zhǎng)的趨勢(shì)。這些數(shù)據(jù)來(lái)源包括

2024-01-31 11:07:26

533

已全部加載完成

搜索歷史

大數(shù)據(jù)的核心有哪些？

評(píng)論

大數(shù)據(jù)的核心有哪些？