大數(shù)據(jù)分析能夠幫助認(rèn)識(shí)數(shù)據(jù)的真實(shí)價(jià)值,而大數(shù)據(jù)分析工具在研究大量數(shù)據(jù)的過(guò)程中尋找模式、相關(guān)性和其他的有用信息,來(lái)幫助人們和企業(yè)更好地適應(yīng)變化,并且做出那些真正明智的決定。一個(gè)好用的大數(shù)據(jù)分析工具,能夠提高企業(yè)整體分析研究能力、市場(chǎng)快速反應(yīng)能力。下面我為大家推薦幾款目前我認(rèn)為很好用的幾款大數(shù)據(jù)分析工具。
一、Apache Drill
為了幫助企業(yè)用戶(hù)尋找更為有效、加快Hadoop數(shù)據(jù)查詢(xún)的方法,Apache軟件基金會(huì)近日發(fā)起了一項(xiàng)名為“Drill”的開(kāi)源項(xiàng)目。Apache Drill 實(shí)現(xiàn)了 Google’s Dremel.
據(jù)Hadoop廠商MapR Technologies公司產(chǎn)品經(jīng)理Tomer Shiran介紹,“Drill”已經(jīng)作為Apache孵化器項(xiàng)目來(lái)運(yùn)作,將面向全球軟件工程師持續(xù)推廣。
該項(xiàng)目將會(huì)創(chuàng)建出開(kāi)源版本的谷歌Dremel Hadoop工具(谷歌使用該工具來(lái)為Hadoop數(shù)據(jù)分析工具的互聯(lián)網(wǎng)應(yīng)用提速)。而“Drill”將有助于Hadoop用戶(hù)實(shí)現(xiàn)更快查詢(xún)海量數(shù)據(jù)集的目的。
二、Smartbi
Smartbi新手入門(mén)簡(jiǎn)單,內(nèi)含數(shù)據(jù)分析及可視化庫(kù)多種多樣,可以作為大數(shù)據(jù)分析工具及可視化的門(mén)戶(hù)網(wǎng)站,還能夠作為各工作流程進(jìn)行大數(shù)據(jù)分析的企業(yè)數(shù)據(jù)可視化平臺(tái)。Smartbi提供了自助式數(shù)據(jù)分析及可視化,數(shù)據(jù)分析功能強(qiáng)悍,鉆取,選擇,排列等功能很全面。Smartbi還能用以制作汽車(chē)儀表板或構(gòu)建顯示器大屏,嵌入的ETL使Smartbi非常適合企業(yè)數(shù)據(jù)可視化使用,而且對(duì)個(gè)人免費(fèi),效果也很好。
Smartbi小到填報(bào)、查詢(xún)、部署、集成,大到可視化大屏、dashboard駕駛艙,應(yīng)有盡有,功能很強(qiáng)大。最重要的是,因?yàn)檫@個(gè)工具,整個(gè)公司的數(shù)據(jù)架構(gòu)都可以變得規(guī)范,下一步就是構(gòu)建企業(yè)的大數(shù)據(jù)平臺(tái)了。而且它是java編寫(xiě)的,支持二次開(kāi)發(fā),類(lèi)Excel的設(shè)計(jì)器,無(wú)論是IT還是業(yè)務(wù),上手都很簡(jiǎn)單:編輯sql優(yōu)化、數(shù)據(jù)集復(fù)用簡(jiǎn)直都是小case,大大降低了報(bào)表開(kāi)發(fā)的門(mén)檻。在企業(yè)中被關(guān)注最多的數(shù)據(jù)安全方面,Smartbi支持多人同時(shí)開(kāi)發(fā)同一套報(bào)表,并通過(guò)模板加鎖功能防止編輯沖突;通過(guò)數(shù)據(jù)分析權(quán)限控制,保障數(shù)據(jù)安全。
三、Hadoop
Hadoop 是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架。但是 Hadoop 是以一種可靠、高效、可伸縮的方式進(jìn)行處理的。Hadoop 是可靠的,因?yàn)樗僭O(shè)計(jì)算元素和存儲(chǔ)會(huì)失敗,因此它維護(hù)多個(gè)工作數(shù)據(jù)副本,確保能夠針對(duì)失敗的節(jié)點(diǎn)重新分布處理。Hadoop 是高效的,因?yàn)樗圆⑿械姆绞焦ぷ鳎ㄟ^(guò)并行處理加快處理速度。Hadoop 還是可伸縮的,能夠處理 PB 級(jí)數(shù)據(jù)。此外,Hadoop 依賴(lài)于社區(qū)服務(wù)器,因此它的成本比較低,任何人都可以使用。
四、RapidMiner
RapidMiner是世界領(lǐng)先的數(shù)據(jù)挖掘解決方案,在一個(gè)非常大的程度上有著先進(jìn)技術(shù)。它數(shù)據(jù)挖掘任務(wù)涉及范圍廣泛,包括各種數(shù)據(jù)藝術(shù),能簡(jiǎn)化數(shù)據(jù)挖掘過(guò)程的設(shè)計(jì)和評(píng)價(jià)。
五、Pentaho BI
Pentaho BI 平臺(tái)不同于傳統(tǒng)的BI 產(chǎn)品,它是一個(gè)以流程為中心的,面向解決方案(Solution)的框架。其目的在于將一系列企業(yè)級(jí)BI產(chǎn)品、開(kāi)源軟件、API等等組件集成起來(lái),方便商務(wù)智能應(yīng)用的開(kāi)發(fā)。它的出現(xiàn),使得一系列的面向商務(wù)智能的獨(dú)立產(chǎn)品如Jfree、Quartz等等,能夠集成在一起,構(gòu)成一項(xiàng)項(xiàng)復(fù)雜的、完整的商務(wù)智能解決方案。
六、HPCC
HPCC,High Performance Computing and Communications(高性能計(jì)算與通信)的縮寫(xiě)。1993年,由美國(guó)科學(xué)、工程、技術(shù)聯(lián)邦協(xié)調(diào)理事會(huì)向國(guó)會(huì)提交了“重大挑戰(zhàn)項(xiàng)目:高性能計(jì)算與 通信”的報(bào)告,也就是被稱(chēng)為HPCC計(jì)劃的報(bào)告,即美國(guó)總統(tǒng)科學(xué)戰(zhàn)略項(xiàng)目,其目的是通過(guò)加強(qiáng)研究與開(kāi)發(fā)解決一批重要的科學(xué)與技術(shù)挑戰(zhàn)問(wèn)題。HPCC是美國(guó) 實(shí)施信息高速公路而上實(shí)施的計(jì)劃,該計(jì)劃的實(shí)施將耗資百億美元,其主要目標(biāo)要達(dá)到:開(kāi)發(fā)可擴(kuò)展的計(jì)算系統(tǒng)及相關(guān)軟件,以支持太位級(jí)網(wǎng)絡(luò)傳輸性能,開(kāi)發(fā)千兆 比特網(wǎng)絡(luò)技術(shù),擴(kuò)展研究和教育機(jī)構(gòu)及網(wǎng)絡(luò)連接能力
編輯:jq
-
大數(shù)據(jù)分析
+關(guān)注
關(guān)注
1文章
131瀏覽量
16863
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論