0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MIT開發(fā)數(shù)據(jù)分析師的“無界畫布”

Hf1h_BigDataDig ? 來源:YXQ ? 2019-07-11 15:23 ? 次閱讀

還記得《復(fù)仇者聯(lián)盟2》里面鋼鐵俠和班納博士創(chuàng)造奧創(chuàng)的時候,使用全息投影將三維數(shù)據(jù)投射到空氣中,然后直接用雙手操控這些數(shù)據(jù)的畫面嗎?

遺憾的是,這樣的系統(tǒng)目前尚未成為現(xiàn)實。

是什么限制了我們像鋼鐵俠一樣操作數(shù)據(jù)呢?如果暫時還想不到答案,不如我們先來看一下要實現(xiàn)這個需要哪些技術(shù)吧。

首先肯定是全息投影,很多人可能認(rèn)為,限制這個技術(shù)的肯定是沒有這么好的全息投影,誠然,全息投影目前還尚未成熟,但是以目前的發(fā)展來看,并不是說現(xiàn)有的技術(shù)不能將數(shù)據(jù)表實時投影到三維空間中,還記得五月中旬被Magic Leap收購的Mimesys公司么?我們來看看這家公司已經(jīng)將全息投影做到什么地步了。

建筑模型和人都進行了全息投影,而且人還可以對模型進行交互操作,是不是有點賽博朋克?

也就是說,盡管在邊界的處理還存在一些瑕疵,但是將數(shù)據(jù)表投影到空氣中并進行操作,并不是遙不可及的。

那是究竟什么封印了Stark的出現(xiàn)?

答案是智能。因為就算我們將各種數(shù)據(jù)表投影到了空氣中,并且各種諸如手環(huán)、指環(huán)的傳感器也能夠?qū)⑽覀兊膭幼鞣从辰o計算機形成指令,但是如果沒有智能,我們實現(xiàn)的僅僅就是用了更加炫酷的姿勢來操作Excel而已。你將一個表格拖過來,也就實現(xiàn)了ctrl+c&ctrl+v。

兩家高校的研究員正在嘗試突破這個瓶頸。

不久之前,麻省理工學(xué)院和布朗大學(xué)的研究人員開發(fā)了一個在觸摸屏上運行的交互式智能數(shù)據(jù)分析系統(tǒng),名為Northstar,該系統(tǒng)在云中運行,而且其界面支持任何觸摸屏設(shè)備,包括智能手機和大型交互式顯示屏。

更關(guān)鍵的是,它可以根據(jù)用戶操作實時生成機器學(xué)習(xí)模型,從而在其數(shù)據(jù)集上運行預(yù)測任務(wù)。

而這,得益于一項新的AutoML組件:VDS

迄今為止最快的交互式AutoML工具——VDS

VDS首先出現(xiàn)在ACM SIGMOD會議上發(fā)表的一篇論文中,利用的是現(xiàn)在比較火的人工智能技術(shù)——自動機器學(xué)習(xí)(AutoML),它可以讓沒有數(shù)據(jù)科學(xué)知識的人根據(jù)他們的數(shù)據(jù)集訓(xùn)練AI模型進行預(yù)測。

例如,醫(yī)生可以使用該系統(tǒng)來幫助預(yù)測哪些患者更容易患某些疾病,而企業(yè)主也可以通過該系統(tǒng)預(yù)測銷售情況。用戶也可以通過使用交互式顯示屏進行實時協(xié)作。這個系統(tǒng)的目的是使用戶更容易進行復(fù)雜的數(shù)據(jù)分析,同時保證分析的速度和準(zhǔn)確度,在此基礎(chǔ)上實現(xiàn)數(shù)據(jù)科學(xué)的大眾化。

“即使是不了解數(shù)據(jù)科學(xué)的咖啡店老板也應(yīng)該能夠預(yù)測未來幾周內(nèi)他們的銷售情況,以確定要進多少貨”,論文的共同作者和長期擔(dān)任Northstar項目的負(fù)責(zé)人Tim Kraska說。他是麻省理工學(xué)院計算機科學(xué)和人工智能實驗室(CSAIL)的電氣工程和計算機科學(xué)副教授,也是新數(shù)據(jù)系統(tǒng)和人工智能實驗室(DSAIL)的創(chuàng)始人之一。

目前,自動機器學(xué)習(xí)技術(shù)的優(yōu)化基于DARPA D3M自動機器學(xué)習(xí)競賽,該競賽每六個月決出一次性能最佳的AutoML工具。

數(shù)據(jù)分析師的“無界畫布”

這一新成果建立在麻省理工學(xué)院和布朗研究員在Northstar的多年合作基礎(chǔ)之上。四年多來,研究人員發(fā)表了大量論文,詳細(xì)介紹Northstar組件,包括交互式界面,多平臺操作,加速運行結(jié)果以及用戶行為研究。

Northstar系統(tǒng)以空白白色界面開始。用戶將數(shù)據(jù)集上載到系統(tǒng)之后,該數(shù)據(jù)集會顯示在左側(cè)的“數(shù)據(jù)集”框中。任何數(shù)據(jù)標(biāo)簽都會自動填充進界面下方的“屬性”框。界面上還有一個“運算符”框,其中包含各種算法,以及新的AutoML工具。所有數(shù)據(jù)都在云中存儲和分析。

下面讓我們用一個例子詳細(xì)論述:

設(shè)想一群醫(yī)學(xué)研究人員,他們想要探究某年齡組中特定疾病并發(fā)可能性。

他們將模式檢查算法拖放到界面中間,該算法最初顯示為空白框。

作為輸入,他們將標(biāo)記好的疾病特征如“血液”、“傳染性”和“代謝”移動到算法框中。

隨后,算法框中就會顯示這些疾病的百分比。如果他們將“年齡”特征拖到界面中,該界面就會出現(xiàn)另外一個框,框內(nèi)會顯示患者年齡分布的條形圖。

最后,在兩個框之間畫一條線將它們連接在一起,算法就會立即自動計算圍繞不同年齡范圍的三種疾病的關(guān)聯(lián)和并發(fā)現(xiàn)象。

“這就像一個大而無界的畫布,你可以在這里展示你想要的一切”,Northstar互動界面的主要開發(fā)者的Zgraggen說,“你還可以將所有內(nèi)容鏈接在一起,以處理更復(fù)雜的問題”。

通過VDS,用戶現(xiàn)在還可以通過個性化模型,使其適合自己的分析任務(wù),并在自己的數(shù)據(jù)集上進行預(yù)測分析,例如數(shù)據(jù)預(yù)測,圖像分類或分析復(fù)雜圖形結(jié)構(gòu)。

以上述的醫(yī)學(xué)探究為例,醫(yī)學(xué)研究人員希望根據(jù)數(shù)據(jù)集中的特征預(yù)測哪些患者可能患有血液疾病。他們從算法列表中將“AutoML”拖入數(shù)據(jù)集中。系統(tǒng)首先會產(chǎn)生一個帶有“目標(biāo)”標(biāo)簽的空白框。研究人員將“血液”這一標(biāo)簽拖到空白框。系統(tǒng)將自動找到性能最佳的機器學(xué)習(xí)算法,以不斷更新的精度百分比的選項卡顯示。用戶可以隨時停止該過程,優(yōu)化搜索,并檢查每個模型的錯誤率,結(jié)構(gòu),計算和其他事項。

請看視頻演示:

實時智能交互,才是真正的交互

據(jù)研究人員的介紹,VDS是迄今為止最快的交互式AutoML工具,這部分歸功于他們定制的“估算引擎”。引擎位于界面和云存儲之間。引擎自動創(chuàng)建數(shù)據(jù)集的幾個代表性樣本進行逐步處理,從而在幾秒鐘內(nèi)生成高質(zhì)量的結(jié)果。

“我們花了兩年時間設(shè)計VDS,使之契合數(shù)據(jù)科學(xué)家的思維方式,”論文的另一位作者Shang說。VDS可以根據(jù)各種編譯規(guī)則,立即確定哪些模型和預(yù)處理步驟是不是應(yīng)該為用戶提前實現(xiàn)。

在機器學(xué)習(xí)模型的選擇上,它可以從那些大量的機器學(xué)習(xí)算法列表中選擇并在樣本集上運行模擬,同時記錄結(jié)果并優(yōu)化選擇。在提供快速近似結(jié)果后,系統(tǒng)還會在后端細(xì)化結(jié)果。

“至于預(yù)測,用戶不希望等待四個小時才能獲得第一個結(jié)果。用戶希望看到實時發(fā)生的事情,這樣如果發(fā)現(xiàn)了錯誤,用戶可以立即糾正它。但這在任何其他系統(tǒng)中通常是不可能的”,Kraska說。

研究人員在300個真實數(shù)據(jù)集上對工具進行評估。與其他最先進的AutoML系統(tǒng)相比,VDS預(yù)測的準(zhǔn)確度大致相同,但VDS的預(yù)測結(jié)果可以在幾秒鐘內(nèi)生成,這比其他工具快得多,后者往往需要在幾分鐘到幾小時內(nèi)才能運行出結(jié)果。

有了Northstar的VDS組件,我們得到了一個二維空間的交互式智能數(shù)據(jù)分析系統(tǒng),也許離鋼鐵俠的實驗室還有點距離,但是如果有一天Northstar將全息投影加到下一代分析系統(tǒng)中,那么——也許我就可以坐在沙發(fā)上小手一揮:“Javis,把我這個表做好發(fā)給老板?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • MIT
    MIT
    +關(guān)注

    關(guān)注

    3

    文章

    253

    瀏覽量

    23312
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1393

    瀏覽量

    33909

原文標(biāo)題:MIT開發(fā)數(shù)據(jù)分析師的“無界畫布”:實時交互預(yù)測,可拖拽的AutoML系統(tǒng)

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    英偉達Q2銷售額翻倍 分析師預(yù)測營收達286億美元 利潤187億美元

    盡管因為AI 火爆的英偉達非常賺錢大家都知道,但是能夠持續(xù)保持高速增長依然很難,但是面對即將發(fā)布的二季度財報數(shù)據(jù),有分析師給出了翻倍增長的預(yù)測。 據(jù)外媒報道,有部分分析師給出了非常高的預(yù)測值
    的頭像 發(fā)表于 08-27 14:36 ?574次閱讀

    SLM片內(nèi)監(jiān)控IP數(shù)據(jù)分析顯著減少測試成本

    SLM片內(nèi)監(jiān)控IP數(shù)據(jù)分析為高價值應(yīng)用提供了更為自動化的數(shù)據(jù)分析手法。
    的頭像 發(fā)表于 07-16 15:05 ?229次閱讀
    SLM片內(nèi)監(jiān)控IP<b class='flag-5'>數(shù)據(jù)分析</b>顯著減少測試成本

    網(wǎng)絡(luò)爬蟲,Python和數(shù)據(jù)分析

    電子發(fā)燒友網(wǎng)站提供《網(wǎng)絡(luò)爬蟲,Python和數(shù)據(jù)分析.pdf》資料免費下載
    發(fā)表于 07-13 09:27 ?0次下載

    數(shù)據(jù)分析除了spss還有什么

    數(shù)據(jù)分析是當(dāng)今世界中一個非常重要的領(lǐng)域,它涉及到從大量數(shù)據(jù)中提取有用信息、發(fā)現(xiàn)模式和趨勢,并為決策提供支持。SPSS(Statistical Package for the Social
    的頭像 發(fā)表于 07-05 15:01 ?365次閱讀

    數(shù)據(jù)分析的工具有哪些

    開發(fā)的一款電子表格軟件,廣泛應(yīng)用于數(shù)據(jù)分析領(lǐng)域。它具有以下特點: 數(shù)據(jù)整理:Excel提供了豐富的數(shù)據(jù)整理功能,如排序、篩選、查找和替換等。 數(shù)據(jù)
    的頭像 發(fā)表于 07-05 14:54 ?533次閱讀

    數(shù)據(jù)分析有哪些分析方法

    數(shù)據(jù)分析是一種重要的技能,它可以幫助我們從大量的數(shù)據(jù)中提取有價值的信息,從而做出更明智的決策。在這篇文章中,我們將介紹數(shù)據(jù)分析的各種方法,包括描述性分析、診斷性
    的頭像 發(fā)表于 07-05 14:51 ?328次閱讀

    機器學(xué)習(xí)在數(shù)據(jù)分析中的應(yīng)用

    隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)量的爆炸性增長對數(shù)據(jù)分析提出了更高的要求。機器學(xué)習(xí)作為一種強大的工具,通過訓(xùn)練模型從數(shù)據(jù)中學(xué)習(xí)規(guī)律,為企業(yè)和組織提供了更高效、更準(zhǔn)確的
    的頭像 發(fā)表于 07-02 11:22 ?313次閱讀

    數(shù)據(jù)分析平臺網(wǎng)站

    數(shù)據(jù)分析平臺是一種用于處理和分析大規(guī)模數(shù)據(jù)集的系統(tǒng),旨在從海量數(shù)據(jù)中提取有價值的信息和洞察。以下是大數(shù)據(jù)分析平臺的主要功能和應(yīng)用場景: 主
    的頭像 發(fā)表于 06-28 15:46 ?308次閱讀

    求助,關(guān)于AD采集到的數(shù)據(jù)分析問題

    問題描述:使用AD采集一個10Hz到2MHz的脈沖,脈沖底部可能大于零,由采集到的數(shù)據(jù)分析出該脈沖的上升時間,幅值和占空比。 備注:在分析的時候已經(jīng)知道脈沖的頻率,精度為2X10^-5. 在分析
    發(fā)表于 05-09 07:40

    態(tài)勢數(shù)據(jù)分析系統(tǒng)軟件

    智慧華盛恒輝態(tài)勢分析軟件系統(tǒng)的功能描述、部署環(huán)境、界面使用、技術(shù)支持及一些常見問題及其解決辦法等。為數(shù)據(jù)態(tài)勢分析軟件系統(tǒng)的管理人員和使用人員提供說明。 智慧華盛恒輝態(tài)勢數(shù)據(jù)分析系統(tǒng)軟件
    的頭像 發(fā)表于 04-22 11:36 ?334次閱讀

    廣告投放公司運用大數(shù)據(jù)分析,實現(xiàn)精準(zhǔn)投放

    廣告投放公司運用大數(shù)據(jù)分析,實現(xiàn)精準(zhǔn)投放 隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,廣告投放行業(yè)正經(jīng)歷著一場深刻的變革。傳統(tǒng)的廣告投放方式已經(jīng)難以滿足市場需求,而大數(shù)據(jù)分析則為廣告投放帶來了精準(zhǔn)、高效的解決方案
    的頭像 發(fā)表于 04-11 11:23 ?538次閱讀

    特斯拉新車交付量或降,分析師下調(diào)目標(biāo)價

    首先,Piper Sandler分析師Alexander Potter預(yù)計,特斯拉今年新車交付量將小幅下滑0.5%至不足180萬輛;其次,Jefferies分析師Philippe Houchois也做出類似預(yù)測,認(rèn)為新車交付量將減少約3%至177萬輛。
    的頭像 發(fā)表于 04-11 09:49 ?237次閱讀

    大型商業(yè)建筑能耗數(shù)據(jù)分析及節(jié)能管理應(yīng)用

    大型商業(yè)建筑能耗數(shù)據(jù)分析及節(jié)能管理應(yīng)用 張穎姣 安科瑞電氣股份有限公司 上海嘉定 201801 摘要:在在國家構(gòu)建低碳社會的戰(zhàn)略背景下,建筑節(jié)能也越來越被重視。能耗數(shù)據(jù)是建筑能源管理的核心基礎(chǔ)。通過
    的頭像 發(fā)表于 03-11 15:18 ?513次閱讀
    大型商業(yè)建筑能耗<b class='flag-5'>數(shù)據(jù)分析</b>及節(jié)能管理應(yīng)用

    Get職場新知識:做分析,用大數(shù)據(jù)分析工具

    數(shù)據(jù)管理的。 隨著原來越多的企業(yè)加入了數(shù)字化轉(zhuǎn)型的隊伍,大數(shù)據(jù)分析工具也越來越多地被應(yīng)用于各行各業(yè)的業(yè)務(wù)數(shù)據(jù)分析中,直至今日,大數(shù)據(jù)分析工具也成為了
    發(fā)表于 12-05 09:36

    基于大數(shù)據(jù)分析的5G智能工廠如何實現(xiàn)

    隨著科技的快速發(fā)展,大數(shù)據(jù)分析和5G智能工廠已經(jīng)成為當(dāng)今社會的熱門話題。它們在很多領(lǐng)域都有著廣泛的應(yīng)用,如工業(yè)制造、醫(yī)療保健、交通運輸?shù)?。在本文中,我們將探討?b class='flag-5'>數(shù)據(jù)分析和5G智能工廠的概念
    的頭像 發(fā)表于 09-25 17:08 ?464次閱讀