0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能預(yù)處理建構(gòu)模塊加速大數(shù)據(jù)機(jī)器學(xué)習(xí)算法案例解讀

NJ90_gh_bee81f8 ? 2017-12-06 16:30 ? 次閱讀

IBM蘇黎世實(shí)驗(yàn)室(IBM Zurich)的研究人員開發(fā)出通用的人工智能(AI)預(yù)處理建構(gòu)模塊,據(jù)稱可較現(xiàn)有方法加速大數(shù)據(jù)(Big Data)機(jī)器學(xué)習(xí)算法至少10倍以上。

在日前于美國加州長灘舉行的神經(jīng)信息處理系統(tǒng)大會(NIPS 2017)上,IBM在發(fā)表這種新途徑時(shí)解釋,它采用了數(shù)學(xué)對偶性(duality),在Big Data串流中精心挑選能發(fā)揮效用的項(xiàng)目,并略過其余無效的選項(xiàng)。

IBM Zurich研究人員Celestine Dünner說:“我們的動機(jī)在于,當(dāng)缺少足夠的內(nèi)存來為Big Data機(jī)器學(xué)習(xí)保存所有的數(shù)據(jù)時(shí),如何使用硬件加速器,如繪圖處理器(GPU)和現(xiàn)場可編程數(shù)組(FPGA)?!盋elestine Dünner同時(shí)也是這一算法的共同發(fā)明人。

IBM Zurich數(shù)學(xué)家Thomas Parnell則表示:“我們應(yīng)該算是最先提供了可加速10倍的通用解決方案。特別是針對傳統(tǒng)的線性機(jī)器學(xué)習(xí)模型(目前廣泛用于規(guī)模太大而無法用于神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練的數(shù)據(jù)集),我們在最佳參考方案的基礎(chǔ)上建置相關(guān)技術(shù),并展示了至少10倍的加速方案?!?/p>

IBM蘇黎世研究人員Thomas Parnell和Celestine Dünner討論在NIPS 2017發(fā)表的預(yù)處理算法。

在一開始的展示中,研究人員使用Nvidia Quadro M4000 GPU搭配8GB內(nèi)存,在容量約30GB的4萬張照片數(shù)據(jù)集上進(jìn)行訓(xùn)練——該照片數(shù)據(jù)集采用支持向量機(jī)器(SVM)的算法,先將影像解析為各種類別以進(jìn)行辨識。SVM算法還可為所學(xué)習(xí)的模型建立幾何式解讀,這和無法證實(shí)其結(jié)論的神經(jīng)網(wǎng)絡(luò)是不一樣的。IBM的數(shù)據(jù)預(yù)處理方法讓該算法可在不到1分鐘的時(shí)間完成執(zhí)行,比目前采用有限內(nèi)存訓(xùn)練的方法更快10倍。

該技術(shù)的關(guān)鍵在于對每個(gè)數(shù)據(jù)點(diǎn)進(jìn)行預(yù)處理,查看它是不是已經(jīng)處理數(shù)據(jù)點(diǎn)的數(shù)學(xué)對偶。如果是的話,那么算法就會自動略過,這個(gè)過程在數(shù)據(jù)集進(jìn)行處理時(shí)變得越來越頻繁出現(xiàn)。Dünner說:“我們在每個(gè)數(shù)據(jù)點(diǎn)以進(jìn)行處理以前,我們先計(jì)算每個(gè)數(shù)據(jù)點(diǎn)的重要性,再以測量對偶差距大小的方式進(jìn)行處理?!?/p>

Parnell說,“如果你的問題適于放在加速器的內(nèi)存空間,那么在內(nèi)存內(nèi)部執(zhí)行將會獲得更好的結(jié)果。因此,我們的結(jié)果只適用于Big Data的問題。它不僅能讓運(yùn)行時(shí)間加快10倍以上,而且如果在云端執(zhí)行時(shí),也不必付出太多的成本?!?/p>

隨著Big Data數(shù)據(jù)集越滾越大,這種節(jié)省時(shí)間和成本的預(yù)處理算法將會變得越來越重要。IBM指出,為了顯示其基于對偶性的算法能夠處理任意大小的數(shù)據(jù)集,該公司在NIPS上展示了8GPU的版本,它能處理網(wǎng)頁廣告的十億次點(diǎn)擊數(shù)據(jù)。

研究人員正進(jìn)一步開發(fā)該算法,期望在不久部署于IBM BlueMix Cloud——稱為基于對偶差距(duality-gap)的異質(zhì)學(xué)習(xí),適用于包括社群媒體、在線營銷、目標(biāo)式廣告、查找電信數(shù)據(jù)模式以及欺詐檢測等Big Data數(shù)據(jù)集。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • IBM
    IBM
    +關(guān)注

    關(guān)注

    3

    文章

    1730

    瀏覽量

    74477
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46061

    瀏覽量

    235017
  • SVM
    SVM
    +關(guān)注

    關(guān)注

    0

    文章

    154

    瀏覽量

    32337

原文標(biāo)題:這是一個(gè)讓基于GPU的AI訓(xùn)練加速10倍的神奇算法

文章出處:【微信號:gh_bee81f890fc1,微信公眾號:面包板社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    ,以及大力發(fā)展AI for Science的原因。 第2章從科學(xué)研究底層的理論模式與主要困境,以及人工智能三要素(數(shù)據(jù)算法、算力)出發(fā),對AI for Science的技術(shù)支撐進(jìn)行解讀
    發(fā)表于 09-09 13:54

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速
    發(fā)表于 07-29 17:05

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)預(yù)處理與特征工程

    機(jī)器學(xué)習(xí)的整個(gè)流程中,數(shù)據(jù)預(yù)處理與特征工程是兩個(gè)至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量,進(jìn)而影響模型的訓(xùn)練效果和泛化能力。本文將從數(shù)據(jù)
    的頭像 發(fā)表于 07-09 15:57 ?194次閱讀

    人工智能機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機(jī)器學(xué)習(xí)(Machine Learning, ML)和深度學(xué)習(xí)(Deep Learning,
    的頭像 發(fā)表于 07-03 18:22 ?673次閱讀

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支,其目標(biāo)是通過讓計(jì)算機(jī)自動從數(shù)據(jù)學(xué)習(xí)并改進(jìn)其性能,而無需進(jìn)行明確的編程。本文將深入解讀幾種常見的
    的頭像 發(fā)表于 07-02 11:25 ?397次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    ://t.elecfans.com/v/27221.html *附件:初學(xué)者完整學(xué)習(xí)流程實(shí)現(xiàn)手寫數(shù)字識別案例_V2-20240506.pdf 人工智能 語音對話機(jī)器人案例 26分03秒 https
    發(fā)表于 05-10 16:46

    人工智能在戰(zhàn)略評估系統(tǒng)中的應(yīng)用有哪些

    等,并進(jìn)行清洗、整合和預(yù)處理。 人工智能可以幫助企業(yè)對海量數(shù)據(jù)進(jìn)行處理和分析,從而識別出潛在的商機(jī)和威脅。通過機(jī)器
    的頭像 發(fā)表于 04-24 14:54 ?297次閱讀

    機(jī)器學(xué)習(xí)怎么進(jìn)入人工智能

    ,人工智能已成為一個(gè)熱門領(lǐng)域,涉及到多個(gè)行業(yè)和領(lǐng)域,例如語音識別、機(jī)器翻譯、圖像識別等。 在編程中進(jìn)行人工智能的關(guān)鍵是使用機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 04-04 08:41 ?148次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    *附件:初學(xué)者完整學(xué)習(xí)流程實(shí)現(xiàn)手寫數(shù)字識別案例.pdf 人工智能 語音對話機(jī)器人案例 26分03秒 https://t.elecfans.com/v/27185.html *附件:語音對話機(jī)
    發(fā)表于 04-01 10:40

    人工智能機(jī)器學(xué)習(xí)的頂級開發(fā)板有哪些?

    機(jī)器學(xué)習(xí)(ML)和人工智能(AI)不再局限于高端服務(wù)器或云平臺。得益于集成電路(IC)和軟件技術(shù)的新發(fā)展,在微型控制器和微型計(jì)算機(jī)上實(shí)現(xiàn)機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 02-29 18:59 ?593次閱讀
    <b class='flag-5'>人工智能</b>和<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的頂級開發(fā)板有哪些?

    科達(dá)嘉電感器在大數(shù)據(jù)人工智能領(lǐng)域被廣泛應(yīng)用

    近年來,大數(shù)據(jù)人工智能成為科技領(lǐng)域的熱門話題。大數(shù)據(jù)人工智能提供了大量的數(shù)據(jù)作為輸入,使得人工智能算
    的頭像 發(fā)表于 02-29 13:56 ?381次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    聯(lián)網(wǎng)ARM開發(fā) NB-IoT開發(fā)及實(shí)戰(zhàn) 七:python工程師,人工智能工程師 python語法基礎(chǔ) python核心編程 基于OpenCV的機(jī)器視覺開發(fā) 嵌入式人工智能滲入生活的方方面面,廣泛應(yīng)用
    發(fā)表于 02-26 10:17

    科達(dá)嘉電感器廣泛應(yīng)用于大數(shù)據(jù)人工智能領(lǐng)域?yàn)锳I賦能

    近年來,大數(shù)據(jù)人工智能成為科技領(lǐng)域的熱門話題。大數(shù)據(jù)人工智能提供了大量的數(shù)據(jù)作為輸入,使得人工智能算
    的頭像 發(fā)表于 02-23 17:29 ?726次閱讀

    深度學(xué)習(xí)人工智能中的 8 種常見應(yīng)用

    深度學(xué)習(xí)簡介深度學(xué)習(xí)人工智能(AI)的一個(gè)分支,它教神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和推理。近年來,它解決復(fù)雜問題并在各個(gè)領(lǐng)域提供尖端性能的能力引起了極大的興趣和吸引力。深度
    的頭像 發(fā)表于 12-01 08:27 ?2962次閱讀
    深度<b class='flag-5'>學(xué)習(xí)</b>在<b class='flag-5'>人工智能</b>中的 8 種常見應(yīng)用

    基于人工智能算法的推薦系統(tǒng)原理及優(yōu)勢

    推薦系統(tǒng)是一種人工智能人工智能算法,通常與機(jī)器學(xué)習(xí)相關(guān),使用大數(shù)據(jù)向消費(fèi)者建議或推薦其他產(chǎn)品。這些推薦可以基于各種標(biāo)準(zhǔn),包括過去的購買、搜
    發(fā)表于 11-20 11:40 ?2020次閱讀
    基于<b class='flag-5'>人工智能算法</b>的推薦系統(tǒng)原理及優(yōu)勢