0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

為何我們不把機器學習更廣泛地應用在文件壓縮方面呢?

MqC7_CAAI_1981 ? 來源:未知 ? 作者:李倩 ? 2018-11-09 15:45 ? 次閱讀

移動互聯(lián)網(wǎng)時代,人類生產(chǎn)的新數(shù)據(jù)正以指數(shù)級別增長,數(shù)據(jù)中心越來越大,并消耗著地球上難以想象的巨大能耗,但人類依然可能面臨著“數(shù)據(jù)無處存放”的境地。

因此,讓文件變小一點,這絕對是個值得投資的點子。

神劇《硅谷》劇組就選中了這個點子。在劇中,幾個主角的得以創(chuàng)業(yè)成功的核心算法——“魔笛”即是選中了“壓縮”這一多數(shù)人都能理解但對技術要求頗高的領域:允許用戶在線將圖片壓縮至一半的大小,并依然保持其清晰度。

“魔笛算法”也一度引發(fā)了不少跟風打造屬于自己的“魔笛手”,此外,包括谷歌等人工智能巨頭公司近年來也在這個領域頻頻發(fā)力。

2016年,谷歌相關團隊推出了一款叫RAISR(Rapid and Accurate Image Super-ResoluTIon)的圖像壓縮技術。希望以人工智能技術作為壓縮路徑,將圖片大小壓縮到源文件的1/4, 但基本不會改變圖片的清晰度。

盡管引來如此高的關注,但很多人還是不認可它會在未來的發(fā)展中取得壓倒性的優(yōu)勢。谷歌的RAISR算法也被不好業(yè)內(nèi)認識吐槽說“壓縮一張圖片耗時久”、“壓縮后圖片清晰度沒有那么高”等等。

谷歌機器學習工程師、Jetpac創(chuàng)始人Pete Warden近期發(fā)布了一篇文章,認為在短期內(nèi)壓縮算法可能會成為機器學習應用最可能出現(xiàn)的殺手級應用的領域,他從“壓縮”這一技術的起源開始,希望告訴大家問什么壓縮技術的前景是如此的廣闊。

大數(shù)據(jù)文摘對這篇文章進行了編譯。

OSDI上的一篇文章“神經(jīng)自適應型內(nèi)容感知互聯(lián)網(wǎng)視頻傳輸”激發(fā)了我對這一領域的興趣。

這篇文章告訴我們:通過神經(jīng)網(wǎng)絡,在帶寬相同的條件下,用戶體驗將能提高43%,或者在帶寬縮減17%的條件下可以保持體驗的質量基本不變。還有其他同類的論文將類似方法運用在了生成壓縮或自適應圖像壓縮等方面。他們都展示出了驚人的成果。那么,為何我們不把機器學習更廣泛地應用在文件壓縮方面呢?

我們尚未擁有性能配套的計算設備

上文所提到的所有方法都需要相對較大的神經(jīng)網(wǎng)絡,并且所需的計算量與像素數(shù)量成正比。這意味著大型圖片文件或每秒幀數(shù)較高的視頻文件可能需要比當前廣泛使用的移動設備更強的計算能力。

現(xiàn)行的大多數(shù)CPU每秒僅能處理百億級的運算,而在高清視頻上用機器學習進行壓縮很輕易便能達到十倍于此的計算量。

當然,好消息是目前我們已經(jīng)有了一些硬件解決方案,比如Edge TPU等,可以讓我們看到未來達到更多計算量的可能性。我期待這種壓縮方法能夠運用到各種類型文件的壓縮轉換上,從視頻到圖像,到音頻,乃至更多充滿想象力的方式。

自然語言是終極壓縮目標

近來機器學習在自然語言處理中取得了大量有趣的成果。這是另一個讓我覺得機器學習是較為優(yōu)越的壓縮轉換途徑的原因。

如果你稍稍觀察,便會發(fā)現(xiàn)字幕其實是將聲音壓縮為圖像的一種形式。我一直想做一個項目,試圖創(chuàng)造出一種相機,每秒生成一幀字幕,并將所有字幕逐一按行輸出至一個日志文件中。由此便可簡單記錄下基于相機的拍攝內(nèi)容隨時間的推移而發(fā)生的故事,這可以被定義為一個敘事類的傳感器。

我將這一技術歸類到壓縮方法中的原因是你可以通過生成性的神經(jīng)網(wǎng)絡將字幕還原為圖像。盡管重新生成的圖像不會跟原圖像完全一致,但也能夠從原圖像繼承一些信息。如果你希望結果與原圖像盡可能接近,你也可以從風格化方面考慮,例如為每個場景生成簡圖。這些技術的共同特征在于他們提取出了輸入文件中對于我們?nèi)祟愔匾牟糠郑⑹÷粤擞嘞碌牟糠帧?/p>

不僅僅是圖像

語言世界也有類似的趨勢。語音識別正在迅速改進,合成語音的能力也在迅速提高。識別可以看作是將音頻壓縮為自然語言文本的過程,而合成則恰好相反。你可以想象將對話高度壓縮為自然語言文字而非音頻。誠然,我們不需要達到那種要求,但似乎通過擴展我們對于表達的認知類型,我們可以實現(xiàn)在低帶寬情況下的更好的結果。

我甚至還發(fā)現(xiàn)一些有趣的將機器學習應用在文本本身上的可能性。Andrej Karpathy的CHAR-RNN(遞歸神經(jīng)網(wǎng)絡)展示了神經(jīng)網(wǎng)絡對某些模板進行模仿的優(yōu)越性,而對于壓縮技術來說,預測也是相同的道理??紤]到普通的HTML頁面有不少冗余,這一情況下GZIP壓縮方法似乎有很大機率能被機器學習改進,盡管我認為這沒有機器學習對文本的處理那么容易。

對于壓縮的研究已立項撥款

在我創(chuàng)業(yè)期間,營銷失敗的經(jīng)歷讓我學到了一件事:如果已經(jīng)有一筆預算要購買你所推銷的產(chǎn)品,該產(chǎn)品的銷售會容易得多。預算的存在意味著公司在是否應該花錢購買解決方案上已經(jīng)贏得了艱難的斗爭,現(xiàn)在唯一的問題是購買哪種解決方案。

這也是我認為機器學習可以在這個領域取得巨大突破的原因之一,因為制造商已經(jīng)擁有專門用于視頻和音頻壓縮的工程師、資金和芯片。如果我們能夠證明將機器學習添加到現(xiàn)有解決方案中能夠以一些可度量的方式(例如質量、速度或功耗)改進它們,那么它們將被快速采用。

帶寬將會花費用戶和運營商的大量的成本,質量和電池壽命將會成為產(chǎn)品的賣點,因此采用機器學習改進壓縮的優(yōu)勢將比其他運用更為顯而易見。

許多激動人心的研究表明這種方式將會非常高效,而且我樂觀地認為還有許多應用尚未被發(fā)掘。我希望機器學習在壓縮中的應用將發(fā)展成為一門核心技術。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6080

    瀏覽量

    104372
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4717

    瀏覽量

    100015
  • 機器學習
    +關注

    關注

    66

    文章

    8306

    瀏覽量

    131847

原文標題:被《硅谷》選中的“壓縮算法”,為什么說下一個機器學習殺手應用將由此誕生

文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    差動放大器通常是應用在什么場合?

    請問下差動放大器通常是應用在什么場合?
    發(fā)表于 09-19 06:35

    OPA241一般應用在什么場合?OPA241能否放大微小電流信號?

    OPA241一般應用在什么場合? 電路中的傳感器輸出信號為0-300nA,嘗試過很多次,使用OPA241無法放大該信號,輸出端無輸出,請問有人遇到類似情況嗎? 一些說明(請見下圖): 1)傳感器
    發(fā)表于 09-14 07:23

    遙感可以應用在哪些方面

    遙感技術是一種通過衛(wèi)星、飛機或其他載體上的傳感器,從遠距離獲取地球表面信息的技術。它在多個領域有著廣泛的應用,以下是一些主要的應用領域,以及每個領域的簡要介紹: 環(huán)境監(jiān)測 :遙感技術可以用來監(jiān)測森林
    的頭像 發(fā)表于 09-04 14:36 ?218次閱讀

    智慧安防綜合平臺應用在哪些場景

    平臺應用在哪些場景?下面我們就一起來看看吧! 首先,在城市安全管理方面,智慧安防綜合平臺可用于公共區(qū)域監(jiān)測,例如道路交通監(jiān)控、城市監(jiān)控中心、公園和廣場安全,有效預防和處理交通事故、違規(guī)行為、治安事件等。此外,
    的頭像 發(fā)表于 06-14 15:23 ?318次閱讀

    應用在隔離的IGBT模塊中的光電耦合器

    應用在隔離的IGBT模塊中的光電耦合器 IGBT(Insulated Gate Bipolar Transistor),絕緣柵雙極型晶體管,是由BJT(雙極型三極管)和MOS(絕緣柵型場效應管
    的頭像 發(fā)表于 04-29 11:39 ?480次閱讀
    <b class='flag-5'>應用在</b>隔離的IGBT模塊中的光電耦合器

    請問ADA4302-4適合應用在差分的CVBS信號的分拆嗎?

    請問ADA4302-4適合應用在差分的CVBS信號的分拆么?如果適合,除了手冊之外還有其他文檔供使用么?或者使用過程中需要注意哪些內(nèi)容
    發(fā)表于 12-18 06:44

    熱重差熱分析儀應用在哪些方面

    熱重差熱分析儀是在升溫、恒溫或降溫過程中,觀察樣品的質量隨溫度或時間變化,主要用于研究材料的熱穩(wěn)定性和組份。熱重差熱分析儀被廣泛應用在塑料、涂料、藥品、金屬材料和無機材料等。熱重差熱分析儀應用在哪些方面
    的頭像 發(fā)表于 12-12 14:23 ?739次閱讀
    熱重差熱分析儀<b class='flag-5'>應用在哪些方面</b>

    為何我們需要對交換機進行VLAN的劃分?

    為何我們需要對交換機進行VLAN的劃分? 在網(wǎng)絡通信中,VLAN(虛擬局域網(wǎng))是一種將一個物理網(wǎng)絡劃分成多個邏輯上的局域網(wǎng)的技術。通過將不同的設備劃分至不同的VLAN中,可以實現(xiàn)不同VLAN之間
    的頭像 發(fā)表于 11-28 15:10 ?1192次閱讀

    數(shù)字隔離器可應用在本質安全應用中

    電子發(fā)燒友網(wǎng)站提供《數(shù)字隔離器可應用在本質安全應用中.pdf》資料免費下載
    發(fā)表于 11-24 10:24 ?1次下載
    數(shù)字隔離器可<b class='flag-5'>應用在</b>本質安全應用中

    使用400Hz中頻電源的正確方法是什么?主要是應用在哪些方面?

    使用400Hz中頻電源的正確方法是什么?主要是應用在哪些方面? 400Hz中頻電源是一種特殊的電源系統(tǒng),其輸出頻率為400赫茲,相比傳統(tǒng)的50赫茲或60赫茲電源系統(tǒng),它具有更高的頻率。本文將詳細
    的頭像 發(fā)表于 11-16 11:23 ?1194次閱讀

    機器學習技術在智能制造應用實例

    智能制造應用在工業(yè)領域中,可實現(xiàn)自動化作業(yè),在企業(yè)生產(chǎn)與產(chǎn)線管理和設備控制方面有良好的效果。智能制造以機器學習技術作為支撐。
    發(fā)表于 10-27 09:29 ?709次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>技術在智能制造應用實例

    傾倒開關應用在電風扇上有哪些優(yōu)勢

    隨著科技的不斷發(fā)展,電風扇在我們的生活中扮演了越來越重要的角色。無論是炎炎夏日還是熱帶雨林,電風扇都能為我們帶來清涼舒適的感覺。近年來,傾倒開關的應用在電風扇的設計中越來越常見,那么,傾倒開關
    的頭像 發(fā)表于 10-18 14:59 ?553次閱讀
    傾倒開關<b class='flag-5'>應用在</b>電風扇上有哪些優(yōu)勢

    sharp lz9gh236一般應用在哪個方面上?

    求助sharp lz9gh236一般應用在哪個方面
    發(fā)表于 10-17 07:11

    java中的壓縮文件是如何解壓與壓縮

    (String name):表示壓縮文件中的一個文件或者目錄 void putNextEntry(ZipEntry e):寫入新的壓縮文件或者目錄 ZipIutputStream:是一種
    的頭像 發(fā)表于 10-10 15:49 ?737次閱讀

    為什么高斯濾波廣泛應用在圖像處理中?

    為什么高斯濾波廣泛應用在圖像處理中
    發(fā)表于 10-09 06:31