0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

《深度學習平臺支撐產(chǎn)業(yè)智能化》百度CTO王海峰CNCC2019深度解讀

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:通信信號處理研究所 ? 2019-11-20 15:15 ? 次閱讀

10 月 17 日-19 日,2019 年中國計算機大會(CNCC2019)在蘇州舉辦,本屆大會以「智能+引領社會發(fā)展」為主題,1000 家機構(gòu)的代表、8000 余人參展參會。百度首席技術(shù)官王海峰在會上發(fā)表題為《深度學習平臺支撐產(chǎn)業(yè)智能化》的演講,分享了百度關(guān)于深度學習技術(shù)推動人工智能發(fā)展及產(chǎn)業(yè)化應用的思考,并深度解讀百度飛槳深度學習平臺的優(yōu)勢,以及與百度智能云結(jié)合助力產(chǎn)業(yè)智能化的成果。

以下為演講實錄: 各位專家,各位來賓大家上午好!非常榮幸有機會參加世界計算機大會,非常感謝中國計算機學會及大會的邀請。今天我跟大家分享的題目是《深度學習平臺支撐產(chǎn)業(yè)智能化》。 我們都知道,從 18 世紀 60 年代開始,人類已經(jīng)經(jīng)歷了三次工業(yè)革命。第一次工業(yè)革命為我們帶來了機械技術(shù),第二次帶來了電氣技術(shù),第三次帶來了信息技術(shù)。我們回顧這三次工業(yè)革命的歷史會發(fā)現(xiàn),驅(qū)動每一次工業(yè)革命的核心技術(shù)都有非常強的通用性。雖然它可能是從某一個行業(yè)開始,比如機械技術(shù)最開始從紡織等行業(yè)開始,但最后都會應用于生產(chǎn)生活的方方面面,有非常強的通用性。除了通用性以外,這些技術(shù)都會推動人類進入一個新的工業(yè)大生產(chǎn)階段,而支撐這個工業(yè)大生產(chǎn)的技術(shù)有幾個特點:標準化、自動化、模塊化。而我們現(xiàn)在正處于第四次工業(yè)革命的開端,人工智能則是新一輪科技革命和產(chǎn)業(yè)變革的一個核心驅(qū)動力量。人工智能會推動我們?nèi)祟惿鐣饾u進入智能時代。 回顧人工智能技術(shù)的發(fā)展,人工智能技術(shù)的發(fā)展階段有很多分類維度,我理解大概可以歸結(jié)為:最早期更多都是在用人工的規(guī)則,我 26 年前進入這一行的時候,其實也是在用人工規(guī)則來開發(fā)機器翻譯系統(tǒng);后來逐漸開始機器學習,尤其是統(tǒng)計機器學習,在很長的一段時間里占主流地位,也產(chǎn)生了很大的影響,帶來了很多應用產(chǎn)業(yè)的價值;深度學習是機器學習的一個子方向,現(xiàn)在,深度學習逐漸成為新一代人工智能最核心的技術(shù)。

舉幾個例子,文字識別 OCR 技術(shù)早期是用規(guī)則+機器學習的方法來做,那時候,一個 OCR 技術(shù)系統(tǒng)可能會分為幾部分,從區(qū)域檢測、行分割、字分割、單字識別、語言模型解碼、后處理等一步步做下來。加入深度學習技術(shù)后,我們開始使用大數(shù)據(jù)進行訓練,而且階段目標也很明確,我們找到一些深度學習的特征,這個時候一個 OCR 系統(tǒng)就簡化到只需要檢測、識別兩個過程,典型的基于深度學習的 OCR 系統(tǒng)大概是這樣。隨著深度學習技術(shù)進一步發(fā)展,我們開始在 OCR 里面進行多任務的聯(lián)合訓練、端到端學習、特征復用/互補,這個時候,甚至這兩個階段也不用區(qū)分了,而是一體化地就把一個文字識別的任務給做了。 我們再看機器翻譯。26 年以前我進入人工智能領域就是在做機器翻譯,當時我們用數(shù)以萬計的規(guī)則寫出一個翻譯系統(tǒng),其中包括很多語言專家的工作。20 多年以前,我們做的這個系統(tǒng)曾得到全國比賽的第一,但是這個系統(tǒng)想繼續(xù)發(fā)展,進入一個大規(guī)模產(chǎn)業(yè)化的階段,仍然面臨著很多問題。比如說人工規(guī)則費時費力,而且隨著規(guī)則的增加,沖突也越來越嚴重,掛一漏萬,總是很難把所有的語言現(xiàn)象都覆蓋到。后來,統(tǒng)計機器翻譯在機器翻譯領域占據(jù)最主流技術(shù)的地位,像百度翻譯八年以前上線的第一個版本的系統(tǒng),其實就是統(tǒng)計機器翻譯。統(tǒng)計機器翻譯的過程當中,仍然要一步一步來做,比如說先做統(tǒng)計的詞對齊,然后做短語的提取,再做結(jié)構(gòu)的對齊等等,其中也涉及到人工特征的提取、定向的優(yōu)化,仍然很復雜。大概四年多以前,百度上線了世界上第一個大規(guī)模的、基于神經(jīng)網(wǎng)絡的翻譯產(chǎn)品,這時候我們可以進行端到端的學習了。當然了,這樣一個神經(jīng)網(wǎng)絡,或者說是深度學習的系統(tǒng),也有它的不足之處,現(xiàn)在真正在線上跑的、每天服務數(shù)以億計人的翻譯系統(tǒng),其實是以神經(jīng)網(wǎng)絡的機器翻譯方法為主體,同時融合了一些規(guī)則、統(tǒng)計的技術(shù)。 剛才說起,隨著深度學習的發(fā)展,這些技術(shù)越來越標準化、自動化。大家可以看到深度學習有一個很重要的特點,就是通用性。我們之前做機器學習的時候,有非常多的模型大家都耳熟能詳,比如說 SVM、CRF 等等。深度學習出現(xiàn)以后,人們發(fā)現(xiàn),幾乎我們看到的各種問題它都能很不錯的解決,甚至能得到目前最佳的解決效果,這和以前的模型各有擅長不一樣,它具有很強的通用性。 深度學習所處的位置,一方面它會向下對接芯片,像我們開發(fā)的深度學習框架,也會跟各個芯片廠商聯(lián)合進行優(yōu)化,前天我們還跟華為芯片一起做了一個聯(lián)合優(yōu)化的發(fā)布;向上它會承接各種應用,不管是各種模型,還是真正的產(chǎn)品。所以我們認為深度學習框架會是智能時代的一個操作系統(tǒng)。 我們真正把深度學習大規(guī)模產(chǎn)業(yè)化的時候,也會面臨一些要解決的問題,比如說,開發(fā)這樣一個深度學習的模型或者是系統(tǒng),實現(xiàn)起來很復雜,開發(fā)效率很低,也很不容易;而在訓練的時候,我們在真正工業(yè)大生產(chǎn)中用的這些模型,比如說百度的產(chǎn)品,都是非常龐大的模型,進行超大的模型訓練很困難;到了部署階段,還要考慮推理速度是不是夠快,以及部署成本是不是可控合理。 針對這幾個方面,我們開發(fā)了百度的深度學習平臺「飛槳」,英文我們叫 PaddlePaddle。我們認為它已經(jīng)符合標準化、自動化、模塊化的工業(yè)大生產(chǎn)特征。

飛槳底層的核心框架包括開發(fā)、訓練、預測。開發(fā)既可以支持動態(tài)圖,也可以支持靜態(tài)圖;訓練可以支持大規(guī)模的分布式訓練,也可以支持這種工業(yè)級的數(shù)據(jù)處理;同時可以有不同版本部署在服務器上、在端上,以及做非常高效的壓縮、安全加密等等。核心框架之上有很多基礎模型庫,比如說自然語言處理的基礎模型庫、計算機視覺的基礎模型庫等等。同時也會提供一些開發(fā)的套件,再往上會有各種工具組件,比如說網(wǎng)絡的自動訓練、遷移學習、強化學習、多任務學習等等。此外,為了真正支撐各行各業(yè)的應用,我們提供很多使用者不需要理解底層這些技術(shù)、可以直接調(diào)用的服務平臺。比如 EasyDL,就是可以定制化訓練和服務的,基本上可以不用了解深度學習背后的原理,零門檻就可以用它來開發(fā)自己的應用;AI Studio 則是一個實訓平臺,很多大學也在用這樣的平臺上課、學習;當然,還包括端計算模型生成平臺。 飛槳是一個非常龐大的平臺,我們著重在四方面發(fā)力、且具有領先性的技術(shù)。 首先從開發(fā)的角度,我們提供一個開發(fā)便捷的深度學習框架;而從訓練的角度,可以支持超大規(guī)模的訓練;從部署的角度,可以進行多端、多平臺的高性能推理引擎的部署;同時提供很多產(chǎn)業(yè)級的模型庫。

從開發(fā)的角度,飛槳提供一個開發(fā)便捷的深度學習框架。一方面,大家知道這些軟件系統(tǒng)都是很多程序員在寫,程序員有自己寫程序的習慣,我們這種組網(wǎng)式的編程范式與程序員的開發(fā)習慣非常一致,程序員開發(fā)起來會很有效率,而且也很容易上手;另外一個方面是設計網(wǎng)絡結(jié)構(gòu),深度學習發(fā)展很多年,多數(shù)深度學習的系統(tǒng)網(wǎng)絡都是人類專家來設計的,但是,設計網(wǎng)絡結(jié)構(gòu)是很專、很不容易的一件事情。所以,我們開發(fā)網(wǎng)絡結(jié)構(gòu)的自動設計?,F(xiàn)在機器自動設計的網(wǎng)絡,在很多情況下已經(jīng)比人類專家設計的網(wǎng)絡得到的效果還好。 另一個方面,大規(guī)模訓練面臨的挑戰(zhàn)。飛槳支持超大規(guī)模的特征、訓練數(shù)據(jù)、模型參數(shù)、流式學習等等。我們開發(fā)的這套系統(tǒng)現(xiàn)在已經(jīng)可以支持萬億級參數(shù)模型,不止是能支持這樣的訓練,同時可以支持實時的更新。 說到多端多平臺,飛槳能很好的支撐從服務器到端、不同的操作系統(tǒng)之間,甚至不同框架之間的無縫銜接。這里是一些具體的數(shù)據(jù),大家可以看到,我們通用架構(gòu)的推理,它的速度是非常快的。同時,剛才我提到的跟華為的合作,我們針對華為的 NPU 做了定向的優(yōu)化,使它的推理速度得到進一步的提升。 另外一方面,所有這些基礎框架,與真正的開發(fā)應用之間還有一步,我們定向地為不同的典型應用提供很多官方的模型庫,比如說語言理解的、增強學習的、視覺的等等。飛槳的這些模型都在大規(guī)模的應用中得到過驗證,同時我們也在一些國際的比賽中測試了這些模型,奪得了很多個第一。 剛才講的是基本的框架模型等等,另一方面,我們還有完備的工具組件,以及面向任務的開發(fā)套件,以及產(chǎn)業(yè)級的服務平臺。 舉幾個例子,比如說語言理解,大家知道現(xiàn)在語言理解,我們也都基于深度學習框架來做,像百度的 ERNIE。一方面,我們現(xiàn)在用的深度學習技術(shù)是從海量的數(shù)據(jù)里進行學習,但是它沒有知識作為前提。百度開發(fā)了一個非常龐大的,有 3000 多億個事實的知識圖譜,我們用知識來增強基于深度學習的語言理解框架,就產(chǎn)生了 ERNIE。另一方面,我們又加入了持續(xù)學習的技術(shù),從而讓 ERNIE 有一個非常好的表現(xiàn)。下面淺藍色的線是現(xiàn)在 SOTA 最好的結(jié)果,我們用 ERNIE+百科知識——我們知識圖譜也有很多來源——加進去以后,大家可以看到有很明顯的提升。我們更高興地看到,持續(xù)加入不同的知識,比如加入對話知識、篇章結(jié)構(gòu)知識等等,這個系統(tǒng)還可以進一步提升它的性能。 這是前面講的一系列套件之一,可以零門檻進入的定制化訓練和服務平臺。我們這些平臺,希望能降低門檻,幫助各行各業(yè)來加速整個技術(shù)創(chuàng)新?,F(xiàn)在大概是什么狀態(tài)呢?現(xiàn)在我們已經(jīng)服務了 150 多萬的開發(fā)者,其中包括超過 6.5 萬個企業(yè)。在這個平臺上,他們自己訓練了已經(jīng)有 16.9 萬個模型。 飛槳深度學習開源開放平臺跟百度的智能云也有很好的結(jié)合,依托云服務更多的客戶,讓 AI 可以賦能各行各業(yè)。這里有一些例子,比如說在農(nóng)業(yè),我們幫助水培蔬菜的智能種植;在林業(yè),幫助病蟲害的監(jiān)測識別;以及公共場所的控煙、商品銷售的預測、人力資源系統(tǒng)的自動匹配、制造業(yè)零件的分揀,以及地震波、藏油預測,以及更廣泛地覆蓋通訊行業(yè)、地產(chǎn)、汽車等等領域,各行各業(yè)都基于這個平臺都得到了智能化的升級。

比如水培蔬菜智能種植,我們通過深度學習平臺支持它進行長勢分析、水培方案的精調(diào)、環(huán)境的控制,使產(chǎn)量得以提高,同時成本得以降低。智能蟲情監(jiān)測也是一樣,系統(tǒng)的識別準確率已經(jīng)相當于人類專家的水平,而且監(jiān)控的周期也從一周縮短到一小時。

精密零件智能分揀的案例中,我們真正用這個深度學習系統(tǒng)的時候,還是有不少事情要做,比如說如何選擇分揀的模型,中間也會涉及一些數(shù)據(jù)的標注,尤其是一些錯誤 case 的積累等等,然后在飛槳平臺上進行訓練升級。 這是一個工業(yè)安全生產(chǎn)監(jiān)控的例子,昨天在另一個會上,有一個來賓問我,他們特別想在一些場景下,監(jiān)控一些不當?shù)沫h(huán)節(jié),比如說生產(chǎn)環(huán)境里打手機、抽煙、躍過護欄等等。這些都可以通過飛槳的平臺自動實現(xiàn)。

在其他的行業(yè)中,比如國家重大工程用地的檢測,智慧司法,以及 AI 眼底篩查都在應用飛槳,還有很多有溫度的案例,比如 AI 尋人,一個孩子 4 歲的時候離家走失,27 年以后,通過人臉比對技術(shù),又幫助這個家庭把孩子找回來了,實現(xiàn)了家庭的團聚。截止到今年 6 月,百度 AI 尋人已經(jīng)幫助 6700 個家庭團圓。除此之外,還有 AI 助盲行動、AI 助老兵圓夢等等這些案例。

回到深度學習,剛才我說,各行各業(yè)都會從其中受益,實現(xiàn)自己的智能化升級。這是一個第三方的報告,我們可以看到,深度學習給不同的行業(yè)都會帶來提升,平均大概是 62% 的水平。 這就是我今天要分享的。百度的飛槳深度學習平臺非常愿意跟大家一起,幫助大家實現(xiàn)自己行業(yè)的智能化升級,推動人工智能的發(fā)展,謝謝大家!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能化
    +關(guān)注

    關(guān)注

    15

    文章

    4693

    瀏覽量

    54919
  • 工業(yè)革命
    +關(guān)注

    關(guān)注

    0

    文章

    107

    瀏覽量

    15766
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5422

    瀏覽量

    120603

原文標題:深度學習如何大規(guī)模產(chǎn)業(yè)化?百度CTO王海峰CNCC2019深度解讀

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    深度學習算法在嵌入式平臺上的部署

    隨著人工智能技術(shù)的飛速發(fā)展,深度學習算法在各個領域的應用日益廣泛。然而,將深度學習算法部署到資源受限的嵌入式
    的頭像 發(fā)表于 07-15 10:03 ?760次閱讀

    百度推出全新智能代碼助手文心快碼,引領編碼效率新革命

    在6月28日的百度WAVE SUMMIT深度學習開發(fā)者大會上,百度公司宣布了其旗下備受矚目的智能代碼助手Baidu Comate的正式中文名
    的頭像 發(fā)表于 06-29 16:26 ?747次閱讀

    百度發(fā)布文心大模型4.0 Turbo與飛槳框架3.0,引領AI技術(shù)新篇章

    在科技飛速發(fā)展的今天,人工智能(AI)技術(shù)已成為推動社會進步的重要力量。6月28日,百度公司再次站在了AI技術(shù)的前沿,其首席技術(shù)官、深度學習技術(shù)及應用國家工程研究中心主任
    的頭像 發(fā)表于 06-29 16:03 ?507次閱讀

    百度文心大模型4.0 Turbo,正式發(fā)布 用戶規(guī)模已達3億

    “文心一言累計用戶規(guī)模已達3億,日調(diào)用次數(shù)也達到了5億?!?月28日,百度首席技術(shù)官、深度學習技術(shù)及應用國家工程研究中心主任海峰在WAVE
    的頭像 發(fā)表于 06-29 10:06 ?726次閱讀

    百度WAVE SUMMIT深度學習開發(fā)者大會,文心大模型4.0 Turbo震撼發(fā)布

    6月28日,科技界的目光聚焦在了百度WAVE SUMMIT深度學習開發(fā)者大會上,這場盛會不僅是技術(shù)交流的盛宴,更是百度展示其在人工智能領域最
    的頭像 發(fā)表于 06-28 16:30 ?388次閱讀

    百度海峰百度人工智能專利申請量、授權(quán)量國內(nèi)第一

    2024年4月25日,在第24個世界知識產(chǎn)權(quán)日來臨之際,百度舉辦“專利運用賦能AI產(chǎn)業(yè)高質(zhì)量發(fā)展”論壇。
    的頭像 發(fā)表于 04-26 09:32 ?323次閱讀

    百度Apollo汽車智能化產(chǎn)品發(fā)布會

    百度Apollo汽車智能化產(chǎn)品發(fā)布會
    的頭像 發(fā)表于 04-20 14:28 ?1548次閱讀
    <b class='flag-5'>百度</b>Apollo汽車<b class='flag-5'>智能化</b>產(chǎn)品發(fā)布會

    百度首席技術(shù)官海峰解讀文心大模型的關(guān)鍵技術(shù)和最新進展

    4月16日,以“創(chuàng)造未來”為主題的Create 2024百度AI開發(fā)者大會在深圳國際會展中心成功舉辦。百度首席技術(shù)官海峰以“技術(shù)筑基,星河璀璨”為題,發(fā)表演講,
    的頭像 發(fā)表于 04-18 09:20 ?551次閱讀
    <b class='flag-5'>百度</b>首席技術(shù)官<b class='flag-5'>王</b><b class='flag-5'>海峰</b><b class='flag-5'>解讀</b>文心大模型的關(guān)鍵技術(shù)和最新進展

    百度智能云攜手烏鎮(zhèn)共建AI數(shù)據(jù)產(chǎn)業(yè)基地

    近日,百度智能云與桐鄉(xiāng)市烏鎮(zhèn)大數(shù)據(jù)高新技術(shù)產(chǎn)業(yè)園區(qū)簽署合作協(xié)議,雙方將發(fā)揮各自優(yōu)勢,以人工智能標注產(chǎn)業(yè)為基礎,共建
    的頭像 發(fā)表于 04-01 16:12 ?485次閱讀

    一圖講透百度智能云千帆大模型平臺全面升級!

    【一圖講透】百度智能云千帆大模型平臺全面升級!
    的頭像 發(fā)表于 03-22 10:44 ?371次閱讀
    一圖講透<b class='flag-5'>百度</b><b class='flag-5'>智能</b>云千帆大模型<b class='flag-5'>平臺</b>全面升級!

    百度云鵬:自動駕駛終于迎來“曙光初現(xiàn)”

    3月16日,在中國電動汽車人會論壇(2024)的高層論壇上,百度集團副總裁、智能駕駛事業(yè)群組總裁云鵬發(fā)表主旨演講,分享了百度Apollo
    的頭像 發(fā)表于 03-18 10:08 ?995次閱讀

    百度發(fā)布Apollo開放平臺9.0

    在2023年的12月19日,百度正式發(fā)布了Apollo開放平臺的全新版本——Apollo開放平臺9.0。這一版本的推出,源于團隊在8.0至9.0的開發(fā)過程中,對12萬行代碼進行了重構(gòu),并新增了20萬行代碼。這次的升級不僅代表了技
    的頭像 發(fā)表于 01-02 16:18 ?1044次閱讀

    世界互聯(lián)網(wǎng)大會看點 百度CTO海峰透露文心一言用戶已達7000萬

    11月8日-10日,以“建設包容、普惠、有韌性的數(shù)字世界——攜手構(gòu)建網(wǎng)絡空間命運共同體”為主題的2023年世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會成功舉辦。今年是烏鎮(zhèn)峰會舉辦的第十年,百度首席技術(shù)官、深度學習技術(shù)
    的頭像 發(fā)表于 11-10 09:37 ?690次閱讀
    世界互聯(lián)網(wǎng)大會看點 <b class='flag-5'>百度</b><b class='flag-5'>CTO</b><b class='flag-5'>王</b><b class='flag-5'>海峰</b>透露文心一言用戶已達7000萬

    百度發(fā)布首個量子領域大模型,依托量子平臺、文心大模型

    據(jù)報道,百度雙邊平臺和文新大型模式的雙重底的優(yōu)勢為基礎,百度是芯片層、框架層、模型層以及應用層等整個堆棧技術(shù)雙邊技術(shù)和大型模式加快深度融合為目標的首次雙邊領域發(fā)表了大模型。
    的頭像 發(fā)表于 09-26 11:09 ?1021次閱讀

    百度發(fā)布首個量子領域大模型及百度量子助手

    ? 9月23-24日,以“協(xié)同創(chuàng)新 量點未來”為主題,2023量子產(chǎn)業(yè)大會在安徽合肥召開。量子領域院士專家、智庫機構(gòu)、產(chǎn)業(yè)界嘉賓匯聚一堂,探討量子產(chǎn)業(yè)化之路。 作為主旨報告嘉賓,百度
    的頭像 發(fā)表于 09-26 09:53 ?702次閱讀