0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

TensorFlow 2.4來了 帶來了多項新特性和功能改進

新機器視覺 ? 來源:新機器視覺 ? 作者:機器之心 ? 2020-12-26 11:38 ? 次閱讀

谷歌正式發(fā)布了 TensorFlow 2.4,帶來了多項新特性和功能改進。

TensorFlow 2.4 的更新包括對于分布式訓練和混合精度的新功能支持,對 NumPy API 子集的試驗性支持以及一些用于監(jiān)測性能瓶頸的新工具。 根據(jù) TensorFlow 官方博客,本次更新的主要內(nèi)容整理如下:

tf.distribute 中的新功能

參數(shù)服務器策略 在 TensorFlow 2.4 中,tf.distribute 模塊引入了對使用 ParameterServerStrategy 和自定義訓練循環(huán)進行模型異步訓練的試驗性支持。和 MultiWorkerMirroredStrategy 類似,ParameterServerStrategy 是一種多工作器(multi-worker)數(shù)據(jù)并行策略,但梯度更新是異步的。 參數(shù)服務器訓練集群由工作服務器和參數(shù)服務器組成。變量在參數(shù)服務器上創(chuàng)建,然后在每個步驟中由工作器讀取和更新。

變量的讀取和更新在工作器之間是獨立進行的,不存在任何同步。由于工作器彼此不依賴,因此該策略具有工作器容錯的優(yōu)勢,如果使用可搶占 VM,該策略將很有用。 多工作器鏡像策略 MultiWorkerMirroredStrategy 已經(jīng)脫離試驗階段,成為穩(wěn)定的 API。像單工作器的 MirroredStrategy 一樣,MultiWorkerMirroredStrategy 通過同步數(shù)據(jù)并行實現(xiàn)分布式訓練,顧名思義,借助 MultiWorkerMirroredStrategy 可以在多臺機器上進行訓練,每臺機器都可能具有多個 GPU。

Keras 更新

混合精度 在 TensorFlow 2.4 中,Keras 混合精度 API 已經(jīng)脫離試驗階段,成為穩(wěn)定的 API。大多數(shù) TensorFlow 模型使用 float32 dtype,但現(xiàn)在有些低精度數(shù)據(jù)類型占用的內(nèi)存更少,比如 float16?;旌暇戎傅氖窃谕荒P椭惺褂?16 位和 32 位浮點數(shù)以進行更快的訓練。這一 API 可將模型性能在 GPU 上提高到 3 倍,在 TPU 上提高 60%。

要使用混合精度 API,必須使用 Keras 層和優(yōu)化器,但不一定需要使用其他 Keras 類。 優(yōu)化器 本次更新包括重構 tf.keras.optimizers.Optimizer 類,讓 model.fit 的用戶和自定義訓練循環(huán)的用戶能夠編寫可與任何優(yōu)化器一起使用的訓練代碼。所有內(nèi)置 tf.keras.optimizer.Optimizer 子類都可接受 gradient_transformers 和 gradient_aggregator 參數(shù),輕松定義自定義梯度變換。 重構之后,使用者可以在編寫自定義訓練循環(huán)時直接將損失張量傳遞給 Optimizer.minimize:

pIYBAF_msJqARmysAABBsgUGUmE079.jpg

這些更新的目標是讓 Model.fit 和自定義訓練循環(huán)與優(yōu)化器細節(jié)更加不相關,從而讓使用者無需修改即可編寫出與任何優(yōu)化器共同使用的訓練代碼。 最后,TensorFlow 2.4 的更新還包括 Keras Functional API 內(nèi)部的重構,改善了函數(shù)式模型構造所產(chǎn)生的內(nèi)存消耗并簡化了觸發(fā)邏輯。這種重構可以保證 TensorFlowOpLayers 的行為可預測,并且可以使用 CompositeTensor 類型簽名(type signature)。

tf.experimental.numpy

TensorFlow 2.4 引入了對 NumPy API 子集的試驗性支持。該模塊可以運行由 TensorFlow 加速的 NumPy 代碼,由于這一 API 是基于 TensorFlow 構建的,因此可與 TensorFlow 無縫銜接,允許訪問所有 TensorFlow API 并通過編譯和自動矢量化提供優(yōu)化后的運行。 例如,TensorFlow ND 數(shù)組可以與 NumPy 函數(shù)互通,類似地,TensorFlow NumPy 函數(shù)可以接受包括 tf.Tensor 和 np.ndarray 在內(nèi)的不同類型輸入。

o4YBAF_msK-AD0uIAABwAa2nu7U191.jpg

新的性能分析工具

TensorFlow Profiler 是度量 TensorFlow 模型的訓練性能和資源消耗情況的工具,用來診斷性能瓶頸,最終加快訓練速度。 此前,TensorFlow Profiler 支持多 GPU 單主機訓練。到了 2.4 版本,使用者可以測試 MultiWorkerMirroredStrategy 的訓練工作了,比如使用采樣模式 API 按需配置,并連接到 MultiWorkerMirroredStrategy 工作器正在使用的同一服務器。


另外,你可以通過向捕獲配置文件工具提供工作器地址來使用 TensorBoard 配置文件插件。配置之后,你可以使用新的 Pod Viewer tool 來選擇訓練步驟,并查看所有工作器上該步驟的 step-time 的細分。 TFLite Profiler TFLite Profiler 則支持在 Android 中跟蹤 TFLite 內(nèi)部信息,以識別性能瓶頸。

GPU 支持

TensorFlow 2.4 與 CUDA 11 和 cuDNN 8 配合運行,支持最新發(fā)布的英偉達安培架構 GPU,對于 CUDA 11 的新特性,可以參考英偉達開發(fā)者博客: https://developer.nvidia.com/blog/cuda-11-features-revealed/ 在新版本中,默認情況下會啟用安培 GPU 的新特性——對 TensorFloat-32 的支持。TensorFloat-32 又簡稱為 TF32,是英偉達 Ampere GPU 的一種數(shù)學精度模式,可導致某些 float32 運算(如矩陣乘法和卷積)在安培架構 GPU 上運行得更快,但精度略有降低。 若想更深入了解,可參閱文檔: https://www.tensorflow.org/api_docs/python/tf/config/experimental/enable_tensor_float_32_execution

責任編輯:xj

原文標題:TensorFlow 2.4來了:上線對分布式訓練和混合精度的新功能支持

文章出處:【微信公眾號:新機器視覺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)集

    關注

    4

    文章

    1197

    瀏覽量

    24538
  • tensorflow
    +關注

    關注

    13

    文章

    327

    瀏覽量

    60413

原文標題:TensorFlow 2.4來了:上線對分布式訓練和混合精度的新功能支持

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Vivado 2024.1版本的新特性(1)

    Vivado 2024.1已正式發(fā)布,今天我們就來看看新版本帶來了哪些新特性
    的頭像 發(fā)表于 09-18 10:30 ?165次閱讀
    Vivado 2024.1版本的新<b class='flag-5'>特性</b>(1)

    TensorFlow是什么?TensorFlow怎么用?

    術界和工業(yè)界都得到了廣泛的應用。它不僅支持大規(guī)模的數(shù)據(jù)處理,還提供自動微分、分布式訓練等高級功能,極大地簡化了深度學習任務的開發(fā)流程。
    的頭像 發(fā)表于 07-12 16:38 ?392次閱讀

    keras模型轉(zhuǎn)tensorflow session

    在這篇文章中,我們將討論如何將Keras模型轉(zhuǎn)換為TensorFlow session。 Keras和TensorFlow簡介 Keras是一個高級神經(jīng)網(wǎng)絡API,它提供一種簡單、快速的方式
    的頭像 發(fā)表于 07-05 09:36 ?316次閱讀

    驍銳安全光柵的主要特性功能

    驍銳安全光柵以其高精度檢測、安裝簡便、可靠性高和智能化升級等特性,以及多項功能,為工業(yè)生產(chǎn)帶來了全新的保障,成為守護安全的新勢力。
    的頭像 發(fā)表于 07-04 10:26 ?152次閱讀
    驍銳安全光柵的主要<b class='flag-5'>特性</b>與<b class='flag-5'>功能</b>

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    功能和實際應用。 GPT-4 turbo****的增強功能 ChatGPT-4o帶來了幾個值得注意的升級,增強了性能和可用性: · 更快的響應時間和更高的準確性: 是客戶服務和其他快節(jié)奏環(huán)境中所
    發(fā)表于 05-27 15:43

    OpenAI的AI搜索也要來了,但我們需要這么多AI搜索么

    OpenAI要做AI搜索挑戰(zhàn)谷歌這件事已經(jīng)傳很久,傳說中的SearchGPT似乎真的要來了。據(jù)軟件開發(fā)者TiborBlaho爆料,OpenAI的AI搜索產(chǎn)品Sonic-SNC(SearchGPT
    的頭像 發(fā)表于 05-10 08:05 ?348次閱讀
    OpenAI的AI搜索也要<b class='flag-5'>來了</b>,但我們需要這么多AI搜索么

    智慧燈桿有什么功能?

    智慧燈桿作為一種集成了多種功能的城市基礎設施,近年來在城市建設中越來越受到重視。它不僅能夠提供照明功能,還融合通信、監(jiān)控、信息發(fā)布等多項技術,為城市管理和市民生活
    的頭像 發(fā)表于 04-28 16:55 ?252次閱讀

    來看看藍牙 5.4 版帶來了一些新的有趣功能

    Bluetooth SIG 的 Bluetooth? v5.4 核心規(guī)范為支持 Bluetooth 的物聯(lián)網(wǎng)設備帶來了多項優(yōu)勢,重點是增強了通信能力、安全性和效率。這些改進尤其適用于涉及大量設備
    的頭像 發(fā)表于 04-23 14:52 ?3027次閱讀
    來看看藍牙 5.4 版<b class='flag-5'>帶來了</b>一些新的有趣<b class='flag-5'>功能</b>

    基于TensorFlow和Keras的圖像識別

    ,讓我們先花點時間來了解一些術語。TensorFlow/KerasTensorFlow是GoogleBrain團隊創(chuàng)建的一個Python開源庫,它包含許多算法和模型
    的頭像 發(fā)表于 01-13 08:27 ?664次閱讀
    基于<b class='flag-5'>TensorFlow</b>和Keras的圖像識別

    WiFi6工業(yè)網(wǎng)關能為工業(yè)物聯(lián)網(wǎng)帶來哪些改進?

    WiFi 6( 802.11ax)比其前身WiFi 5(802.11ac)帶來了多項改進,例如更快的通信速率、更大的帶寬容量、在多設備連入時更穩(wěn)定的性能、更大的鏈接范圍、增強的安全性以及更好地支持物聯(lián)網(wǎng)工作負載等,本篇就為大家簡
    的頭像 發(fā)表于 01-08 17:16 ?763次閱讀
    WiFi6工業(yè)網(wǎng)關能為工業(yè)物聯(lián)網(wǎng)<b class='flag-5'>帶來</b>哪些<b class='flag-5'>改進</b>?

    FPGA為嵌入式設計帶來了強大的功能與靈活性

    盡管 FPGA 為嵌入式設計帶來了強大的功能與靈活性,但額外的開發(fā)流程也給設計工作增加了新的復雜性和限制問題。整合傳統(tǒng)的硬件-FPGA-軟件設計流程并充分利用 FPGA 的可再編程功能是我們的一個
    的頭像 發(fā)表于 12-07 09:35 ?397次閱讀

    GNSS技術為自動駕駛帶來了什么?

    GNSS技術為自動駕駛帶來了什么?
    的頭像 發(fā)表于 12-04 17:44 ?414次閱讀

    Sublime Text 4 Build 4169文本編輯器的新功能

    Sublime Text 4 Build 4169 帶來了改進的語法高亮、易于選擇字體、增量索引排序以及其他功能。
    的頭像 發(fā)表于 12-03 11:12 ?888次閱讀
    Sublime Text 4 Build 4169文本編輯器的新<b class='flag-5'>功能</b>

    紅外技術為AIoT領域帶來了哪些變革?

    AIoT(人工智能物聯(lián)網(wǎng))作為一個融合人工智能和物聯(lián)網(wǎng)技術的新興領域,引起了廣泛的關注。最近幾年,紅外技術在AIoT中的應用越來越顯著。這種融合為我們帶來了更智能、更高效的解決方案,并在多個領域
    的頭像 發(fā)表于 11-03 17:04 ?744次閱讀
    紅外技術為AIoT領域<b class='flag-5'>帶來了</b>哪些變革?

    鋰電池快充帶來了什么風險?鋰電池快充的風險有哪些?

    鋰電池快充技術問題,鋰電池快充帶來了什么風險?在遲遲發(fā)明不出來更好替代品的情況下,快充成為了臨時解決方案。
    發(fā)表于 10-20 17:20 ?502次閱讀