0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深入GRU:解鎖模型測試新維度

恩智浦MCU加油站 ? 來源:恩智浦MCU加油站 ? 2024-06-27 09:36 ? 次閱讀

之前帶大家一起使用Keras訓(xùn)練了一個(gè)GRU模型,并使用mnist的手寫字體數(shù)據(jù)集進(jìn)行了驗(yàn)證。本期小編將繼續(xù)帶來一篇擴(kuò)展,即GRU模型的測試方法。盡管我們將其當(dāng)作和CNN類似的方式,一次性傳給他固定長度的數(shù)據(jù),但在具體實(shí)現(xiàn)上來說,還是另有門道的。讓我們慢慢講來。

首先回顧前面我們最終訓(xùn)練并導(dǎo)出的測試模型:

34919164-341f-11ef-a4c8-92fbcf53809c.png

注意紅色標(biāo)注的位置,這就是一個(gè)典型的GRU節(jié)點(diǎn):

34aa4de4-341f-11ef-a4c8-92fbcf53809c.png

模型的輸入是28*28,代表的含義是:時(shí)間步*特征維度,簡單來說,就是一次性送入模型多久的數(shù)據(jù),即時(shí)間步實(shí)際上是一個(gè)時(shí)間單位。例如,我們想測試1s的數(shù)據(jù)進(jìn)行檢測。那么可以將其提取出來10*28的特征向量,那么每一個(gè)特征代表的就是1s/10即100ms的音頻特征。了解了時(shí)間步,再回到模型本身,這里就是其中一種模型推理形式。即一次性將所有的數(shù)據(jù)都送進(jìn)去,即1s對應(yīng)的特征數(shù)據(jù)。然后計(jì)算得出一個(gè)結(jié)果。好處是:所見所得,和CNN類似,缺點(diǎn)是:必須等待1s數(shù)據(jù),且循環(huán)time_step次。

那有沒有替代方案呢?當(dāng)然,那就是小編要提到的另一種,我們在導(dǎo)出模型時(shí)候?qū)ime_step設(shè)置為1,并且設(shè)置stateful=True,同時(shí)將time_step=N的模型權(quán)重設(shè)置到新模型上。這里的stateful=True要注意,因?yàn)槲覀儗⒅斑B續(xù)的time_step拆成了獨(dú)立的,因此需要讓模型記住前一次的中間狀態(tài)。

可能這里大家有些疑問,為什么兩個(gè)模型time_step不同,權(quán)重竟然通用。這就要說GRU模型的特殊性了,我們剛才看到的被展開的小GRU節(jié)點(diǎn),其實(shí)是權(quán)重共享的。也就是說,不管展開多少次,他們的權(quán)重不會變(這個(gè)讀者可以打開模型自行查看驗(yàn)證)。因此,就可以用如下代碼生成新模型,并設(shè)置權(quán)重:

# 構(gòu)建新模型
new_model = Sequential()
new_model.add(GRU(128, batch_input_shape=(1, 1, 28), unroll=True, stateful=True))
new_model.add(Dense(10, activation='softmax'))
new_model.set_weights(model.get_weights())

讓我們看看模型的樣子:

34c73666-341f-11ef-a4c8-92fbcf53809c.png

是不是看起來非常清爽,請注意右下角那個(gè)AssignVariable,這個(gè)就是為了保存當(dāng)前狀態(tài),在下一次推理可以直接使用上一次的狀態(tài)。需要注意的是,由于模型輸入變成了一個(gè)time step,即1*28,在送入模型前,要注意一下。后續(xù)處理部分,依舊是FullyConnected+Softmax的形式,其他沒有改變,照常即可。

至此,所有關(guān)于GRU模型的介紹以及使用就全部講完了。MCU端的部署要靠大家自行體驗(yàn)了,因?yàn)槟P捅旧韺?shí)際上可以使用和CNN一樣的推理方案,只是內(nèi)部結(jié)構(gòu)不同而已,希望對大家有所幫助!

恩智浦致力于打造安全的連接和基礎(chǔ)設(shè)施解決方案,為智慧生活保駕護(hù)航。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • mcu
    mcu
    +關(guān)注

    關(guān)注

    146

    文章

    16922

    瀏覽量

    349989
  • 測試
    +關(guān)注

    關(guān)注

    8

    文章

    5113

    瀏覽量

    126353
  • Gru
    Gru
    +關(guān)注

    關(guān)注

    0

    文章

    12

    瀏覽量

    7471
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3121

    瀏覽量

    48663
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    350

    瀏覽量

    22139

原文標(biāo)題:深入GRU:解鎖模型測試新維度

文章出處:【微信號:NXP_SMART_HARDWARE,微信公眾號:恩智浦MCU加油站】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    模型動態(tài)測試工具TPT的軟件集成與測試支持#Siumlink模型測試 #TPT

    模型
    北匯信息POLELINK
    發(fā)布于 :2024年11月07日 11:20:29

    如何評估AI大模型的效果

    評估AI大模型的效果是一個(gè)復(fù)雜且多維度的過程,涉及多個(gè)方面的考量。以下是一些關(guān)鍵的評估方法和步驟: 一、基準(zhǔn)測試(Benchmarking) 使用標(biāo)準(zhǔn)數(shù)據(jù)集和任務(wù)來評估模型的性能,如G
    的頭像 發(fā)表于 10-23 15:21 ?281次閱讀

    軟件測試六大問 全面而深入的軟件測試行業(yè)解疑

    隨著科技的進(jìn)步和大數(shù)據(jù)時(shí)代的到來,?軟件測試面臨著前所未有的挑戰(zhàn)和機(jī)遇。?在這篇文章中我們將深入討論軟件測試行業(yè)的發(fā)展前景、行業(yè)趨勢、薪資水平等,為讀者提供一次全面而深入的軟件
    的頭像 發(fā)表于 07-30 10:28 ?222次閱讀

    AI大模型與小模型的優(yōu)缺點(diǎn)

    在人工智能(AI)的廣闊領(lǐng)域中,模型作為算法與數(shù)據(jù)之間的橋梁,扮演著至關(guān)重要的角色。根據(jù)模型的大小和復(fù)雜度,我們可以將其大致分為AI大模型和小模型。這兩種
    的頭像 發(fā)表于 07-10 10:39 ?2249次閱讀

    如何加速大語言模型推理

    的主要挑戰(zhàn)。本文將從多個(gè)維度深入探討如何加速大語言模型的推理過程,以期為相關(guān)領(lǐng)域的研究者和開發(fā)者提供參考。
    的頭像 發(fā)表于 07-04 17:32 ?450次閱讀

    摩爾線程與智譜AI完成大模型性能測試與適配

    近日,摩爾線程與智譜AI在人工智能領(lǐng)域開展了一輪深入的合作,共同對GPU大模型進(jìn)行了適配及性能測試。此次測試不僅涵蓋了大模型的推理能力,還涉
    的頭像 發(fā)表于 06-14 16:40 ?977次閱讀

    GRU是什么?GRU模型如何讓你的神經(jīng)網(wǎng)絡(luò)更聰明 掌握時(shí)間 掌握未來

    適用于處理圖像識別和計(jì)算機(jī)視覺任務(wù)。今天要給大家介紹一位新朋友,名為GRU。 Gated RecurrentUnit(GRU)是一種用于處理序列數(shù)據(jù)的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)模型。 先來插播一條,RNN
    發(fā)表于 06-13 11:42 ?1395次閱讀
    <b class='flag-5'>GRU</b>是什么?<b class='flag-5'>GRU</b><b class='flag-5'>模型</b>如何讓你的神經(jīng)網(wǎng)絡(luò)更聰明 掌握時(shí)間 掌握未來

    GRU模型實(shí)戰(zhàn)訓(xùn)練 智能決策更精準(zhǔn)

    上一期文章帶大家認(rèn)識了一個(gè)名為GRU的新朋友, GRU本身自帶處理時(shí)序數(shù)據(jù)的屬性,特別擅長對于時(shí)間序列的識別和檢測(例如音頻、傳感器信號等)。GRU其實(shí)是RNN模型的一個(gè)衍生形式,巧妙
    的頭像 發(fā)表于 06-13 09:22 ?1228次閱讀
    <b class='flag-5'>GRU</b><b class='flag-5'>模型</b>實(shí)戰(zhàn)訓(xùn)練 智能決策更精準(zhǔn)

    【大語言模型:原理與工程實(shí)踐】大語言模型的評測

    在知識獲取、邏輯推理、代碼生成等方面的能力。這些評測基準(zhǔn)包括語言建模能力、綜合知識能力、數(shù)學(xué)計(jì)算能力、代碼能力和垂直領(lǐng)域等多個(gè)維度。對于微調(diào)模型,對話能力的評測關(guān)注模型在對話任務(wù)中的全維度
    發(fā)表于 05-07 17:12

    【大語言模型:原理與工程實(shí)踐】探索《大語言模型原理與工程實(shí)踐》2.0

    《大語言模型“原理與工程實(shí)踐”》是關(guān)于大語言模型內(nèi)在機(jī)理和應(yīng)用實(shí)踐的一次深入探索。作者不僅深入討論了理論,還提供了豐富的實(shí)踐案例,幫助讀者理解如何將理論知識應(yīng)用于解決實(shí)際問題。書中的案
    發(fā)表于 05-07 10:30

    【大語言模型:原理與工程實(shí)踐】探索《大語言模型原理與工程實(shí)踐》

    《大語言模型》是一本深入探討人工智能領(lǐng)域中語言模型的著作。作者通過對語言模型的基本概念、基礎(chǔ)技術(shù)、應(yīng)用場景分析,為讀者揭開了這一領(lǐng)域的神秘面紗。本書不僅
    發(fā)表于 04-30 15:35

    深入解析與無線通信RFIC設(shè)計(jì)與測試實(shí)用指南

    深入解析與無線通信RFIC設(shè)計(jì)與測試實(shí)用指南
    發(fā)表于 04-16 11:03 ?284次閱讀
    <b class='flag-5'>深入</b>解析與無線通信RFIC設(shè)計(jì)與<b class='flag-5'>測試</b>實(shí)用指南

    Stage 模型深入解讀

    HarmonyOS 3.1 版本(API 9)推出了全新應(yīng)用開發(fā)模型 - Stage 模型,該模型重新定義了應(yīng)用開發(fā)的能力邊界,從應(yīng)用開發(fā)模型的角度,支持多窗口形態(tài)下統(tǒng)一的應(yīng)用組件生命
    的頭像 發(fā)表于 02-18 09:28 ?1065次閱讀
    Stage <b class='flag-5'>模型</b><b class='flag-5'>深入</b>解讀

    深入探索知名大模型的實(shí)際應(yīng)用

    2023 年,國內(nèi)外各大廠商均投身于大模型的浪潮當(dāng)中,涌現(xiàn)了諸多知名的大模型及應(yīng)用,它們結(jié)合了文本、圖片、視頻、音頻多種介質(zhì),在文本生成、圖片生成、AI 編程等方向均有出色的表現(xiàn)。
    發(fā)表于 01-29 13:47 ?370次閱讀
    <b class='flag-5'>深入</b>探索知名大<b class='flag-5'>模型</b>的實(shí)際應(yīng)用

    模型智能的革命:如何打破算力瓶頸

    模型的參數(shù)量主要取決于隱藏層的維度和構(gòu)成模型的Block的數(shù)量,我們假定隱藏層的維度為 h,Block 的數(shù)量為 i,那么,大模型的參數(shù)量
    發(fā)表于 01-16 11:34 ?476次閱讀
    大<b class='flag-5'>模型</b>智能的革命:如何打破算力瓶頸