0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究人員最近開發(fā)了一種新的CNN,用于識別視頻中的人類行為

倩倩 ? 來源:百度粉絲網(wǎng) ? 2020-09-10 13:48 ? 次閱讀

諸如卷積神經(jīng)網(wǎng)絡(luò)(CNN)之類的深度學(xué)習(xí)算法已在各種任務(wù)上取得了顯著成果,包括那些涉及識別圖像中特定人物或物體的任務(wù)?;谝曈X的人類動作識別(HAR)是計(jì)算機(jī)科學(xué)家經(jīng)常嘗試使用深度學(xué)習(xí)解決的任務(wù),它特別需要識別圖像或視頻中捕獲的人類動作。

HITEC大學(xué)和巴基斯坦伊斯蘭堡基礎(chǔ)大學(xué),韓國世宗大學(xué)和中正大學(xué),英國萊斯特大學(xué)和沙特阿拉伯蘇丹王子大學(xué)的研究人員最近開發(fā)了一種新的CNN,用于識別視頻中的人類行為。該CNN在Springer Link的“多媒體工具和應(yīng)用程序”期刊上發(fā)表的一篇論文中進(jìn)行了介紹,經(jīng)過培訓(xùn)可以區(qū)分幾種不同的人類動作,包括拳擊,拍手,揮舞,慢跑,跑步和散步。

研究人員在論文中寫道:“我們設(shè)計(jì)了一種新的26層卷積神經(jīng)網(wǎng)絡(luò)(CNN)架構(gòu),用于精確的復(fù)雜動作識別。” “這些特征是從全局平均池化層和完全連接(FC)層中提取的,并通過建議的基于高熵的方法進(jìn)行融合?!?/p>

當(dāng)試圖識別人類在圖像或視頻中的動作時(shí),CNN通常會將其分析重點(diǎn)放在許多潛在的相關(guān)特征上。但是,某些人類動作(例如慢跑和步行)可能非常相似,這使得這些算法很難區(qū)分它們,特別是如果它們專注于相似性核心的特征時(shí)。為了克服這一挑戰(zhàn),研究人員使用了一種方法,該方法將稱為Poisson分布的特征選擇方法與單變量測量(PDaUM)合并在一起。

研究人員觀察到,CNN所基于的分析功能有時(shí)可能不相關(guān)或多余,這導(dǎo)致它們做出錯(cuò)誤的預(yù)測。為了降低發(fā)生這種情況的風(fēng)險(xiǎn),他們的PDaUM方法僅選擇最強(qiáng)大的功能來識別特定的人類行為,并確保CNN基于這些功能做出最終預(yù)測。

研究人員在HMDB51,UFC Sports,KH和Weizmann數(shù)據(jù)集這四個(gè)數(shù)據(jù)集上訓(xùn)練和評估了兩個(gè)截然不同的CNN,一個(gè)極端機(jī)器學(xué)習(xí)(EML)和一個(gè)Softmax分類器。這些數(shù)據(jù)集包含幾個(gè)人類執(zhí)行不同類型動作的視頻。

然后,研究人員比較了兩個(gè)CNN的性能,這兩個(gè)CNN均使用其特征選擇方法進(jìn)行了增強(qiáng)。在他們的評估中,ELM分類器的性能明顯優(yōu)于Softmax算法,可以從視頻中識別出人類動作,其在HMDB51數(shù)據(jù)集上的準(zhǔn)確性為81.4%,在UCF Sports數(shù)據(jù)集上的準(zhǔn)確性為99.2%,在KTH數(shù)據(jù)集上的準(zhǔn)確性為98.3%,在KTH數(shù)據(jù)集上的準(zhǔn)確性為98.7%。魏茨曼數(shù)據(jù)集。

值得注意的是,PDaUM增強(qiáng)的ELM分類器在準(zhǔn)確性和預(yù)測時(shí)間方面也優(yōu)于研究人員將其與之相比的所有現(xiàn)有深度學(xué)習(xí)技術(shù)。因此,這些結(jié)果凸顯了研究人員介紹的特征選擇方法在提高CNN在HAR任務(wù)上的性能方面的潛力。

將來,本文介紹的ELM分類器和PDaUM方法可以開發(fā)更有效的工具,以自動區(qū)分人類在錄制和實(shí)況錄像中正在做什么。這些工具可以通過幾種不同的方式證明其價(jià)值,例如,幫助執(zhí)法人員監(jiān)視CCTV視頻上嫌疑犯的行為,或者允許研究人員快速分析大量視頻。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4717

    瀏覽量

    100018
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5422

    瀏覽量

    120595
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    349

    瀏覽量

    21970
收藏 人收藏

    評論

    相關(guān)推薦

    AI行為識別視頻監(jiān)控系統(tǒng) Python

    AI行為識別視頻監(jiān)控系統(tǒng)來自機(jī)器視覺技術(shù)的革新。機(jī)器視覺技術(shù)應(yīng)用是人工智能技術(shù)分析的個(gè)支系。它可以在圖形和圖象具體內(nèi)容敘述中間創(chuàng)建投射關(guān)聯(lián),使電腦可以根據(jù)圖像處理和剖析比較,進(jìn)而熟悉
    的頭像 發(fā)表于 07-06 10:36 ?294次閱讀
    AI<b class='flag-5'>行為</b><b class='flag-5'>識別</b><b class='flag-5'>視頻</b>監(jiān)控系統(tǒng) Python

    如何利用CNN實(shí)現(xiàn)圖像識別

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)領(lǐng)域中一種特別適用于圖像識別任務(wù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它通過模擬人類視覺系統(tǒng)的處理方式,利用卷積、池化等操作,自動
    的頭像 發(fā)表于 07-03 16:16 ?479次閱讀

    研究人員提出一種電磁微鏡驅(qū)動系統(tǒng)

    領(lǐng)域。MEMS微鏡作為一種微光機(jī)電系統(tǒng)(MOEMS),已廣泛應(yīng)用于醫(yī)療、汽車、消費(fèi)和軍事電子等眾多領(lǐng)域。當(dāng)前,業(yè)界對具有廣闊前景的小型激光雷達(dá)的需求不斷增長。之前,已有研究開發(fā)了大量使
    的頭像 發(fā)表于 07-02 17:04 ?4046次閱讀

    鼾聲監(jiān)測神經(jīng)網(wǎng)絡(luò)

    聲音。 提出了一種用于打鼾聲音識別的混合1D-2D CNN框架,該框架比我們數(shù)據(jù)集上最先進(jìn)的深度學(xué)習(xí)模型更準(zhǔn)確、更穩(wěn)健。 我們在2019年3月至2019年12月的實(shí)驗(yàn)
    發(fā)表于 05-15 12:14

    基于毫米波的人體跟蹤和識別算法

    了RadHAR,這是一種使用稀疏和非均勻點(diǎn)云執(zhí)行精確HAR的框架。RadHAR利用滑動時(shí)間窗口來累積毫米波雷達(dá)的點(diǎn)云,并生成體素化表示,作為分類器的輸入。 我們在收集的具有5不同活動的人類活動數(shù)據(jù)集上
    發(fā)表于 05-14 18:40

    研究人員發(fā)現(xiàn)提高激光加工分辨率的新方法

    通過透明玻璃聚焦定制激光束可以在材料內(nèi)部形成個(gè)小光斑。東北大學(xué)的研究人員發(fā)了一種利用這種小光斑改進(jìn)激光材料加工、提高加工分辨率的方法。 他們的
    的頭像 發(fā)表于 04-18 06:30 ?233次閱讀
    <b class='flag-5'>研究人員</b>發(fā)現(xiàn)提高激光加工分辨率的新方法

    一種用于化學(xué)和生物材料識別的便攜式拉曼光譜解決方案

    基于掃頻光源的緊湊型拉曼光譜系統(tǒng):美國麻省理工學(xué)院(MIT)和韓國科學(xué)技術(shù)院(KAIST)的研究人員開發(fā)了一種用于化學(xué)和生物材料識別的便攜式
    的頭像 發(fā)表于 04-16 10:35 ?428次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>用于</b>化學(xué)和生物材料<b class='flag-5'>識別</b>的便攜式拉曼光譜解決方案

    一種基于單像素光電探測器的高光譜視頻成像系統(tǒng)設(shè)計(jì)

    日前,北京理工大學(xué)光電學(xué)院王涌天教授、劉越教授團(tuán)隊(duì)成員徐怡博教授與來自谷歌公司和美國萊斯大學(xué)研究人員合作,開發(fā)了一種具有優(yōu)異壓縮比和吞吐量的基于單像素光電探測器的高光譜視頻成像系統(tǒng)
    的頭像 發(fā)表于 03-15 09:40 ?588次閱讀
    <b class='flag-5'>一種</b>基于單像素光電探測器的高光譜<b class='flag-5'>視頻</b>成像系統(tǒng)設(shè)計(jì)

    基于微流控的人造蜘蛛腺紡出“自然絲”

    近期,日本研究人員發(fā)了一種微流控器件,可紡出與自然產(chǎn)生的蛛絲非常接近的人造蜘蛛絲。
    的頭像 發(fā)表于 01-25 09:42 ?442次閱讀

    研究人員設(shè)計(jì)一種新的3D噴墨打印技術(shù)

    據(jù)悉,只帶韌帶和肌腱的骨骼機(jī)械手現(xiàn)在可以通過次3D打印完成 —— 這是通過一種新的增材制造方法實(shí)現(xiàn)的,這種方法可以同時(shí)以高分辨率打印剛性和彈性材料。 這項(xiàng)新工作是瑞士蘇黎世聯(lián)邦理工學(xué)院的
    的頭像 發(fā)表于 11-20 17:01 ?601次閱讀

    一種能夠模擬人類手指觸覺的人工感知系統(tǒng)可高分辨率識別精細(xì)紋理

    據(jù)麥姆斯咨詢報(bào)道,近日,南方科技大學(xué)聯(lián)合西安電子科技大學(xué)的研究人員開發(fā)了一種能夠模擬人類手指觸覺的人工感知系統(tǒng)
    的頭像 發(fā)表于 11-20 09:14 ?706次閱讀
    <b class='flag-5'>一種</b>能夠模擬<b class='flag-5'>人類</b>手指觸覺<b class='flag-5'>的人</b>工感知系統(tǒng)可高分辨率<b class='flag-5'>識別</b>精細(xì)紋理

    一種新的鈣鈦礦-晶硅疊層太陽能電池開發(fā)

    研究人員開發(fā)了一種新的鈣鈦礦-晶硅疊層太陽能電池,該設(shè)計(jì)使用了一種禁帶寬度為1.67 eV的頂層鈣鈦礦電池和
    的頭像 發(fā)表于 11-16 09:37 ?714次閱讀
    <b class='flag-5'>一種</b>新的鈣鈦礦-晶硅疊層太陽能電池<b class='flag-5'>開發(fā)</b>

    研究人員開發(fā)柔軟的人造感覺皮膚 可在大范圍內(nèi)準(zhǔn)確確定物體的順應(yīng)性

    。這使我們能夠探知物體的特性,并執(zhí)行醫(yī)療觸診等精細(xì)的任務(wù)。 相比之下,由于機(jī)器人的剛性結(jié)構(gòu),為其配備類似的觸覺感知功能已被證明極具挑戰(zhàn)性。 據(jù)麥姆斯咨詢報(bào)道,瑞士洛桑理工學(xué)院(EPFL)的研究人員開發(fā)了一種柔軟
    的頭像 發(fā)表于 11-03 09:13 ?837次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>開發(fā)</b>柔軟<b class='flag-5'>的人</b>造感覺皮膚 可在大范圍內(nèi)準(zhǔn)確確定物體的順應(yīng)性

    小到個(gè)分子!研究人員開發(fā)一種微小的壓電電阻器

    使用壓阻的電子傳感器在許多設(shè)備中都很常見,包括汽車、醫(yī)療可穿戴設(shè)備和智能手機(jī)。現(xiàn)在,澳大利亞的研究人員開發(fā)了一種微小的壓電電阻器,小到個(gè)分子,可以實(shí)現(xiàn)
    的頭像 發(fā)表于 10-31 16:52 ?752次閱讀

    一種用于識別和分析紡織品的超緊湊近紅外光譜儀

    據(jù)麥姆斯咨詢報(bào)道,近期,德國弗勞恩霍夫光子微系統(tǒng)研究所(Fraunhofer IPMS)的研究人員開發(fā)了一種超緊湊的近紅外光譜儀,適用于
    的頭像 發(fā)表于 10-29 09:37 ?782次閱讀