0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

分享人工智能與媒體服務(wù)的契合以及未來(lái)的發(fā)展方向

LiveVideoStack ? 2018-01-29 10:36 ? 次閱讀

人工智能為多媒體服務(wù)帶來(lái)了更多、更有價(jià)值的新功能,讓你的媒體、你的video更加智能化,幫助用戶獲取更好的體驗(yàn)。微軟大中華區(qū)創(chuàng)新技術(shù)合作事業(yè)部 (CSE)資深技術(shù)顧問(wèn)梁建為我們分享了人工智能與媒體服務(wù)的契合以及未來(lái)的發(fā)展方向。

大家好,我是來(lái)自微軟創(chuàng)新技術(shù)合作事業(yè)部的梁建,很高興接受LiveVideoStack的邀請(qǐng),跟大家一同介紹和暢想媒體服務(wù)video在未來(lái)2018年可能的發(fā)展。

2017年,我們經(jīng)歷了整個(gè)媒體行業(yè)視頻服務(wù)、視頻處理的快速發(fā)展,與此同時(shí)人工智能和區(qū)塊鏈也是去年的熱點(diǎn)話題,那我們就一起來(lái)看下人工智能和我們的媒體服務(wù)如何進(jìn)行結(jié)合。

人工智能幫助我們實(shí)現(xiàn)更多場(chǎng)景

傳統(tǒng)的媒體服務(wù)都會(huì)做哪些事情?比如線上直播、編解碼、內(nèi)容保護(hù)等等的服務(wù),但隨著人工智能技術(shù)的發(fā)展,很多媒體行業(yè)或者媒體業(yè)務(wù)處理行業(yè)的朋友,也在探索如何將人工智能應(yīng)用到現(xiàn)在的媒體技術(shù)和行業(yè)發(fā)展上,包括視頻的發(fā)展上。

大家可以思考下在哪些場(chǎng)景上人工智能技術(shù)能幫助我們實(shí)現(xiàn)更多的場(chǎng)景?比如如何在越來(lái)越多的視頻中發(fā)現(xiàn)更好的、更需要的內(nèi)容;如何讓視頻內(nèi)容里人物之間產(chǎn)生關(guān)系;在視頻編輯和處理過(guò)程中,如何增加字幕的信息以及多語(yǔ)言的支持;如何讓視頻自動(dòng)的增加評(píng)論,像大家熟知的視頻里中比較流行的彈幕;以及如何讓視頻里產(chǎn)生更多的價(jià)值,比如在視頻里如何更好的嵌入廣告,讓視頻自動(dòng)的把對(duì)用戶的洞察力、想法展現(xiàn)出來(lái)。

人工智能讓媒體服務(wù)更“聰明”

這里我也想跟大家介紹在微軟的Azure云平臺(tái)上有一個(gè)Media Services媒體服務(wù),它不僅僅包括了傳統(tǒng)的視頻直播、Encode、Decode這種編解碼能力、內(nèi)容保護(hù)能力,以及多渠道、多設(shè)備的Player的能力。它還提供了Video AI的能力。也就是除了在這個(gè)傳統(tǒng)的Midea Services架構(gòu)上,我們可以能幫助大家產(chǎn)生支持多種設(shè)備的流媒體Streaming的格式。同時(shí)它還 提供了Media Analytics媒體分析,它能夠從視頻匯總產(chǎn)生一些洞察力,幫助大家降低人工成本,同時(shí)自動(dòng)拿到更多的信息。

在微軟的Media Analytics服務(wù)中,它融入了非常豐富的人工智能技術(shù):Audio Transcript能夠通過(guò)語(yǔ)音視頻自動(dòng)生成字幕信息;通過(guò)人臉檢測(cè)知道視頻中出現(xiàn)了哪些人物;通過(guò)視頻OCR把視頻中非數(shù)字的信息轉(zhuǎn)化為數(shù)字的文字信息;根據(jù)視頻中人臉的信息,選取人物自動(dòng)增加人臉修正;通過(guò)Video summaries智能生成視頻的總結(jié)或片段,比如一個(gè)小時(shí)的視頻生成出一分鐘的預(yù)告或者介紹;Content moderation可以智能審核內(nèi)容信息,比如成人信息、用暴力等等;以及通過(guò)比較流行的DNN深度學(xué)習(xí)算法、神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)物體的識(shí)別。此外還有視頻的穩(wěn)定、情緒識(shí)等等。由此我們可以預(yù)見(jiàn)在2018年,除了傳統(tǒng)的視頻編解碼、視頻流以及最新的視頻格式外,人工智能技術(shù)會(huì)給我們產(chǎn)生更多的價(jià)值,同時(shí)幫助我們降低成本。除了以上介紹的10種AI服務(wù),我們也相信在2018年微軟還將提供更多的智能服務(wù),也歡迎大家持續(xù)關(guān)注微軟Azure Media Services平臺(tái)。

除了傳統(tǒng)服務(wù),微軟還提供了五大方面29類的認(rèn)知服務(wù),而這29類服務(wù)又分別都提供了自己相關(guān)的API,它不僅可以用在傳統(tǒng)的圖片、語(yǔ)音識(shí)別、知識(shí)搜索,你可以非常方便地將它應(yīng)用到自己的媒體服務(wù)中。特別的,我們還有一個(gè)最新的服務(wù)Video Indexer,我們前面提到的10種人工智能服務(wù)都包含其中,包括translater——無(wú)論文字或者語(yǔ)言的,這樣對(duì)于一個(gè)視頻,它就會(huì)自動(dòng)根據(jù)你的需求去進(jìn)行說(shuō)語(yǔ)音識(shí)別、人臉識(shí)別、字幕翻譯、多語(yǔ)言翻譯、視頻內(nèi)容總結(jié)、場(chǎng)景分析等等。那如果你希望視頻有更多的拓展,比如知識(shí)搜索就非常重要,你可以根據(jù)視頻去搜索相關(guān)的視頻、圖片,同樣的你還可以進(jìn)行新聞的搜尋。

這里我們還提供了Custom Services——從視覺(jué)、到語(yǔ)言理解、到語(yǔ)音服務(wù)、到搜索都有一個(gè)定制化的體驗(yàn)。其實(shí)我們的API都是通用的,只不過(guò)定制化的場(chǎng)景、訓(xùn)練的數(shù)據(jù)是需要大家來(lái)提供。比如你希望在視頻服務(wù)中為用戶做更多的拓展搜索,但又并不希望進(jìn)行全網(wǎng)搜索找到一些不想要的信息,那么此時(shí)你就可以利用Custom Search定義相關(guān)的網(wǎng)站和希望的內(nèi)容,從而得到你規(guī)定的信息。語(yǔ)言理解上,大家可以很方便地把一些用戶在視頻聊天對(duì)話中,給他的關(guān)鍵詞、用戶所要的意圖、定義一些場(chǎng)景,通過(guò)自然語(yǔ)義理解抽取出來(lái)。包括我們說(shuō)的Custom Vision可以通過(guò)frame這種方式把視頻中的一些場(chǎng)景、物體識(shí)別、場(chǎng)景給他抽取出來(lái),讓我們的視頻不僅僅是傳統(tǒng)中的觀看、編碼、streaming,同樣的你也可以通過(guò)人工智能拿到更多的信息。

最后,我也希望在2018年有越來(lái)越多的媒體制作、開發(fā)的合作伙伴一定將人工智能技術(shù)用起來(lái),讓你的媒體、你的video更加智能化,拿到更多的信息。同樣,我相信在2018年我們和LiveVideoStack音視頻技術(shù)社區(qū)會(huì)有非常多的合作,也特別希望把更多的人工智能技術(shù)、更多的Media Services的服務(wù)給大家介紹出來(lái),幫助大家更好的工作,同時(shí)帶來(lái)更多的體驗(yàn)。也預(yù)祝LiveVideoStack社區(qū)越辦越好,吸引更多的開發(fā)者,能夠匯集開發(fā)者、匯集我們這些做人工智能、做媒體服務(wù)的合作伙伴,謝謝大家!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • CES
    CES
    +關(guān)注

    關(guān)注

    4

    文章

    1013

    瀏覽量

    70586
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46060

    瀏覽量

    234955
  • 媒體
    +關(guān)注

    關(guān)注

    1

    文章

    61

    瀏覽量

    14360

原文標(biāo)題:展望2018:人工智能為媒體服務(wù)賦能

文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【書籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    以及大力發(fā)展AI for Science的原因。 第2章從科學(xué)研究底層的理論模式與主要困境,以及人工智能三要素(數(shù)據(jù)、算法、算力)出發(fā),對(duì)AI for Science的技術(shù)支撐進(jìn)行解讀。 第3章介紹
    發(fā)表于 09-09 13:54

    報(bào)名開啟!深圳(國(guó)際)通用人工智能大會(huì)將啟幕,國(guó)內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國(guó)際)通用人工智能大會(huì)暨深圳(國(guó)際)通用人工智能產(chǎn)業(yè)博覽會(huì)將在深圳國(guó)際會(huì)展中心(寶安)舉辦。大會(huì)以“魅力AI·無(wú)限未來(lái)”為主題,致力于打造全球通用人工智能
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    定制化的硬件設(shè)計(jì),提高了硬件的靈活性和適應(yīng)性。 綜上所述,F(xiàn)PGA在人工智能領(lǐng)域的應(yīng)用前景廣闊,不僅可以用于深度學(xué)習(xí)的加速和云計(jì)算的加速,還可以針對(duì)特定應(yīng)用場(chǎng)景進(jìn)行定制化計(jì)算,為人工智能技術(shù)的發(fā)展提供有力支持。
    發(fā)表于 07-29 17:05

    人工智能與機(jī)器人的區(qū)別

    在當(dāng)今科技飛速發(fā)展的時(shí)代,人工智能(AI)和機(jī)器人已成為社會(huì)關(guān)注的熱點(diǎn)話題。盡管兩者在多個(gè)領(lǐng)域有著廣泛的應(yīng)用和交集,但它們本質(zhì)上是兩個(gè)不同的概念。本文將從定義、技術(shù)方向、功能、應(yīng)用范圍、研究重點(diǎn)及
    的頭像 發(fā)表于 07-04 17:41 ?777次閱讀

    人工智能與大模型的關(guān)系與區(qū)別

    在科技日新月異的今天,人工智能(AI)已成為推動(dòng)社會(huì)進(jìn)步的重要力量。而在人工智能的眾多分支中,大模型(Large Models)作為近年來(lái)興起的概念,以其巨大的參數(shù)數(shù)量和強(qiáng)大的計(jì)算能力,在多個(gè)領(lǐng)域展現(xiàn)出了非凡的潛力。本文旨在深入探討人工
    的頭像 發(fā)表于 07-04 16:07 ?1939次閱讀

    具身智能與人形機(jī)器人領(lǐng)域現(xiàn)狀、挑戰(zhàn)以及未來(lái)方向

    人工智能(AI)的眾多前沿領(lǐng)域中,具身智能(Embodied Intelligence)已成為今年一級(jí)市場(chǎng)最引人矚目的投資熱點(diǎn)。在第六屆北京智源大會(huì)的熱烈氛圍中,北京智源人工智能研究院院長(zhǎng)王仲遠(yuǎn)接受了《中國(guó)電子報(bào)》記者的專訪,
    的頭像 發(fā)表于 06-20 10:52 ?495次閱讀

    未來(lái)交通:UWB模塊引領(lǐng)智能交通系統(tǒng)的發(fā)展方向

    響應(yīng)、抗干擾等特點(diǎn),為智能交通系統(tǒng)的構(gòu)建提供了新的可能性。本文將探討UWB模塊引領(lǐng)智能交通系統(tǒng)的發(fā)展方向,包括其應(yīng)用場(chǎng)景、技術(shù)優(yōu)勢(shì)和未來(lái)發(fā)展
    的頭像 發(fā)表于 04-18 15:43 ?318次閱讀

    嵌入式熱門發(fā)展方向有哪些?

    嵌入式熱門發(fā)展方向有哪些? 現(xiàn)在越來(lái)越多的計(jì)算機(jī)、電子、通信、自動(dòng)化等相關(guān)專業(yè)跨行學(xué)習(xí)嵌入式,嵌入式開發(fā)作為未來(lái)職業(yè)發(fā)展方向,不論從薪資待遇還是
    發(fā)表于 04-11 14:17

    電梯行業(yè)發(fā)展方向預(yù)測(cè):這些值得關(guān)注的關(guān)鍵領(lǐng)域!

    隨著科技的不斷發(fā)展和社會(huì)的進(jìn)步,電梯行業(yè)也在不斷進(jìn)行創(chuàng)新和改革。未來(lái),電梯行業(yè)的發(fā)展方向將受到多方面因素的影響,而其中一些方面尤為值得關(guān)注。 1. 智能化技術(shù)的應(yīng)用 隨著
    的頭像 發(fā)表于 03-21 10:12 ?596次閱讀
    電梯行業(yè)<b class='flag-5'>發(fā)展方向</b>預(yù)測(cè):這些值得關(guān)注的關(guān)鍵領(lǐng)域!

    MES未來(lái)可能的發(fā)展方向

    電子發(fā)燒友網(wǎng)站提供《MES未來(lái)可能的發(fā)展方向.docx》資料免費(fèi)下載
    發(fā)表于 02-28 09:23 ?0次下載

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時(shí)代背景下,嵌入式人工智能成為國(guó)家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級(jí)的核心驅(qū)動(dòng)力。同時(shí)在此背景驅(qū)動(dòng)下,眾多名企也紛紛在嵌入式人工智能
    發(fā)表于 02-26 10:17

    DC電源模塊的未來(lái)發(fā)展方向與挑戰(zhàn)

    BOSHIDA ? DC電源模塊的未來(lái)發(fā)展方向與挑戰(zhàn) 未來(lái)DC電源模塊的發(fā)展方向和面臨的挑戰(zhàn)包括以下幾個(gè)方面: 高效率和節(jié)能:隨著人們對(duì)環(huán)境保護(hù)的重視和能源消耗的削減要求,DC電源模塊
    的頭像 發(fā)表于 01-29 13:52 ?330次閱讀
    DC電源模塊的<b class='flag-5'>未來(lái)</b><b class='flag-5'>發(fā)展方向</b>與挑戰(zhàn)

    焊縫跟蹤未來(lái)人工智能與機(jī)器學(xué)習(xí)的影響

    隨著科技的不斷進(jìn)步,焊接行業(yè)也在迎來(lái)一場(chǎng)革命性的變革。焊縫跟蹤技術(shù),作為焊接領(lǐng)域的關(guān)鍵創(chuàng)新之一,正在經(jīng)歷著人工智能和機(jī)器學(xué)習(xí)的引領(lǐng)下迎來(lái)更加智能、高效的發(fā)展。本文將深入探討焊縫跟蹤技術(shù)未來(lái)
    的頭像 發(fā)表于 12-12 11:51 ?369次閱讀

    情感語(yǔ)音識(shí)別:挑戰(zhàn)與未來(lái)發(fā)展方向

    面臨的挑戰(zhàn)及未來(lái)發(fā)展方向。 二、情感語(yǔ)音識(shí)別的挑戰(zhàn) 情感表達(dá)的復(fù)雜性和多變性:人的情感表達(dá)受到文化、個(gè)人經(jīng)歷、語(yǔ)言習(xí)慣等多種因素的影響,這使得準(zhǔn)確識(shí)別和理解人的情感狀態(tài)變得非常困難。 噪聲干擾和環(huán)境變化:在現(xiàn)實(shí)環(huán)
    的頭像 發(fā)表于 11-23 14:37 ?369次閱讀

    ?硬件工程師就業(yè)前景和未來(lái)發(fā)展方向

    大家好,我是硬件花園,一名樂(lè)于分享的硬件工程師。關(guān)注我,了解更多精彩內(nèi)容! 硬件工程師的就業(yè)前景和發(fā)展方向有很多,以下是我整理出來(lái)的一些常見(jiàn)的發(fā)展方向: 1. 技術(shù)層面 硬件工程師成為技術(shù)專家或
    的頭像 發(fā)表于 10-20 08:43 ?3203次閱讀