0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

音視頻技術(shù)開發(fā)之淺析

LiveVideoStack ? 來源:電子發(fā)燒友網(wǎng) ? 作者:工程師譚軍 ? 2018-07-09 14:15 ? 次閱讀

Hulu 視頻QoS優(yōu)化策略

QoS直接關(guān)系到用戶體驗(yàn),如何提升QoS就成為視頻平臺(tái)技術(shù)實(shí)力的體現(xiàn)。本文來自Hulu全球高級(jí)研發(fā)經(jīng)理、視頻編解碼與傳輸領(lǐng)域資深專家傅徳良在LiveVideoStackCon 2017上的分享。盡管Hulu提供服務(wù)的網(wǎng)絡(luò)環(huán)境與國內(nèi)大相徑庭,但其相關(guān)QoS保障策略依然值得借鑒。

微博短視頻服務(wù)優(yōu)化實(shí)踐

本文來自新浪微博視頻轉(zhuǎn)碼平臺(tái)技術(shù)負(fù)責(zé)人李成亞在LiveVideoStackCon 2017上的分享,由LiveVideoStack整理成文。李成亞分享了微博短視頻如何提升用戶體驗(yàn)、降低成本的思路與實(shí)踐,包括提升短視頻發(fā)布速度,降低長視頻轉(zhuǎn)碼時(shí)間,通過新的Codec減少帶寬成本等。

熊貓TV直播H5播放器架構(gòu)探索

本文來自熊貓TV音視頻技術(shù)專家姜雨晴在LiveVideoStackCon 2017上的分享,并有LiveVideoStack整理成文。當(dāng)下,打造一款播放器已經(jīng)有比較好的開源實(shí)現(xiàn),但熊貓TV為什么還要自研一款H5播放器呢?為了保證業(yè)務(wù)持續(xù)擴(kuò)展能力,需要對(duì)播放器做解耦。同時(shí),在播放器上線初期還遇到了音畫不同步、故障定位、客戶端性能不足等問題。

Dubbo源碼分析 -- 遠(yuǎn)程通信 Netty

Dubbo 做為 RPC 框架,需要進(jìn)行跨 JVM 通信,要保證高性、穩(wěn)定的進(jìn)行遠(yuǎn)程通信。Dubbo 底層通信選擇了 Netty 這個(gè) NIO 框架做為默認(rèn)的網(wǎng)絡(luò)通信框架并且通過自定義協(xié)議進(jìn)行通信。

中國電信發(fā)布全球首份5G技術(shù)白皮書

2018年6月26日,中國電信在2018上海世界移動(dòng)大會(huì)(MWCS)上發(fā)布了《中國電信5G技術(shù)白皮書》,這也是全球MNO運(yùn)營商首次發(fā)布全面闡述5G技術(shù)觀點(diǎn)和總體策略的白皮書。

音頻開源代碼中重采樣算法的評(píng)估與選擇

在音頻軟件實(shí)現(xiàn)中經(jīng)常會(huì)遇到兩個(gè)模塊采樣率不一致的情況,比如語音通話時(shí)采集到的PCM信號(hào)是16k Hz的,但編碼時(shí)codec是AMR-NB(AMR-NB是8k Hz采樣),這時(shí)就需要把16k Hz采樣的PCM值轉(zhuǎn)換成8k Hz采樣的PCM值(這叫降采樣或者下采樣),然后再去做AMR-NB編碼。本文介紹如何評(píng)估開源代碼里的重采樣實(shí)現(xiàn)以及選擇最適合的實(shí)現(xiàn)。

音頻/視頻技術(shù)

Google 實(shí)時(shí)流擁塞控制算法GCCx1wan

GCC是google實(shí)時(shí)流擁塞控制算法的簡(jiǎn)稱,已經(jīng)在WebRTC中實(shí)現(xiàn),應(yīng)用于Chrome,后面將應(yīng)用到Hangouts(視頻聊天產(chǎn)品)中,主要用于視頻流的擁塞控制。

FFmpeg中的scale和crop參數(shù)FlyingPenguin

FFmpeg中的libavfilter提供了一整套的基于filter的機(jī)制。filter本身是一個(gè)插件的形式,可以快速的組裝需要的效果。本文簡(jiǎn)單介紹了通過filter實(shí)現(xiàn)視頻的水平鏡像效果。

iOS中獲取音頻流并提取pcmCNon

本文簡(jiǎn)要介紹了兩種不同的原始音頻流獲取方式 AVCaptureSession、AudioUnit,以及如何從AudioUnit獲取的原始數(shù)據(jù)中提取pcm。

用getDisplayMedia實(shí)現(xiàn)在Chrome中共享屏幕

Chrome網(wǎng)上商店已決定停止允許Chrome擴(kuò)展程序的內(nèi)聯(lián)安裝。這對(duì)WebRTC應(yīng)用程序有相當(dāng)大的影響,因?yàn)镃hrome中的屏幕共享目前還需要擴(kuò)展程序。getDisplayMedia能來解決這個(gè)問題嗎?本文來自appear.in的WebRTC工程師Philipp Hancke,LiveVideoStack對(duì)文章進(jìn)行了摘譯。

編解碼

基于鏡頭的編碼

基于鏡頭的編碼比基于主題的編碼帶來更高的編碼效率,由于對(duì)內(nèi)容感知的粒度更加細(xì),這種改變的結(jié)果顯而易見。然而,更細(xì)粒度的編碼也會(huì)帶來更高的負(fù)責(zé)度,比如在AWS環(huán)境中,在基礎(chǔ)設(shè)施服務(wù)失效的情況下,如何最大限度的保留已編碼的成果,從而減少重復(fù)編碼工作。本文來自Netflix的科技博客,LiveVideoStack對(duì)原文進(jìn)行了摘譯。

視頻編碼步入更壓縮高性能時(shí)代

目前,針對(duì)海量多媒體數(shù)據(jù)的壓縮和處理,特別是VR和HDR視頻數(shù)據(jù),開發(fā)并提出新的高性能codec及處理方案是多媒體通信應(yīng)用行業(yè)共同面臨的難題。MPEG已經(jīng)開始著手更新一代視頻編解碼標(biāo)準(zhǔn)VVC的制定,視頻壓縮性能有望進(jìn)一步大幅提高。在此背景下,本文簡(jiǎn)要梳理一下當(dāng)前針對(duì)大規(guī)模多媒體數(shù)據(jù)的高效壓縮技術(shù)。

JavaScript 編寫 MPEG1 解碼器柒緣生活吧

本文主要介紹了用JavaScript編寫MPEG1解碼器的開發(fā)過程中的一系列問題:JSMpeg中實(shí)現(xiàn)音頻流傳輸?shù)倪壿嫿M件構(gòu)成及流程,MPEG內(nèi)部的YUV格式轉(zhuǎn)換等。

UIImage圖片解碼的性能優(yōu)化吳家十三少

用 UIImage 或 CGImageSource 的那幾個(gè)方法創(chuàng)建圖片時(shí),圖片數(shù)據(jù)并不會(huì)立刻解碼。圖片設(shè)置到 UIImageView 或者 CALayer.contents 中去,并且 CALayer 被提交到 GPU 前,CGImage 中的數(shù)據(jù)才會(huì)得到解碼。本文主要介紹了圖片解碼時(shí)產(chǎn)生的性能問題及優(yōu)化。

Android音視頻系列:H264視頻編碼介紹

本文從配置編碼參數(shù)、輸入要編碼的圖像幀、編碼數(shù)據(jù)生成等方面介紹了使用X264開源庫編碼的H264視頻編碼技術(shù)。

AI智能

簡(jiǎn)單初始化,訓(xùn)練10000層CNN

如何快速簡(jiǎn)單地訓(xùn)練神經(jīng)網(wǎng)絡(luò)?谷歌大腦研究人員研究了CNN的可訓(xùn)練性,提出了一種簡(jiǎn)單的初始化策略,不需要使用殘差連接或批標(biāo)準(zhǔn)化,就能訓(xùn)練10000層的原始CNN。作者表示,他們的這項(xiàng)工作清除了在訓(xùn)練任意深度的原始卷積網(wǎng)絡(luò)時(shí)存在的所有主要的障礙。

步態(tài)識(shí)別的深度學(xué)習(xí):綜述

步態(tài)是人在行走過程中姿態(tài)的變化.不同于人臉、指紋、虹膜等, 步態(tài)是唯一可在遠(yuǎn)距離非受控狀態(tài)下獲得的生物特征.步態(tài)識(shí)別指利用步態(tài)信息對(duì)人的身份進(jìn)行識(shí)別的技術(shù),當(dāng)前關(guān)于步態(tài)識(shí)別方面的研究綜述主要圍繞在相關(guān)手工特征建模和傳統(tǒng)機(jī)器學(xué)習(xí)(非深度學(xué)習(xí))的識(shí)別算法上.

卷積神經(jīng)網(wǎng)絡(luò)的壓縮和加速

本文介紹了比較常見的4種卷積神經(jīng)網(wǎng)絡(luò)壓縮和加速方法,其中網(wǎng)絡(luò)裁枝與低秩估計(jì)的方法從矩陣乘法角度,著眼于減少標(biāo)量乘法和加法個(gè)數(shù)來實(shí)現(xiàn)模型壓縮和加速的;而模型量化則是著眼于參數(shù)本身,直接減少每個(gè)參數(shù)的存儲(chǔ)空間,提升每次標(biāo)量乘法和加法的速度,從而實(shí)現(xiàn)模型的壓縮和加速;模型蒸餾方法卻是從宏觀結(jié)構(gòu)入手,直接構(gòu)造了結(jié)構(gòu)簡(jiǎn)單,參數(shù)少的小網(wǎng)絡(luò),將難點(diǎn)轉(zhuǎn)移成對(duì)小網(wǎng)絡(luò)的訓(xùn)練上。

場(chǎng)景文本檢測(cè)—CTPN算法介紹

對(duì)于復(fù)雜環(huán)境中的字符的識(shí)別,主要包括文字檢測(cè)和文字識(shí)別兩個(gè)步驟,這里介紹的CTPN(Detecting Text in Natural Image with Connectionist Text Proposal Network)方法就是在場(chǎng)景中提取文字的一個(gè)效果較好的算法,能將自然環(huán)境中的文本信息位置加以檢測(cè)。

圖像

騰訊優(yōu)圖CVPR 2018論文:圖片去模糊及快速肖像處理等多項(xiàng)技術(shù)解讀

在慢速曝光或快速運(yùn)動(dòng)拍攝照片時(shí),圖像模糊常常困擾著照片拍攝者。騰訊優(yōu)圖實(shí)驗(yàn)室的新算法,可以處理非特定場(chǎng)景中的圖片模糊。算法基于一種被稱為「動(dòng)態(tài)模糊」的模糊模型假設(shè)。

使用 MATLAB 圖像處理算法,視頻實(shí)時(shí)加持藍(lán)天背景

本文將以色度鍵控效果為例,介紹在嵌入式硬件上部署 MATLAB 圖像處理算法的簡(jiǎn)單工作流。我們將使用 MATLAB Coder? 通過算法生成C代碼,然后使用在硬件上運(yùn)行的實(shí)用程序在 Raspberry Pi 板卡上進(jìn)行算法原型驗(yàn)證。最后,我們將算法移植至 NVIDIA Jetson Tx1 平臺(tái)以保證實(shí)時(shí)性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1748

    瀏覽量

    57191
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266241
  • 視頻編碼
    +關(guān)注

    關(guān)注

    2

    文章

    111

    瀏覽量

    20965
  • javascript
    +關(guān)注

    關(guān)注

    0

    文章

    515

    瀏覽量

    53658
  • 5G
    5G
    +關(guān)注

    關(guān)注

    1351

    文章

    48177

    瀏覽量

    560898

原文標(biāo)題:音視頻技術(shù)開發(fā)周刊 56期

文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    盤點(diǎn)那些常見音視頻接口

    我們熟知的一些常見音視頻接口,發(fā)展至今在日常使用中已經(jīng)漸漸少了。但是在工業(yè)領(lǐng)域的音視頻連接,依然能看到其身影。這些看似消失的接口,它們現(xiàn)在發(fā)展成什么樣子了?本期我們將做一個(gè)大盤點(diǎn)。
    的頭像 發(fā)表于 09-09 14:34 ?175次閱讀

    常見音視頻接口的靜電浪涌防護(hù)和濾波方案

    音視頻接口在現(xiàn)代多媒體設(shè)備中扮演著至關(guān)重要的角色,它們確保了音視頻信號(hào)在不同設(shè)備間的順暢傳輸,各種類型的音視頻接口滿足了多樣化的應(yīng)用場(chǎng)景需求。 在音視頻接口的設(shè)計(jì)領(lǐng)域,靜電浪涌防護(hù)與濾
    的頭像 發(fā)表于 06-25 11:28 ?427次閱讀

    音視頻IP化浪潮全面來襲,分布式系統(tǒng)開創(chuàng)音視頻行業(yè)新時(shí)代!

    在傳統(tǒng)音視頻頻系統(tǒng)中,廠商們各自采用不同的通訊方式和控制協(xié)議,這使得不同的產(chǎn)品之間就像一座座的信息孤島,要連接起來就需要復(fù)雜的轉(zhuǎn)換設(shè)備和系統(tǒng)再開發(fā)。隨著音視頻項(xiàng)目的規(guī)模不斷擴(kuò)大,各類音頻設(shè)備產(chǎn)品
    的頭像 發(fā)表于 05-30 16:55 ?506次閱讀

    音視頻產(chǎn)品EMC整改案例解析

    音視頻產(chǎn)品EMCRE整改案例解析
    的頭像 發(fā)表于 05-20 16:49 ?248次閱讀
    <b class='flag-5'>音視頻</b>產(chǎn)品EMC整改案例解析

    【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】音視頻的編解碼壓縮技術(shù)

    音視頻所載有的信息在通過傳輸?shù)臅r(shí)候就需要壓縮編碼。 其中,文本壓縮是指通過使用各種算法和技術(shù),將文本數(shù)據(jù)表示為更緊湊的形式,以減少存儲(chǔ)空間。 霍夫曼編碼是一種無損壓縮算法,它可以根據(jù)字符出現(xiàn)
    發(fā)表于 04-28 21:04

    音視頻SoC與AI技術(shù)融合,帶來更智能的音視頻處理解決方案

    ,如WiFi路由器和物聯(lián)網(wǎng)設(shè)備。在安防、智能音頻等領(lǐng)域,對(duì)SoC芯片的算力要求相比智能手機(jī)、服務(wù)器等略低。 ? 人工智能技術(shù)音視頻SoC 的融合??????????????????????????????????????? ? 隨著人工智能
    的頭像 發(fā)表于 04-26 01:20 ?3741次閱讀

    【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】音頻采集與預(yù)處理

    閑暇之余,繼續(xù)學(xué)習(xí)【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】這本書。 書中對(duì)于音頻采集的介紹非常詳細(xì)和全面,包括原理、方法、技術(shù)細(xì)節(jié)以及實(shí)踐應(yīng)用等方面的內(nèi)容。 音頻采集是實(shí)時(shí)音視頻通信中的關(guān)鍵步驟之一
    發(fā)表于 04-25 10:41

    【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】新書一瞥

    本人從事音視頻領(lǐng)域的開發(fā),經(jīng)常接觸實(shí)時(shí)音視頻處理相關(guān)的技術(shù),看到這本書非常有興趣閱讀,這本書全面介紹實(shí)時(shí)音視頻(RTC)
    發(fā)表于 04-22 09:09

    【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】本書概覽

    ,這都是按照音視頻流的開發(fā)的一般流程介紹的。然后介紹了編解碼以上所技術(shù),信令與媒體協(xié)商(個(gè)人覺得協(xié)商這里用協(xié)議更合適,因?yàn)槔锩嬷v解的是各種音視頻傳輸?shù)膮f(xié)議)。然后是控制傳輸優(yōu)化,可擴(kuò)展
    發(fā)表于 04-21 17:09

    音視頻解碼生成:打造極致觀影體驗(yàn)的關(guān)鍵技術(shù)

    在現(xiàn)代多媒體時(shí)代,音視頻解碼生成技術(shù)已成為提供極致觀影體驗(yàn)的核心要素。它不僅能夠確保音視頻數(shù)據(jù)的高效傳輸,還能保證播放的流暢性和畫質(zhì)清晰度,為用戶帶來身臨其境的觀影享受。 1. 解碼生成的重要性
    的頭像 發(fā)表于 02-25 14:43 ?346次閱讀

    音視頻

    對(duì)音視頻技術(shù)都喜歡深究?jī)?nèi)部最核心的原理和機(jī)制,尤其是ffmpeg這個(gè)編解碼庫,可以說是音視頻領(lǐng)域事實(shí)上的標(biāo)準(zhǔn)。語音智能算法,語言語義分析和理解,流媒體服務(wù)器等高端技術(shù)也都基于它而構(gòu)建。
    發(fā)表于 11-23 08:51

    關(guān)于手機(jī)端音視頻技術(shù)的思考與經(jīng)驗(yàn)

    提起手機(jī)音視頻,大家的第一印象可能是上面列舉的抖音、快手、愛奇藝和小米視頻等在線視頻平臺(tái),其中我們的小米視頻是一個(gè)聚合平臺(tái),用戶可以通過它觀看各大流媒體平臺(tái)的
    發(fā)表于 11-17 09:43 ?681次閱讀
    關(guān)于手機(jī)端<b class='flag-5'>音視頻</b><b class='flag-5'>技術(shù)</b>的思考與經(jīng)驗(yàn)

    ESP RTC音視頻傳輸延遲測(cè)試

    音視頻
    Kevincoooool
    發(fā)布于 :2023年11月11日 10:54:02

    科通技術(shù)攜AMD解碼現(xiàn)代專業(yè)音視頻及工業(yè)醫(yī)療圖像新趨勢(shì)

    10月18日,《科通&AMD專業(yè)音視頻、工業(yè)醫(yī)療圖像新趨勢(shì)》研討會(huì)在深圳微軟科通大廈舉辦??仆?b class='flag-5'>技術(shù)攜AMD專家以及戰(zhàn)略合作伙伴深入探討了AMD自適應(yīng)與嵌入式器件在工業(yè)和醫(yī)療領(lǐng)域的圖像應(yīng)用,內(nèi)容覆蓋了AMD在專業(yè)音視頻、工業(yè)、醫(yī)療
    的頭像 發(fā)表于 10-20 16:13 ?686次閱讀

    HarmonyOS音視頻開發(fā)概述

    音視頻開發(fā)指導(dǎo)中,將介紹各種涉及音頻、視頻播放或錄制功能場(chǎng)景的開發(fā)方式,指導(dǎo)開發(fā)者如何使用系統(tǒng)提供的
    發(fā)表于 10-17 16:39