0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

科大訊飛智能錄音筆升級,可進行12種方言和10種語種轉寫

牽手一起夢 ? 來源:智東西 ? 作者:佚名 ? 2020-06-01 15:33 ? 次閱讀

5月27日消息,科大訊飛針對其訊飛智能錄音筆進行錄音、轉寫和編輯三大性能升級,新增支持聲源定位、12種方言和10種語種轉寫、支持智能摘要等13項功能,進一步為用戶帶來更便捷高效的錄音體驗。

去年5月,科大訊飛一槍打在了傳統(tǒng)錄音筆市場創(chuàng)新賽道上,推出業(yè)內(nèi)首款帶屏錄音筆——訊飛智能錄音筆SR系列,直接催生了一個潛力不可小覷的新品類市場。

至今,SR系列已覆蓋媒體、商務、教育、律政等應用領域,進入全球115個國家、646座城市的市場,并拿下2019年雙11天貓&京東雙平臺錄音筆品類和單品銷售額第一的成績。

如今,隨著今年全國兩會如火如荼地召開,訊飛智能錄音筆亦成為人民網(wǎng)、文匯報、齊魯晚報、21世紀經(jīng)濟報道4家媒體記者團,報道兩會的指定錄音筆,協(xié)助記者等專業(yè)團隊提高報道效率,更好地記錄民聲民意。

實現(xiàn)這一系列成果,訊飛智能錄音筆只花了一年。

在這背后,既是訊飛自2016年成立消費者事業(yè)群以來,在To C市場不斷摸索和布局,也是訊飛智能語音技術21年來的技術積累,在轉寫賽道上不斷研發(fā)創(chuàng)新。

在這個千萬級規(guī)模的錄音筆市場下,訊飛哪來的信心和底氣選擇以帶屏錄音筆殺入這個幾乎飽和,卻玩家擁擠的市場?自敲開錄音筆新品類市場后,訊飛在過去一年又取得了哪些重要的成績?市場又發(fā)生了哪些變化?

為此,智東西再度獨家對話科大訊飛聯(lián)合創(chuàng)始人&執(zhí)行總裁胡郁、科大訊飛副總裁兼消費者事業(yè)群副總裁李傳剛,在直擊訊飛三大重磅升級的同時,進一步揭開這些答案的真實面紗。

一、三大升級亮點:支持超20種語言語種,遠程拾音準確率提升30%

“作為AI錄音筆的龍頭廠商,我們應該盡快讓用戶體驗到AI技術與錄音筆融合的真正效果?!焙粽劦剑谶^去一年,訊飛不斷地對錄音筆AI性能進行優(yōu)化和升級,選擇在今天進行重要的三大升級,也是為了讓原有的錄音筆用戶率先體驗更新穎的智能化功能。

此次,訊飛智能錄音筆主要圍繞智能錄音、語音轉寫和智能編輯三個方面,進行13項重要升級,包括聲源定位、方言轉寫、語義分段、個人詞庫等功能。

1、智能錄音:360度聲源定位,準確率提升30%

針對錄音的專業(yè)性,訊飛智能錄音筆新增了錄音聲源定位、非人聲過濾和高增益降噪三項功能。

一是聲源定位,錄音筆能夠通過判斷聲源方位,實現(xiàn)更好的拾音效果;二是非人聲過濾,其與AI算法相配合,可將錄音中空白或嘈雜等無用聲去掉,保留有用人聲;三是高增益降噪,在5至15米的錄音范圍內(nèi),轉寫準確率提升30%,人聲也更加清晰。

2、語音轉寫:支持22種語言+語種,7大專業(yè)領域轉寫

這方面升級中的最大亮點在于新增了粵語、河南話、云南話和重慶話等12種方言轉寫,維吾爾語和藏語兩種少數(shù)民族語言轉寫,以及西班牙語、越南語、俄語、英語、日語和韓語等8種語種轉寫,進一步擴大錄音筆的語言應用場景。

同時,針對不同領域的專業(yè)術語轉寫,訊飛還更新了7大專業(yè)領域的轉寫支持,覆蓋IT科技、財經(jīng)貿(mào)易、文化體育、醫(yī)療、政法、運營商和教育領域。同時,還新增中英文混合轉寫功能功能。

3、智能編輯:個性化詞庫,文字編輯更清晰

面對不同錄音場景、多個說話人和口語表達習慣,訊飛在智能編輯方面新增了智能語義分段、自動區(qū)分講話人、口語規(guī)整、個人詞庫和智能摘要5項功能,讓錄音筆能更智能地進行文字編輯。

例如,在區(qū)分講話人方面,錄音筆采用了訊飛的聲紋識別技術,能根據(jù)錄音及轉寫結果,自動區(qū)分并標注講話人。

“這次三大方面的功能升級,不僅能更加滿足消費者的需求和體驗,也更利于我們對市場的開拓和認知?!崩顐鲃傉f。

三大升級之于訊飛智能錄音筆,不僅是對產(chǎn)品性能和體驗的進一步豐富完善,提升訊飛在錄音筆新品類市場的優(yōu)勢和競爭力,同時它之于錄音筆之上的訊飛消費者事業(yè)群,亦為其深入布局AI+辦公這一細分市場提供了新的技術儲備和解決方案。

“拳頭”升級,訊飛打響的帶屏智能錄音筆新戰(zhàn)局再度升溫。

二、21年深耕與積累,訊飛智能語音技術的硬核力量

羅馬并非一日建成。訊飛智能錄音筆能在短時間內(nèi)站穩(wěn)市場,并占據(jù)一定身位的領先優(yōu)勢,是其長達21年的智能語音技術迭代和積累。

“過去幾年,我們的智能語音技術曾經(jīng)歷了三次較大的革新與升級?!焙籼岬剑@主要集中在語音識別、方言識別,以及多語種的錄音轉寫、翻譯上,而這些技術性能亦是訊飛大舉進攻細分市場的差異化競爭點。

在語音識別領域,訊飛語音識別模塊采用了基于深度全序列卷積神經(jīng)網(wǎng)絡的語音識別框架,識別準確率達98%,同時還通過多麥克風陣列去混響和多麥克風波束成形,進一步提升信噪比。如今,其麥克風陣列與錄音筆回傳的數(shù)據(jù)進行疊加后,能夠在幾十米的范圍內(nèi)獲得更好的拾音效果。

在多語言識別領域,不管是中國方言的識別,還是全球多語種的錄音轉寫和翻譯,訊飛都下足了功夫。

簡單地說,針對方言識別,訊飛采用統(tǒng)一的建模技術,通過少量的方言數(shù)據(jù),進一步提升錄音筆在方言語境場景的錄音效果;另一方面,訊飛通過語音識別技術的不斷研發(fā)和優(yōu)化,將多語種的轉寫和翻譯性能效果都實現(xiàn)了提升。

尤其在多語言識別方面,胡郁透露,目前中國科學院專門支持中國科學技術大學開展了一項多語識別先導項目,目標研發(fā)超過50個語種以上的核心技術,涉及語音識別、語音合成以及自然語言處理等技術。

“這是目前國內(nèi)投資規(guī)模最大的多語種研發(fā)項目,現(xiàn)階段還沒有任何一家公司有這樣的資源和能力,對這種規(guī)模的多語種系統(tǒng)進行研發(fā)?!焙粽劦?,這將進一步促進訊飛在多語言技術領域的研究。

如今,訊飛智能錄音筆的研發(fā)團隊已突破百人規(guī)模,包括硬件、軟件、UI交互等均由訊飛的核心研發(fā)力量設計。

值得一提的是,隨著訊飛在智能語音領域長達21年的布局和深耕,已打下了堅實的技術根基,技術儲備力量不斷豐富。

其中以語音識別技術為例,早在2016年,訊飛就已在國際多通道語音分離和識別大賽CHiME-4中,一鼓作氣拿下了三個項目第一。在2020年CHiME-6上,訊飛不僅在給定說話人邊界的多通道語音識別任務中奪冠,更刷新了自己在CHiME-5中的語音識別錯誤率記錄,從46.1%降至30.5%。

這二十余年的技術成果與積累,無疑為訊飛敲開錄音筆市場新品類的大門,帶來了十足的信心與底氣。

三、打響帶屏錄音筆市場第一槍,技術融合下的小爆發(fā)

一面是人工智能不斷賦能各行各業(yè)的技術浪潮,一面是當下傳統(tǒng)錄音筆和錄音技術的轉寫痛點,訊飛澆灌了21年的智能語音技術,終于在帶屏錄音筆這塊新市場中破了土,發(fā)了芽。

訊飛入局錄音筆市場的第一槍,為何瞄準了帶屏錄音筆?

“加入訊飛前我就在想,AI作為未來的一個技術發(fā)展方向,除了在手機、智能穿戴設備和智能音箱智能硬件方面賦能,還能在哪里找到突破口?”李傳剛談到,作為北大MBA的導師,他經(jīng)常到北大與學生們進行案例討論,當時他發(fā)現(xiàn),學生幾乎人手備有一個傳統(tǒng)錄音筆,主要用在對知識的記錄與鞏固上。

但問題是,他們常常需要自己再花時間重復聽一遍錄音,才能將內(nèi)容記錄下來。這一大量的時間和人力成本,讓李傳剛抓到了新的突破口——傳統(tǒng)錄音筆與AI的技術融合。

在與胡郁進行了一番溝通后,李傳剛發(fā)現(xiàn)訊飛也正在考慮這一方向,兩人一拍即合。經(jīng)歷將近半年的硬件研發(fā)與打磨,2019年5月,訊飛智能錄音筆SR系列終于面世。

一石激起千層浪,SR系列的推出直接點燃了傳統(tǒng)錄音筆市場的熱情。

一方面,訊飛智能錄音筆SR系列一上市,就在2019年京東“618”中獲得錄音筆品類成交金額第一的成績,目前已進駐全國超2000家線下門店;另一方面,現(xiàn)階段SR系列也已拓展至國際市場,進入全球115個國家,646個城市中銷售。

“訊飛智能錄音筆SR系列最大的創(chuàng)新性并不在于帶屏,而在于將它是一個獨立的智能錄音設備?!痹诤艨磥?,在不同的場合下,用戶對錄音筆的心理依賴程度不同。

一個單獨的錄音筆,并不會像手機錄音軟件一樣受到各種干擾,它能持續(xù)獨立地使用,同時又能通過統(tǒng)一的賬號在手機和PC上進行后臺處理?;诤笈_操作的需求,才進而衍生出大屏的需求,讓用戶的操作更加便捷?!耙粋€獨立的能夠進行智能轉寫的設備,這才是它的顛覆性所在?!焙粽f。

隨著訊飛智能錄音筆SR系列的推出,訊飛消費者事業(yè)部的智能硬件產(chǎn)品線得到了很大的豐富。除了SR系列智能錄音筆外,訊飛聽見系列也正逐步朝更大的市場邁進,同時與錄音轉寫相關的硬件設備也在預期中迅速增長。

在此影響下,訊飛的AI廣告和內(nèi)容服務業(yè)務,以及與政府、國企之間的業(yè)務也在加速發(fā)展。據(jù)科大訊飛2019年財報,在2019年度,訊飛的營收首次突破100億人民幣,達到100.79億元,同比增長27.30%。其中,消費者業(yè)務營收36.25億人民幣,同比增長43.99%,占總營收比進一步攀升至35.96%。

To B+To C的雙線戰(zhàn)略驅動下,訊飛正加速發(fā)展。

四、創(chuàng)新=藍海,訊飛消費者業(yè)務的三駕馬車

從一支小小的錄音筆,到如今多了一塊屏幕與AI技術協(xié)同發(fā)展成一個新品類,在訊飛智能錄音筆SR系列推出后的短短一年內(nèi),錄音筆市場經(jīng)歷了翻天覆地的變化。

“對于整個錄音筆市場來說,我們打開的并不是一個存量市場,而是一個新的增量市場?!崩顐鲃傉f。

一面是整個行業(yè)在思考錄音筆市場的未來走向,不斷解決消費者的多樣化轉寫需求;一面是傳統(tǒng)玩家與新玩家攜手,共同建立產(chǎn)業(yè)聯(lián)盟,以加速推進包括轉寫技術、智能語音識別技術在傳統(tǒng)錄音筆中的融合發(fā)展。

隨著玩家的不斷轉型和創(chuàng)新發(fā)展,又將會給訊飛帶來哪些挑戰(zhàn)?

“整體上看,更多玩家的加入我覺的是一件好事?!焙粽劦?,由于現(xiàn)在從傳統(tǒng)錄音筆向智能錄音筆轉換的過程中,最大的障礙仍然是用戶教育——如何讓用戶意識到使用智能錄音筆更有價值。

盡管訊飛開拓了新的錄音筆品類市場,但縱觀整個產(chǎn)業(yè)的發(fā)展,它仍是一個螺旋式上升的過程,智能化發(fā)展也將是這一產(chǎn)業(yè)逐漸演變的方向。在這一過程中,既要靠消費者消費習慣的轉變,也需要靠傳統(tǒng)錄音筆廠商自身的轉型推動。

“不管有多少玩家加入,訊飛在這市場中仍是一個龍頭地位?!焙粽f,訊飛非常有信心在這個市場中持續(xù)保持自己的領先優(yōu)勢,這一信心也來自于訊飛所提供的多樣性服務,例如面向政府部門的會議寶,以及涉及面向教育、商務和律政等應用場景下的智能硬件產(chǎn)品。

據(jù)產(chǎn)業(yè)研究機構新思界最新發(fā)布的《2019-2023年錄音筆行業(yè)深度市場調研及投資策略建議報告》,2018年,我國錄音筆行業(yè)的產(chǎn)量約為452.12萬臺,出貨量與2017年的431.97萬臺基本持平。

整體來看,我國錄音筆市場出貨量較為穩(wěn)定,市場規(guī)模仍較小。那么,在這之下的AI+錄音筆市場又將如何發(fā)展呢?

“創(chuàng)新永遠是藍海?!崩顐鲃傉劦?,傳統(tǒng)錄音筆市場的需求在過去二、三十年并未產(chǎn)生太大變化,但隨著AI技術的賦能,錄音筆除了錄音之外,還將具有智能轉寫、智能翻譯和智能編輯等更多功能,市場規(guī)模也將進一步擴大,激發(fā)出更多原有錄音技術不足而未開發(fā)的市場。

市場仍在潛滋暗長,科大訊飛的下一步在哪里?

縱觀訊飛的消費者事業(yè)群,胡郁談到,訊飛將持續(xù)以平臺(iFLYOS操作系統(tǒng))、硬件(智能硬件)、服務(廣告和運營商互聯(lián)網(wǎng)服務)為發(fā)展重心,進一步拉動“AI+翻譯”、“AI+辦公”、“AI+教育”三駕馬車同時往前走。

往后看,是訊飛在智能語音領域長達21年的技術基因和積累;往前看,是訊飛在AI技術熱潮下敢于嘗試技術跨界與融合創(chuàng)新的信心和勇氣。

結語:以AI為刃,傳統(tǒng)錄音筆市場的創(chuàng)新與變革

回顧智能錄音筆市場過去一年的發(fā)展,科大訊飛按下的,不僅是自身消費者業(yè)務加速布局智能市場的“快進鍵”,也是錄音筆行業(yè)與AI技術跨界融合下催生新市場的“啟動鍵”。在這一節(jié)點下,訊飛智能錄音筆三大技術的升級,也將為公司以及市場競爭的發(fā)展添加新的差異化競爭優(yōu)勢。

談及智能錄音筆的未來,胡郁認為將有兩條路,一是與手機APP等結合,朝著極簡的方向發(fā)展,二是向更高端、更專業(yè)的定制化獨立設備前進。這條路究竟走向何方,我們尚不得而知。

但我們能看到的是,在當下傳統(tǒng)錄音筆結合新興技術的轉型下,有越來越多的玩家投入這片藍海市場,他們單打獨斗也好,互相結盟也罷,同一個目標無疑都是搶下這塊蛋糕。在這場愈發(fā)激烈的長跑賽道上,最終誰將真正拔得頭籌?我們拭目以待。

責任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    29809

    瀏覽量

    268108
  • 科大訊飛
    +關注

    關注

    19

    文章

    788

    瀏覽量

    61145
  • 智能音箱
    +關注

    關注

    31

    文章

    1782

    瀏覽量

    78439
收藏 人收藏

    評論

    相關推薦

    錄音筆芯片方案:NVF04M-SOP16高品質錄音IC,捕捉每一個音節(jié)

    概述錄音筆從最初的模擬錄音,到如今的數(shù)字高清錄音,再到集高清錄音、錄音轉文字、同聲傳譯、云端存儲等功能于一體的
    的頭像 發(fā)表于 10-25 16:07 ?195次閱讀
    <b class='flag-5'>錄音筆</b>芯片方案:NVF04M-SOP16高品質<b class='flag-5'>錄音</b>IC,捕捉每一個音節(jié)

    科大發(fā)布星火4.0 Turbo:七大能力超GPT-4 Turbo

    10月24日,在科大全球1024開發(fā)者節(jié)上,科大
    的頭像 發(fā)表于 10-24 11:39 ?342次閱讀

    科大星火APP/Desk全新升級

    星火V4.0 如期而至,升級成為更懂你的AI助手。
    的頭像 發(fā)表于 09-14 14:41 ?1965次閱讀

    科大AI總部園區(qū)正式啟用

    近日,安徽省科技創(chuàng)新領域迎來又一重大里程碑,科大AI總部園區(qū)(小鎮(zhèn))正式宣告啟用,標志著這一集前沿科技、創(chuàng)新研發(fā)與高端人才于一體的智
    的頭像 發(fā)表于 09-03 16:06 ?469次閱讀

    科大發(fā)布智能辦公本Air 2

    近日,科大隆重舉辦了智能辦公本新品發(fā)布會,正式推出了集前沿科技與高效辦公于一體的
    的頭像 發(fā)表于 08-08 10:43 ?586次閱讀

    智能語音轉寫系統(tǒng)確保企業(yè)數(shù)據(jù)的安全性

    糾錯以及多語種支持等特性,正在深刻改變著會議記錄、教育培訓、采訪報道和法律取證等多個領域的工作方式。 一、系統(tǒng)介紹 智能語音轉寫系統(tǒng),是一款智能
    的頭像 發(fā)表于 08-02 15:53 ?536次閱讀

    科大AI學習機暑期重磅升級

    。得益于這些大獎AI技術的支撐,科大AI學習機自2019年問世以來,即持續(xù)引領行業(yè)發(fā)展,開創(chuàng)了個性化精準學這一革命性學習方式。 ? 6月27日,科大
    的頭像 發(fā)表于 07-08 09:38 ?554次閱讀

    科大發(fā)布星火大模型V4.0

    在科技創(chuàng)新的浪潮中,科大再度引領潮流,于北京隆重發(fā)布了星火大模型V4.0及其在多領域的人工智能
    的頭像 發(fā)表于 07-01 10:33 ?814次閱讀

    錄音筆設計開發(fā)人員合作,我去哪里找?。空垎栍腥藭@個嗎?

    芯片錄音筆,會設計開發(fā)制作錄音筆,我會提出一些功能要求,您來開發(fā),提供完整的技術資料~
    發(fā)表于 06-26 16:00

    科大華中總部已封頂 年內(nèi)交付使用

    科大華中總部已封頂 年內(nèi)交付使用 科大華中總部位于武漢經(jīng)開區(qū)車谷資本島,投資額50億;計
    的頭像 發(fā)表于 04-16 14:49 ?1420次閱讀

    科大子公司醫(yī)療正式申請港交所上市

    科大旗下控股子公司醫(yī)療已于1月26日正式向港交所遞交上市申請,計劃在香港主板上市。這是科大
    的頭像 發(fā)表于 02-04 13:57 ?1186次閱讀

    科大發(fā)布“星火V3.5”:基于全國產(chǎn)算力訓練的全民開放大模型

    科大,作為中國領先的智能語音和人工智能公司,近日宣布推出首個基于全國產(chǎn)算力訓練的全民開放大模型“
    的頭像 發(fā)表于 02-04 11:28 ?1439次閱讀

    科大星火認知大模型V3.5發(fā)布

    近日,科大舉辦了星火認知大模型V3.5升級發(fā)布會。在發(fā)布會上,科大
    的頭像 發(fā)表于 01-31 17:28 ?1332次閱讀

    科大發(fā)布星火語音大模型

    科大行業(yè)資訊
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年01月31日 09:17:28

    科技創(chuàng)新與智能助力:揭秘科大智能鍵盤D1的獨特魅力

    魅力,從多個功能角度進行介紹,并探討其適用于年會采購、企業(yè)送禮以及辦公采購等場景。 ? 一、語音翻譯:打破語言壁壘 智能鍵盤D1搭載了科大
    的頭像 發(fā)表于 01-03 11:02 ?600次閱讀
    科技創(chuàng)新與<b class='flag-5'>智能</b>助力:揭秘<b class='flag-5'>科大</b><b class='flag-5'>訊</b><b class='flag-5'>飛</b><b class='flag-5'>智能</b>鍵盤D1的獨特魅力