0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OCR技術(shù)發(fā)展三大趨勢

hl5C_deeptechch ? 來源:CSDN技術(shù)社區(qū) ? 作者:CSDN技術(shù)社區(qū) ? 2020-10-12 11:37 ? 次閱讀

掃一掃就能識別文字,這是近年來出現(xiàn)在很多應(yīng)用中的新功能。比如,輸入銀行卡號時,直接用手機攝像頭掃一掃,軟件就能提取銀行卡信息。這里用到的技術(shù)正是光學(xué)字符識別技術(shù)(Optical Character Recognition)。 OCR 是光學(xué)字符識別(Optical Character Recognition)的縮寫,指利用機器將圖像中手寫體或印刷體的文本轉(zhuǎn)換為計算機可以直接處理的格式。作為計算機視覺領(lǐng)域的重要分支,OCR 典型應(yīng)用是通過圖像文字識別實現(xiàn)信息錄入。同時,由于文字和符號包含豐富的語義信息,基于 OCR 提取文字信息繼而進行分析,能夠幫助機器更好地理解圖像。

9 月 28 日,在工業(yè)和信息化部、北京市人民政府、國際電信聯(lián)盟 ITU-T 指導(dǎo)的 2020 AIIA 人工智能開發(fā)者大會上,主辦方正式發(fā)布國內(nèi)首份智能文字識別(OCR)能力測評與應(yīng)用白皮書。 白皮書從 OCR 發(fā)展背景、技術(shù)沿革、產(chǎn)業(yè)發(fā)展現(xiàn)狀、技術(shù)標準化、發(fā)展趨勢等多個維度,對當前國內(nèi) OCR 產(chǎn)業(yè)進行了一次詳細梳理,全面助推 OCR 技術(shù)產(chǎn)業(yè)化加速落地及可持續(xù)發(fā)展。

據(jù)了解,白皮書由中國信息通信研究院、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟、騰訊公司相關(guān)部門聯(lián)合起草。
新基建帶來新機遇,OCR技術(shù)發(fā)展三大趨勢

借助人工智能技術(shù),近年來 OCR 性能的不斷提升為產(chǎn)業(yè)數(shù)字化催生出的更復(fù)雜的 OCR 應(yīng)用場景提供了堅實支撐。同時,覆蓋手機、電子產(chǎn)品以及云服務(wù)在內(nèi)的更加多樣化的服務(wù)載體,進一步加快了 OCR 的普及,持續(xù)向社會生產(chǎn)生活的更多領(lǐng)域滲透。 尤其是 2020 年 4 月,發(fā)改委明確將人工智能基礎(chǔ)設(shè)施列入 “新基建” 范圍,作為人工智能應(yīng)用中最接 “地氣”,商業(yè)推廣較為成熟的領(lǐng)域,OCR 產(chǎn)業(yè)在“新基建” 背景下無疑將迎來新的發(fā)展機遇,相關(guān)技術(shù)也將迎來新一輪的變革。 報告指出,OCR 技術(shù)未來發(fā)展的三大方向主要包括一體化的端到端 OCR 模型、兼具高性能高效率的 OCR、從感知到認知的智能 OCR。 詳細來說,構(gòu)建一體化的端到端網(wǎng)絡(luò),同時對文字檢測和識別進行訓(xùn)練,將成為 OCR 技術(shù)發(fā)展的重要趨勢之一。端到端的網(wǎng)絡(luò)設(shè)計不僅能夠減少重復(fù)計算,又能夠提高特征的質(zhì)量,促進任務(wù)性能的改善。 同時,大量的 OCR 應(yīng)用需要在資源受限的移動端設(shè)備上運行,當前移動端 OCR 算法大多以犧牲一定的算法精度來換取運行速度,針對移動設(shè)備設(shè)計兼顧性能和效率的輕量 OCR 模型將是未來發(fā)展的重要方向。 另外,從感知到認知的智能 OCR 來說,OCR 技術(shù)通常從計算機視覺領(lǐng)域出發(fā),未來與自然語言處理技術(shù)、知識圖譜等更廣領(lǐng)域的交叉融合,通過語義及知識的深度挖掘提升 OCR 性能是重要趨勢。

此外,在 OCR 中引入強化學(xué)習(xí)和元學(xué)習(xí)等新的學(xué)習(xí)范式,讓機器自主學(xué)習(xí)如何識別文字,也將成為研究熱點。 市場規(guī)模達 133.81 億美元,OCR 成科技巨頭標配 目前,OCR 技術(shù)已在金融、保險、醫(yī)療、交通、教育等諸多行業(yè)有了深入成熟的應(yīng)用。未來隨著傳統(tǒng)行業(yè)的數(shù)字化轉(zhuǎn)型,OCR 應(yīng)用范圍和場景將進一步擴展,市場規(guī)模將進一步增大。有權(quán)威機構(gòu)預(yù)測,2025 年全球 OCR 市場規(guī)模將達到 133.81 億美元。 早期受限于技術(shù)發(fā)展水平,OCR 廠商通常從特定應(yīng)用切入,例如車牌識別系統(tǒng)等,形成了一系列專用設(shè)備。近年來,越來越多的終端設(shè)備及應(yīng)用均嵌入了 OCR 技術(shù),并逐漸形成了從基礎(chǔ)設(shè)施、基礎(chǔ)能力到終端應(yīng)用的完整產(chǎn)業(yè)鏈生態(tài),也衍生出了卡證、票據(jù)等一系列細分 OCR 能力,通過組合的方式服務(wù)于各個行業(yè)。

圖 | OCR 產(chǎn)業(yè)生態(tài)圖 不難看出,OCR 技術(shù)逐漸 “下沉” 為一項基本的能力,為上層不同的業(yè)務(wù)應(yīng)用提供底層技術(shù)支撐??萍季揞^和云計算廠商正在紛紛加速布局 OCR,在滿足自身內(nèi)部業(yè)務(wù)需求的同時,不斷對外開放先進的 OCR 能力,OCR 已然成為科技巨頭能力標配。 多行業(yè)場景成熟落地,首次發(fā)布OCR評測標準 在具體的落地應(yīng)用層面,目前卡證識別、票據(jù)識別等標準場景文字識別已經(jīng)相對成熟,手寫文字識別在教育、物流等行業(yè)的應(yīng)用也在不斷擴大。復(fù)雜動態(tài)場景下的 OCR 技術(shù)和應(yīng)用成為近兩年的熱門研究方向,比如在無人駕駛機器人等場景利用 OCR 對視場中出現(xiàn)的文字進行識別等。在此次發(fā)布的白皮書中,騰訊云也公布了其多項OCR領(lǐng)域的典型落地案例。

值得一提的是,為全面降低 OCR 相關(guān)領(lǐng)域的應(yīng)用門檻,避免出現(xiàn)魚龍混雜局面,白皮書也首次公布 OCR 評測標準和規(guī)范。 2020 年 4 月,中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟制定了《OCR 服務(wù)智能化分級技術(shù)要求和評估方法》,規(guī)定了 OCR 服務(wù)在功能、性能、安全等方面的技術(shù)要求以及評估方法。7 月,OCR 服務(wù)要求及評估方法在國際電信聯(lián)盟 ITU-T SG16 組成功立項,標志著深度學(xué)習(xí)背景下的 OCR 評測方法已經(jīng)逐漸被國際標準組織所接受。 目前,由中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟指導(dǎo),騰訊云開發(fā)的天鑒 OCR 服務(wù)引擎自動化評測平臺,不僅能夠為 OCR 技術(shù)供給方提供技術(shù)測試服務(wù),也將發(fā)布 OCR 技術(shù)或產(chǎn)品的測試結(jié)果,為需求方提供客觀公正的選型依據(jù)。
責任編輯人:CC

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    141

    瀏覽量

    16264

原文標題:中國首份OCR白皮書出爐,基于深度學(xué)習(xí)的OCR已成主流

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    藍牙技術(shù)發(fā)展趨勢和熱點解讀(下)

    洞見分析經(jīng)驗分享
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年08月19日 15:37:54

    藍牙技術(shù)發(fā)展趨勢和熱點解讀(上)

    洞見分析經(jīng)驗分享
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年08月19日 15:23:48

    無線充電技術(shù)發(fā)展趨勢

    目前無線充電技術(shù)還處于發(fā)展階段,距離方案的成熟尚需不斷探索和完善!降低熱損耗,提升效率縮短充電時間,改良充電曲線以更好的保護負載設(shè)備(終端或者電池等)。
    發(fā)表于 08-03 14:26

    移遠通信《5G RedCap技術(shù)發(fā)展及應(yīng)用白皮書》重磅發(fā)布

    6月25日,在2024MWC上海前夕,全球領(lǐng)先的物聯(lián)網(wǎng)整體解決方案供應(yīng)商移遠通信宣布,正式發(fā)布其《5GRedCap技術(shù)發(fā)展及應(yīng)用白皮書》。該白皮書對RedCap的技術(shù)特點、市場趨勢及應(yīng)用場景進行了
    的頭像 發(fā)表于 06-26 08:29 ?313次閱讀
    移遠通信《5G RedCap<b class='flag-5'>技術(shù)發(fā)展</b>及應(yīng)用白皮書》重磅發(fā)布

    華為發(fā)布2024數(shù)據(jù)中心能源十大趨勢,引領(lǐng)未來變革

    2024年1月15日,華為舉辦2024數(shù)據(jù)中心能源十大趨勢發(fā)布會并發(fā)布《白皮書》。JAEALOT2024年1月15日中國深圳2024年1月15日,華為舉辦2024數(shù)據(jù)中心能源十大趨勢發(fā)布會并發(fā)
    的頭像 發(fā)表于 01-17 08:25 ?454次閱讀
    華為發(fā)布2024數(shù)據(jù)中心能源十<b class='flag-5'>大趨勢</b>,引領(lǐng)未來變革

    區(qū)塊鏈技術(shù)發(fā)展現(xiàn)狀和趨勢

    近年來,區(qū)塊鏈技術(shù)作為一項顛覆性的創(chuàng)新技術(shù),引起了全球各行各業(yè)的廣泛關(guān)注。區(qū)塊鏈技術(shù)的出現(xiàn),為金融、供應(yīng)鏈、物聯(lián)網(wǎng)等各個領(lǐng)域帶來了很多變革的機會。本文將從區(qū)塊鏈技術(shù)的起源、
    的頭像 發(fā)表于 01-11 10:31 ?1808次閱讀

    2024年可預(yù)見的藍牙技術(shù)發(fā)展趨勢

    近期,Silicon Labs(亦稱“芯科科技”)負責藍牙技術(shù)的高級產(chǎn)品經(jīng)理Parker Dorris先生參與藍牙技術(shù)聯(lián)盟(Bluetooth SIG)的會員訪談,就2024年可預(yù)見的藍牙技術(shù)發(fā)展趨勢進行了討論,包括電子貨架標簽
    的頭像 發(fā)表于 01-08 17:27 ?1170次閱讀

    防雷及ESD靜電保護器件的發(fā)展趨勢| 浪拓電子

    主要的產(chǎn)品技術(shù)發(fā)展方向。 另一主要趨勢則是小型化封裝。防雷擊和ESD靜電保護組件小型化的趨勢越來越明顯。特別是超極本、平板計算機及智能手機等產(chǎn)品蓬勃發(fā)展,更顯得客戶端對此需求越來越殷切
    發(fā)表于 01-08 16:55

    2024人工智能四大趨勢

    2023年,世人見證了ChatGPT在全球范圍的大火。以生成式人工智能為代表的新一代人工智能問世,改變了人工智能(AI)技術(shù)與應(yīng)用的發(fā)展軌跡,加速了人與AI的互動進程,是人工智能發(fā)展史上的新里程碑。2024年,人工智能
    的頭像 發(fā)表于 01-05 10:37 ?973次閱讀

    臺積電:半導(dǎo)體制程技術(shù)發(fā)展大趨勢

    陳平博士認為,生成式AI的橫空出世成為了劃時代顛覆式的應(yīng)用,重要意義不亞于計算機誕生與互聯(lián)網(wǎng)誕生,甚至瓦特蒸汽機。他表示,大數(shù)據(jù)、大模型、大算力是支持生成式AI基礎(chǔ)的大要素,前兩個部分是AI科學(xué)家的工作,而提供支持大算力的晶體管,則是制造企業(yè)的工作。
    的頭像 發(fā)表于 12-06 17:24 ?1117次閱讀
    臺積電:半導(dǎo)體制程<b class='flag-5'>技術(shù)發(fā)展</b>的<b class='flag-5'>三</b><b class='flag-5'>大趨勢</b>

    淺談情感語音識別:技術(shù)發(fā)展與未來趨勢

    一、引言 情感語音識別是一種新興的人工智能技術(shù),它通過分析人類語音中的情感信息,實現(xiàn)人機之間的情感交互。本文將探討情感語音識別技術(shù)發(fā)展歷程、現(xiàn)狀以及未來趨勢。 二、情感語音識別
    的頭像 發(fā)表于 11-30 11:06 ?557次閱讀

    情感語音識別:技術(shù)發(fā)展與未來趨勢

    一、引言 情感語音識別是近年來人工智能領(lǐng)域的研究熱點,它通過分析人類語音中的情感信息,實現(xiàn)更加智能化和個性化的人機交互。本文將探討情感語音識別技術(shù)技術(shù)發(fā)展與未來趨勢。 二、情感語音識別技術(shù)
    的頭像 發(fā)表于 11-23 14:28 ?496次閱讀

    Small Cell技術(shù)發(fā)展趨勢、亮點及挑戰(zhàn)

    電子發(fā)燒友網(wǎng)站提供《Small Cell技術(shù)發(fā)展趨勢、亮點及挑戰(zhàn).pdf》資料免費下載
    發(fā)表于 11-10 15:05 ?0次下載
    Small Cell<b class='flag-5'>技術(shù)發(fā)展</b>的<b class='flag-5'>趨勢</b>、亮點及挑戰(zhàn)

    低功耗WiFi模塊的技術(shù)發(fā)展

    隨著物聯(lián)網(wǎng)的迅速發(fā)展,對于低功耗設(shè)備和技術(shù)的需求日益增加。低功耗WiFi模塊應(yīng)運而生,為連接大量設(shè)備提供了更長的電池壽命和更可持續(xù)的能源解決方案。本文將深入研究低功耗WiFi模塊的技術(shù)發(fā)展,探討其在物聯(lián)網(wǎng)和移動設(shè)備領(lǐng)域的關(guān)鍵作用
    的頭像 發(fā)表于 11-02 16:34 ?602次閱讀

    新能源汽車充電市場的大趨勢

    大趨勢將推動電動汽車充電市場的發(fā)展,為更快速、更高效的充電解決方案提供了新的可能性,有望在全球范圍內(nèi)促進電動汽車的普及。向更高電壓架構(gòu)的過渡有望提高性能并縮短充電時間,同時監(jiān)管舉措將支持快速充電設(shè)施的部署。這些
    的頭像 發(fā)表于 09-27 10:26 ?1809次閱讀
    新能源汽車充電市場的<b class='flag-5'>三</b><b class='flag-5'>大趨勢</b>