0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么賽靈思技術(shù)成為開發(fā)OCR解決方案的不二之選?

YCqV_FPGA_EETre ? 來源:FPGA開發(fā)圈 ? 作者:Softnautics ? 2020-10-26 09:53 ? 次閱讀

作者:Softnautics 市場(chǎng)營(yíng)銷總監(jiān)Prasant Agarwal

解決方案總監(jiān) Ranganathan SK

文本是人類最具智慧、最有影響力的創(chuàng)造之一。文本中所蘊(yùn)含的豐富、精確的高級(jí)語義可以幫助我們理解周遭世界,并用于構(gòu)建可部署在真實(shí)環(huán)境中的自主運(yùn)行解決方案。因此,自然環(huán)境下的自動(dòng)文本讀取,也稱為場(chǎng)景文本檢測(cè)/識(shí)別或 Photo OCR(Optical Character Recognition,光學(xué)字符識(shí)別),已成為計(jì)算機(jī)視覺領(lǐng)域中關(guān)注度和重要性日益提高的研究課題。

隨著人類語言書寫形式的演進(jìn),已經(jīng)發(fā)展出數(shù)千種獨(dú)特的字體系。再加上大小寫(大寫/小寫/全大全小/小型大寫)、斜體(意大利體/羅馬體)、縮放體(橫向縮放)、粗細(xì)、指定大小(顯示/文本)、波痕體、襯線(總體分為襯線體和無襯線體),這一數(shù)量可以擴(kuò)充到數(shù)百萬,使得文本識(shí)別成為機(jī)器學(xué)習(xí)領(lǐng)域中一個(gè)振奮人心的專業(yè)學(xué)科。

為什么賽靈思技術(shù)成為開發(fā) OCR 解決方案的不二之選?

如今,賽靈思豐富多樣的強(qiáng)大平臺(tái)已為 70% 的新開發(fā)提供支持,引領(lǐng)著基于 FPGA 系統(tǒng)的設(shè)計(jì)發(fā)展趨勢(shì)。Softnautics 之所以選擇賽靈思技術(shù)來實(shí)現(xiàn)這個(gè)解決方案,是因?yàn)樗瑫r(shí)集成了 Vitis AI 堆棧和強(qiáng)大的硬件功能。

賽靈思 Vitis 是一款免費(fèi)、開源的開發(fā)平臺(tái),可將硬件模塊封裝成軟件可調(diào)用功能,同時(shí)與標(biāo)準(zhǔn)的開發(fā)環(huán)境、工具和開源庫兼容。它能夠根據(jù)軟件和算法自動(dòng)適配賽靈思硬件,無需具備 VHDL 或 Verilog 專業(yè)知識(shí)。

選擇正確的賽靈思平臺(tái)

綜合全面且豐富多樣的賽靈思工具集和生態(tài)系統(tǒng)使原型設(shè)計(jì)成為高度可預(yù)測(cè)的過程,這有助于加快解決方案的開發(fā)速度,從而將總體開發(fā)時(shí)間縮短高達(dá) 70%。

Softnautics 選擇賽靈思 Ultrascale+ 平臺(tái)是因?yàn)樗峁┝俗顑?yōu)秀的應(yīng)用處理和 FPGA 加速功能。此外,它還提供了優(yōu)異的高層次綜合(HLS)功能。與此前的平臺(tái)相比,系統(tǒng)級(jí)單位功耗性能提高了 4 倍。它支持賽靈思 Vitis AI,后者為使用加速庫構(gòu)建 AI 推斷提供了廣泛功能。

Softnautics 采用了賽靈思 Vitis AI 堆棧并運(yùn)用該軟件提供加速,開發(fā)出混合應(yīng)用,同時(shí)實(shí)現(xiàn)了 LSTM 功能,通過將 TensorFlow-lite 移植/遷移到 ARM 進(jìn)行有效的序列預(yù)測(cè)。它使用 N2Cube 軟件在處理側(cè)(PS)運(yùn)行。圖像預(yù)處理/后處理通過 Vivado 使用 HLS 實(shí)現(xiàn),而 Vitis 的作用是使用連接文本提議網(wǎng)絡(luò)(CTPN)完成推斷。最終,Softnautics 將該解決方案用于視頻流水線中的實(shí)時(shí)場(chǎng)景文本檢測(cè),并使用可靠的數(shù)據(jù)集對(duì)模型進(jìn)行改進(jìn)。

場(chǎng)景文本檢測(cè)

目前已有多種實(shí)現(xiàn)方案可供使用,新的實(shí)現(xiàn)方案也在研究中。在自然場(chǎng)景進(jìn)行文本檢測(cè)和識(shí)別時(shí),仍然可能會(huì)遇到一系列的艱巨挑戰(zhàn)。與文檔中的腳本相比,自然場(chǎng)景下的檢測(cè)和識(shí)別困難主要源于以下三大差異:

語言、顏色、字體、大小、方向等造成的多樣化和可變性 書寫文本的背景色彩鮮艷 場(chǎng)景文本的縱橫比和布局可能會(huì)有很大的不同

這種解決方案廣泛適用于要求對(duì)視頻流進(jìn)行實(shí)時(shí)文本檢測(cè)的眾多領(lǐng)域,具有較高的精確度和快速識(shí)別能力。部分典型應(yīng)用領(lǐng)域如:
泊車驗(yàn)證 — 一些市鎮(zhèn)按照城市規(guī)定正在使用移動(dòng) OCR 自動(dòng)驗(yàn)證車輛是否按照市鎮(zhèn)規(guī)定泊車。城市泊車檢查員使用配備有 OCR 功能的移動(dòng)設(shè)備掃描車輛牌照,并通過在線數(shù)據(jù)庫查看是否允許該車輛泊車。 移動(dòng)文檔掃描 — 各種移動(dòng)應(yīng)用允許用戶為文檔拍照,然后將其轉(zhuǎn)換成文本。與采用傳統(tǒng)的文檔掃描儀相比,這種 OCR 工作的難度更大,因?yàn)檎掌趫D像角度、光照條件和文本質(zhì)量方面往往無法預(yù)測(cè)。 數(shù)字資產(chǎn)管理 — 該軟件有助于對(duì)圖像、視頻和動(dòng)畫等富媒體資產(chǎn)進(jìn)行組織管理。DAM 系統(tǒng)的主要特征之一就是能搜索富媒體。通過在上傳的圖像和視頻幀上運(yùn)行 OCR,DAM 能讓富媒體變得可搜索,并使用有意義的標(biāo)簽豐富它。

Softnautics 團(tuán)隊(duì)一直深耕基于賽靈思 FPGA 的解決方案,在賽靈思技術(shù)方面積累了豐富的經(jīng)驗(yàn),并深刻理解各種復(fù)雜性。因此,該公司僅用不到四個(gè)星期便推動(dòng)這一解決方案從構(gòu)思到概念驗(yàn)證的飛速進(jìn)展。依托公司針對(duì)端到端解決方案構(gòu)建的專業(yè)知識(shí),您能夠在賽靈思平臺(tái)上借助最快速的概念實(shí)現(xiàn)服務(wù),可視化您的構(gòu)想,大幅加快上市進(jìn)程。

原文標(biāo)題:智能 OCR 解決方案使用 Xilinx Ultrascale+ 和 Vitis AI 進(jìn)行開發(fā)

文章出處:【微信公眾號(hào):FPGA開發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1620

    文章

    21511

    瀏覽量

    599030
  • 賽靈思
    +關(guān)注

    關(guān)注

    32

    文章

    1794

    瀏覽量

    130966
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28900

    瀏覽量

    266269
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    141

    瀏覽量

    16264

原文標(biāo)題:智能 OCR 解決方案使用 Xilinx Ultrascale+ 和 Vitis AI 進(jìn)行開發(fā)

文章出處:【微信號(hào):FPGA-EETrend,微信公眾號(hào):FPGA開發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    快訊 | 發(fā)展新質(zhì)生產(chǎn)力問道?如何下好“創(chuàng)新棋”?

    7月11日,南湖區(qū)委宣傳部、清華大學(xué)馬克主義學(xué)院共同帶隊(duì)一行蒞臨圍繞時(shí)頻新質(zhì)生產(chǎn)力創(chuàng)新層面進(jìn)行實(shí)地調(diào)研,副總經(jīng)理田永和、對(duì)外合作部
    的頭像 發(fā)表于 07-12 13:31 ?365次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>快訊 | 發(fā)展新質(zhì)生產(chǎn)力問道<b class='flag-5'>賽</b><b class='flag-5'>思</b>?<b class='flag-5'>賽</b><b class='flag-5'>思</b>如何下好“創(chuàng)新棋”?

    地物光譜儀怎么?

    的性能和便捷的操作成為野外遙感環(huán)境監(jiān)測(cè)的不二。本文將詳細(xì)介紹iSpecField-HH的技術(shù)特點(diǎn)、應(yīng)用領(lǐng)域以及其在野外環(huán)境中的優(yōu)勢(shì)。 一
    的頭像 發(fā)表于 07-05 15:21 ?198次閱讀
    地物光譜儀怎么<b class='flag-5'>選</b>?

    迅為RK3562開發(fā)板安卓人工智能主板性能

    迅為RK3562開發(fā)板安卓人工智能主板性能
    的頭像 發(fā)表于 05-31 11:32 ?712次閱讀
    迅為RK3562<b class='flag-5'>開發(fā)</b>板安卓人工智能主板性能<b class='flag-5'>之</b><b class='flag-5'>選</b>

    默飛CEMS超低濃度監(jiān)測(cè)解決方案

    電子發(fā)燒友網(wǎng)站提供《默飛CEMS超低濃度監(jiān)測(cè)解決方案.docx》資料免費(fèi)下載
    發(fā)表于 05-23 09:42 ?0次下載

    給我一個(gè)FPGA,可以撬起所有顯示的接口和面板

    FPGA開發(fā)了針對(duì)視頻領(lǐng)域的各種專用傳輸接口,針對(duì)8K應(yīng)用的HDMI2.1,DP1.4等,我們利用FPGA可編程快速迭代的特點(diǎn),最早給出解決方案,可以比競(jìng)爭(zhēng)對(duì)手,或者ASIC方案,更快的推出新產(chǎn)品?!? 當(dāng)然,在未來,酆毅稱,
    發(fā)表于 04-25 18:10

    大模型推理顯卡選購指南:4090顯卡為何成為不二

    開發(fā)者非常關(guān)注的話題。 現(xiàn)在市面上加速卡型號(hào)多如牛毛,但說到適用大模型推理的顯卡,那4090顯卡絕對(duì)是現(xiàn)階段“推理王卡”般的存在。論性能不如H100,論價(jià)格不如3090,看似平平無奇的4090顯卡為何能在眾多競(jìng)爭(zhēng)者中脫穎而出,成為大模型推理的
    的頭像 發(fā)表于 04-11 11:00 ?540次閱讀
    大模型推理顯卡選購指南:4090顯卡為何<b class='flag-5'>成為</b><b class='flag-5'>不二</b><b class='flag-5'>之</b><b class='flag-5'>選</b>

    FPGA flash操作原理

    FPGA flash操作原理分享
    的頭像 發(fā)表于 04-09 15:03 ?807次閱讀

    pcb的爬電距離解決方案大全

    pcb的爬電距離解決方案大全
    的頭像 發(fā)表于 03-14 15:26 ?1259次閱讀

    有償求助.芯片方案

    芯片電路圖方案
    發(fā)表于 01-12 18:19

    WTN6xxx系列OTP語音芯片:智能語音解決方案的可靠

    在智能語音交互領(lǐng)域,唯創(chuàng)知音的WTN6xxx系列OTP語音芯片以其獨(dú)特的特性成為聲音播放提示IC的可靠。本文將深入探討WTN6xxx系列OTP語音芯片的應(yīng)用優(yōu)勢(shì),展示其在各個(gè)方面的卓越性能。一
    的頭像 發(fā)表于 12-14 10:12 ?389次閱讀
    WTN6xxx系列OTP語音芯片:智能語音<b class='flag-5'>解決方案</b>的可靠<b class='flag-5'>之</b><b class='flag-5'>選</b>

    全球FPGA市場(chǎng)現(xiàn)狀和發(fā)展前景展望

    中國(guó)快速發(fā)展的PLD市場(chǎng),特別成立了兩個(gè)專門的產(chǎn)品小組分別負(fù)責(zé)數(shù)字信號(hào)處理和低成本消費(fèi)電子解決方案開發(fā)。
    發(fā)表于 11-08 17:19

    萊迪ORAN解決方案加快電信應(yīng)用開發(fā)和上市

    萊迪半導(dǎo)體公司近日宣布萊迪ORAN解決方案集合榮獲2023年網(wǎng)絡(luò)安全突破獎(jiǎng)“年度整體網(wǎng)絡(luò)解決方案”類別。萊迪ORAN旨在提供穩(wěn)定的控制
    的頭像 發(fā)表于 10-20 17:03 ?784次閱讀

    【KV260視覺入門套件試用體驗(yàn)】Vitis AI Library體驗(yàn)OCR識(shí)別

    翻譯成計(jì)算機(jī)文字的過程;即,針對(duì)印刷體字符,采用光學(xué)的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點(diǎn)陣的圖像文件,并通過識(shí)別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)。如何除錯(cuò)或利用
    發(fā)表于 10-16 23:25

    【KV260視覺入門套件試用體驗(yàn)】Vitis AI 構(gòu)建開發(fā)環(huán)境,并使用inspector檢查模型

    、低成本的 AI 解決方案。 Vitis AI 可以做什么? Vitis AI 可以做很多事情,例如: 優(yōu)化和編譯深度學(xué)習(xí)模型,使其適應(yīng)硬件平臺(tái)的架構(gòu)和性能。 提供豐富的 AI
    發(fā)表于 10-14 15:34

    【KV260視覺入門套件試用體驗(yàn)】三、缺陷檢測(cè)

    。這些應(yīng)用是完整、可量產(chǎn)的端到端解決方案,專門支持常 見的視覺用例。加速應(yīng)用在可編程邏輯區(qū)域包含一個(gè)預(yù)優(yōu)化的視覺流水線加速器。開發(fā)
    發(fā)表于 09-26 15:17