日韩无遮嫩模91无码一区二区,97国产在线播放

金磊楊凈發(fā)自凹非寺
量子位 | 公眾號(hào) QbitAI

經(jīng)典技術(shù)OCR（光學(xué)字符識(shí)別），在大模型時(shí)代下要“變味”了。

怎么說？

我們都知道OCR這個(gè)技術(shù)在日常生活中已經(jīng)普及開了，像各類文件、身份證、路標(biāo)等識(shí)別，可以說統(tǒng)統(tǒng)都離不開它。

而隨著近幾年大模型的不斷發(fā)展，OCR也迎來了它的“新生機(jī)”——

憑借自身可以將文本從圖片、掃描文檔或其他圖像形式提取出來的看家本領(lǐng)，成為大語言模型的一個(gè)重要入口。

在這個(gè)過程中，一個(gè)關(guān)鍵問題便是“好用才是硬道理”。

過去人們會(huì)普遍認(rèn)為，像OCR這種涉及圖像預(yù)處理、字符分割、特征提取等步驟的技術(shù)，堆GPU肯定是首選嘛。

不過朋友，有沒有想過成本和部署的問題？還有一些場(chǎng)景甚至連GPU資源都沒得可用的問題？

這時(shí)又有朋友要說了，那CPU也不見得很好用啊。

不不不。

現(xiàn)在，大模型時(shí)代之下，CPU或許還真是OCR落地的一種新解法。

例如在醫(yī)保AI業(yè)務(wù)中，在CPU的加持之下，醫(yī)療票據(jù)識(shí)別任務(wù)的響應(yīng)延時(shí)指標(biāo)，在原有基礎(chǔ)上提升達(dá)25倍！

△數(shù)據(jù)來源：英特爾合作伙伴

為什么會(huì)有如此大的轉(zhuǎn)變？

一言蔽之，因?yàn)榇饲白鯫CR任務(wù)的時(shí)候，CPU的計(jì)算潛能并沒有完全釋放出來。

OCR，進(jìn)入CPU時(shí)代

那么到底是誰家的CPU，能讓經(jīng)典OCR產(chǎn)生這般變化。

不賣關(guān)子。

它正是來自英特爾的第四代至強(qiáng)可擴(kuò)展處理器。

據(jù)了解，第四代至強(qiáng)可擴(kuò)展處理器增加了每個(gè)時(shí)鐘周期的指令，每個(gè)插槽多達(dá)60個(gè)核心，支持8通道DDR5內(nèi)存。

在內(nèi)存寬帶方面實(shí)現(xiàn)了50%的性能提升，并通過每PCIe 5.0（80個(gè)通道）實(shí)現(xiàn)了2 倍的PCIe帶寬提升，整體可實(shí)現(xiàn)60%的代際性能提升。

但解鎖如此能力的，可不僅僅是一顆CPU這么簡(jiǎn)單，是加成了英特爾軟件層面上的優(yōu)化；換言之，就是“軟硬一體”后的結(jié)果。

而且這種打法也不是停留在PPT階段，而是已經(jīng)實(shí)際用起來的那種。

例如國內(nèi)廠商用友便在自家OCR業(yè)務(wù)中采用了這種方案。

性能比較上，用友在第三/第四代英特爾至強(qiáng)可擴(kuò)展處理器上進(jìn)行了算法對(duì)比，推理性能提升達(dá)優(yōu)化前的3.42倍：

而在INT8量化后的性能更是提升到原來的7.3倍：

值得一提的是，OCR的響應(yīng)時(shí)間直接降低到了3秒以內(nèi)，還是切換架構(gòu)不影響業(yè)務(wù)，用戶無感知的那種。

除了用友之外，像亞信科技在自家OCR-AIRPA方案中，也是采用了英特爾的這套打法。

與用友類似的，亞信科技實(shí)現(xiàn)了從FP32到INT8/BF16的量化，從而在可接受的精度損失下，增加吞吐量并加速推理。

從結(jié)果上來看，相比傳統(tǒng)人工方式，成本降到了1/5到1/9之間，而且效率還提升了5-10倍。

由此可見，釋放了AI加速“洪荒之力”的CPU，在OCR任務(wù)上完全不亞于傳統(tǒng)GPU的方案。

那么問題來了：

英特爾是如何釋放CPU計(jì)算潛力的？

實(shí)際應(yīng)用過程中，企業(yè)通常選擇自己使用CPU來做OCR處理，但由于缺乏對(duì)CPU硬件加速和指令集的了解，就會(huì)發(fā)現(xiàn)CPU處理性能與理想峰值相差甚遠(yuǎn)，OCR程序也就沒有得到很好的優(yōu)化。

至于以往更常見的GPU解決方案，始終存在著成本和部署的難題。一來成本通常較高，且很多情況下，業(yè)務(wù)現(xiàn)場(chǎng)沒有GPU資源可以使用。

但要知道OCR本身應(yīng)用廣泛、部署場(chǎng)景多樣，比如公有云、私有云，以及邊緣設(shè)備、終端設(shè)備上……而且隨著大模型時(shí)代的到來，作為重要入口的OCR，更多潛在場(chǎng)景將被挖掘。

于是，一種性價(jià)比高、硬件適配性強(qiáng)的解決方案成為行業(yè)剛需。

既然如此，英特爾又是如何解決這一痛點(diǎn)的呢？

簡(jiǎn)單歸結(jié)：第四代至強(qiáng)可擴(kuò)展處理器及其內(nèi)置的AI加速器，以及OpenVINO 推理框架打輔助。

當(dāng)前影響AI應(yīng)用性能的要素?zé)o非兩個(gè)：算力和數(shù)據(jù)訪問速度。第四代至強(qiáng)可擴(kuò)展處理器的單顆CPU核數(shù)已經(jīng)增長(zhǎng)到最高60核。

而在數(shù)據(jù)訪問速度上，各級(jí)緩存大小、內(nèi)存通道數(shù)、內(nèi)存訪問速度等都有一定程度的優(yōu)化，另外部分型號(hào)還集成了HBM高帶寬內(nèi)存技術(shù)。

此外，在CPU指令集上也做了優(yōu)化，內(nèi)置了英特爾高級(jí)矩陣擴(kuò)展（英特爾AMX）等硬件加速器，負(fù)責(zé)矩陣計(jì)算，加速深度學(xué)習(xí)工作負(fù)載。

這有點(diǎn)類似于GPU里的張量核心（Tensor Core）。

AMX由兩部分組成，一部分是1kb大小的2D寄存器文件，另一部分是TMUL模塊，用來執(zhí)行矩陣乘法指令。

它可同時(shí)支持INT8和BF16數(shù)據(jù)類型，且BF16相較于FP32計(jì)算性能更優(yōu)。

有了AMX指令集加持，性能比矢量神經(jīng)網(wǎng)絡(luò)指令集VNNI提升達(dá)8倍。

除了核心硬件平臺(tái)外，實(shí)際情況中幫助OCR在CPU上落地的，還有推理框架OpenVINO。

市面上大部分AI框架都是同時(shí)支持訓(xùn)練和推理，OpenVINO則是刪減了很多訓(xùn)練部分所需的冗余計(jì)算，主要支持推理部分。

而且也是專門針對(duì)英特爾硬件打造的優(yōu)化框架。框架替換也不復(fù)雜，只需5行代碼就可以完成原有框架的替換。

用戶可以針對(duì)不同業(yè)務(wù)場(chǎng)景，來優(yōu)化OpenVINO運(yùn)行參數(shù)。

比如用友OCR業(yè)務(wù)涉及文字檢測(cè)和文字識(shí)別兩個(gè)AI模型，優(yōu)化方向有所不同。

前者對(duì)單次推理要求高，后者需要整個(gè)系統(tǒng)吞吐量的優(yōu)化，那么OpenVINO分別采用單路同步模式和多路異步模式。單一模塊優(yōu)化后，再針對(duì)整體流程的優(yōu)化。

這樣一套軟硬件組合拳打下來，英特爾充分釋放了CPU計(jì)算潛力，在實(shí)際場(chǎng)景中也實(shí)現(xiàn)了與GPU同等性能。

不再是你以為的CPU

以往談到AI加速、AI算力，大眾經(jīng)常想到的就是GPU，又或者是專用TPU。

至于通用架構(gòu)芯片CPU，受到計(jì)算單元和內(nèi)存帶寬的限制，始終無法適應(yīng)于計(jì)算數(shù)據(jù)龐大的深度學(xué)習(xí)。

但現(xiàn)在的CPU，已經(jīng)不再是“你以為的你以為”了：

它可以深入到各個(gè)行業(yè)當(dāng)中，輕松Hold住各種場(chǎng)景應(yīng)用。

尤其在AMX加速引擎加持下，能將深度學(xué)習(xí)訓(xùn)練和推理性能提升高達(dá)10倍。

比如，媒體娛樂場(chǎng)景中，能幫助個(gè)性化內(nèi)容推薦速度提升達(dá)6.3倍；零售行業(yè)里，能將視頻分析速度提升高達(dá)至2.3倍，還有像工業(yè)缺陷檢測(cè)、醫(yī)療服務(wù)也都能從容應(yīng)對(duì)。

即便是在前沿探索領(lǐng)域，CPU也已經(jīng)成為不容忽視的存在：

像是在生命科學(xué)和醫(yī)藥方向，在某些場(chǎng)景下的表現(xiàn)效果甚至比GPU還要好。

英特爾用CPU速刷AlphaFold2，結(jié)果力壓AI專用加速芯片，去年發(fā)布的第三代至強(qiáng)可擴(kuò)展處理器經(jīng)過優(yōu)化后就能使其端到端的通量足足提升到了原來的23.11倍。今年基于第四代至強(qiáng)可擴(kuò)展處理器再次把性能提升到了上一代產(chǎn)品的3.02倍。

不過要實(shí)現(xiàn)CPU加速，背后也并非簡(jiǎn)單的硬件優(yōu)化。

而是軟硬件融合協(xié)同，從底層到應(yīng)用的一整套技術(shù)創(chuàng)新，以及產(chǎn)業(yè)鏈上合作伙伴的支撐。

隨著大模型時(shí)代的到來和深入，這種解決思路也正在成為共識(shí)。

像一些大模型玩家要實(shí)現(xiàn)大模型優(yōu)化和迭代，并不能依靠以往單純?nèi){馬車來解決，而是需要從底層芯片到模型部署端到端的系統(tǒng)優(yōu)化。

在算力加速層面的玩家，一方面擺脫不了摩爾定律的極限，另一方面要在應(yīng)用場(chǎng)景中充分釋放計(jì)算潛力，就需要與軟件適配快速部署。

有意思的是，在最近OCR主題的《至強(qiáng)實(shí)戰(zhàn)課》中，英特爾人工智能軟件架構(gòu)師桂晟曾這樣形容英特爾的定位：

英特爾不僅僅是一個(gè)硬件公司，同時(shí)也擁有著龐大的軟件團(tuán)隊(duì)。

在整個(gè)人工智能生態(tài)中，不論是從底層的計(jì)算庫，到中間的各類組件，框架和中間件，再到上層的應(yīng)用，服務(wù)和解決方案都有英特爾軟件工程師的參與。

CPU加速，不再是你以為的加速。英特爾，也不再是以往所認(rèn)知中的硬件公司。

但如果你以為英特爾只有CPU來加速AI，那你又單純了。

針對(duì)AI的專用加速芯片HabanaGaudi 2即將迎來首秀；而通用加速芯片，同時(shí)兼顧科學(xué)計(jì)算和AI加速的英特爾數(shù)據(jù)中心GPU Max系列也剛剛結(jié)束了它在阿貢實(shí)驗(yàn)室Aurora系統(tǒng)中的部署，即將走近更多客戶。

以這些多樣化、異構(gòu)的芯片為基石，英特爾也將形成更全面的硬件產(chǎn)品布局，并配之以跨異構(gòu)平臺(tái)、易用的軟件工具組合（oneAPI）為整個(gè)應(yīng)用鏈上的合作伙伴及客戶提供應(yīng)用創(chuàng)新的支持，為各行各業(yè)AI應(yīng)用的開發(fā)、部署、優(yōu)化和普及提供全方位支持。

了解更多英特爾如何顯著提升OCR性能，可點(diǎn)擊文末【閱讀原文】。

更多《至強(qiáng)實(shí)戰(zhàn)課》相關(guān)內(nèi)容，歡迎掃描如下海報(bào)中的二維碼注冊(cè)觀看：

—完—

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

英特爾

英特爾

+關(guān)注

關(guān)注
60

文章
9747

瀏覽量
170640
cpu

cpu

+關(guān)注

關(guān)注
68

文章
10698

瀏覽量
209330

原文標(biāo)題：大模型時(shí)代的OCR，“CPU” 的味道更重了

文章出處：【微信號(hào)：英特爾中國，微信公眾號(hào)：英特爾中國】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

大模型時(shí)代的算力需求

現(xiàn)在AI已進(jìn)入大模型時(shí)代，各企業(yè)都爭(zhēng)相部署大模型，但如何保證大模型的算力，以及相關(guān)的穩(wěn)定性和性能，是一個(gè)極為重要的問題，帶著這個(gè)極為重要的問題，我需要在此書中找到答案。

發(fā)表于 08-20 09:04

【書籍評(píng)測(cè)活動(dòng)NO.41】大模型時(shí)代的基礎(chǔ)架構(gòu)：大模型算力中心建設(shè)指南

。全書總計(jì)13章。第1章講解AI與大模型時(shí)代對(duì)基礎(chǔ)架構(gòu)的需求；第2章講解軟件程序與專用硬件的結(jié)合，涉及GPU并行運(yùn)算庫、機(jī)器學(xué)習(xí)程序的開發(fā)框架和分布式AI訓(xùn)練；第3章剖析GPU的硬件架構(gòu)，涉及GPU

發(fā)表于 08-16 18:33

OCR識(shí)別技術(shù)OCR識(shí)別技術(shù)在工業(yè)生產(chǎn)中扮演著至關(guān)重要的角色。它利用先進(jìn)的圖像處理技術(shù)，自動(dòng)、高效地識(shí)別并轉(zhuǎn)換圖像中的文字信息為可編輯的文本數(shù)據(jù)。這一技術(shù)的應(yīng)用確保了生產(chǎn)數(shù)據(jù)的準(zhǔn)確性和實(shí)時(shí)性，為生

發(fā)表于 08-13 08:25 ?281次閱讀

明治案例 | PE編織袋【大視野】【<b class='flag-5'>OCR</b>識(shí)別】

大模型時(shí)代，商湯大裝置重構(gòu)AI基礎(chǔ)設(shè)施與服務(wù)

大模型時(shí)代，怎樣的基礎(chǔ)設(shè)施與服務(wù)才能滿足行業(yè)所需？

發(fā)表于 04-12 11:47 ?568次閱讀

大<b class='flag-5'>模型</b><b class='flag-5'>時(shí)代</b>，商湯大裝置重構(gòu)AI基礎(chǔ)設(shè)施與服務(wù)

軟通動(dòng)力榮獲百度智能云“大模型創(chuàng)新突破獎(jiǎng)”“服務(wù)突破之星伙伴獎(jiǎng)”

4月9日，2024百度智能云GENERATE全球生態(tài)大會(huì)在成都舉辦。大會(huì)帶來了百度智能云在大模型時(shí)代的全新生態(tài)戰(zhàn)略、針對(duì)伙伴升級(jí)的大模型全棧產(chǎn)品解決方案，更重磅發(fā)布

發(fā)表于 04-10 09:49 ?258次閱讀

半導(dǎo)體發(fā)展的四個(gè)時(shí)代

臺(tái)積電的 Suk Lee 發(fā)表了題為“摩爾定律和半導(dǎo)體行業(yè)的第四個(gè)時(shí)代”的主題演講。Suk Lee表示，任何試圖從半導(dǎo)體行業(yè)傳奇而動(dòng)蕩的歷史中發(fā)掘出一些意義的事情都會(huì)引起我的注意。正如臺(tái)積電所解釋

發(fā)表于 03-27 16:17

半導(dǎo)體發(fā)展的四個(gè)時(shí)代

發(fā)表于 03-13 16:52

如何判斷觸摸屏用有機(jī)硅OCR/LOCA性能的優(yōu)劣

判斷OCR/LOCA性能的優(yōu)劣

發(fā)表于 02-29 10:48 ?397次閱讀

英特爾CPU部署Qwen 1.8B模型的過程

本文介紹了在英特爾 13 代酷睿 CPU i5 - 13490F 設(shè)備上部署 Qwen 1.8B 模型的過程，你需要至少 16GB 內(nèi)存的機(jī)器來完成這項(xiàng)任務(wù)，我們將使用英特爾的大模型推

發(fā)表于 01-12 10:28 ?2331次閱讀

OCR終結(jié)了？曠視提出可以文檔級(jí)OCR的多模態(tài)大模型框架Vary，支持中英文，已開源！

：無論是中英文的大段文字：還是包含了公式的文檔圖片：又或是手機(jī)頁面截圖：甚至可以將圖片中的表格轉(zhuǎn)換成 Latex 格式：當(dāng)然，作為多模大模型，通用能力的保持也是必須的： Vary 表現(xiàn)出了很大的潛力和極高的上限，OCR 可以不再需要冗長(zhǎng)的 pipline，直接

發(fā)表于 12-24 21:40 ?1663次閱讀

<b class='flag-5'>OCR</b>終結(jié)了？曠視提出可以文檔級(jí)<b class='flag-5'>OCR</b>的多模態(tài)大<b class='flag-5'>模型</b>框架Vary，支持中英文，已開源！

【飛騰派4G版免費(fèi)試用】仙女姐姐的嵌入式實(shí)驗(yàn)室之五~LLaMA.cpp及3B“小模型”O(jiān)penBuddy-StableLM-3B

和1750億參數(shù)的GPT-3都是非常由有競(jìng)爭(zhēng)力的 MetaAI研究人員認(rèn)為，當(dāng)前大模型的高成本阻礙了學(xué)術(shù)研究，因此，開發(fā)出這個(gè)更小更強(qiáng)的模型將有利于學(xué)術(shù)研究的發(fā)展。使用較少參數(shù)的模型，

發(fā)表于 12-22 10:18

基于OpenVINO+OpenCV的OCR處理流程化實(shí)現(xiàn)

預(yù)處理主要是基于OpenCV、場(chǎng)景文字檢測(cè)與識(shí)別基于OpenVINO框架 + PaddleOCR模型完成。直接按圖索驥即可得到最終結(jié)果。 OpenCV預(yù)處理主要是完成偏斜矯正、背景矯正等操作，然后使用場(chǎng)景文字檢測(cè)模型+OCR識(shí)別

發(fā)表于 11-07 11:21 ?616次閱讀

基于OpenVINO+OpenCV的<b class='flag-5'>OCR</b>處理流程化實(shí)現(xiàn)

OCR如何自動(dòng)識(shí)別圖片文字

OCR 是光學(xué)字符識(shí)別（英語：Optical Character Recognition，OCR）是指對(duì)文本資料的圖像文件進(jìn)行分析識(shí)別處理，獲取文字及版面信息的過程。很早之前就有同學(xué)在公眾號(hào)后臺(tái)

發(fā)表于 10-31 16:45 ?636次閱讀

<b class='flag-5'>OCR</b>如何自動(dòng)識(shí)別圖片文字

【KV260視覺入門套件試用體驗(yàn)】Vitis AI Library體驗(yàn)之OCR識(shí)別

Vitis AI Runtime，Vitis AI Library 有很多已經(jīng)封裝好的神經(jīng)網(wǎng)絡(luò)接口，直接拿來用即可。 OCR識(shí)別基于Vitis AI Library 的ocr_pt模型，OCR

發(fā)表于 10-16 23:25

【KV260視覺入門套件試用體驗(yàn)】七、VITis AI字符和文本檢測(cè)（OCR&Textmountain）

_pt sample_ocr.jpg OCR 該網(wǎng)絡(luò)用于光學(xué)字符識(shí)別，包括文本檢測(cè)和文本識(shí)別。該網(wǎng)絡(luò)由 ResNet-FPN 特征提取器、檢測(cè)分支和識(shí)別分支構(gòu)成。此模型由 ICDAR-2017 數(shù)據(jù)集進(jìn)行訓(xùn)練。輸入為包

發(fā)表于 09-26 16:31

搜索歷史

大模型時(shí)代的OCR，“CPU” 的味道更重了

金磊楊凈發(fā)自凹非寺
量子位 | 公眾號(hào) QbitAI

△數(shù)據(jù)來源：英特爾合作伙伴

OCR，進(jìn)入CPU時(shí)代

英特爾是如何釋放CPU計(jì)算潛力的？

不再是你以為的CPU

評(píng)論

大模型時(shí)代的算力需求

【書籍評(píng)測(cè)活動(dòng)NO.41】大模型時(shí)代的基礎(chǔ)架構(gòu)：大模型算力中心建設(shè)指南

明治案例 | PE編織袋【大視野】【OCR識(shí)別】

大模型時(shí)代，商湯大裝置重構(gòu)AI基礎(chǔ)設(shè)施與服務(wù)

軟通動(dòng)力榮獲百度智能云“大模型創(chuàng)新突破獎(jiǎng)”“服務(wù)突破之星伙伴獎(jiǎng)”

半導(dǎo)體發(fā)展的四個(gè)時(shí)代

半導(dǎo)體發(fā)展的四個(gè)時(shí)代

如何判斷觸摸屏用有機(jī)硅OCR/LOCA性能的優(yōu)劣

英特爾CPU部署Qwen 1.8B模型的過程

OCR終結(jié)了？曠視提出可以文檔級(jí)OCR的多模態(tài)大模型框架Vary，支持中英文，已開源！

【飛騰派4G版免費(fèi)試用】仙女姐姐的嵌入式實(shí)驗(yàn)室之五~LLaMA.cpp及3B“小模型”O(jiān)penBuddy-StableLM-3B

基于OpenVINO+OpenCV的OCR處理流程化實(shí)現(xiàn)

OCR如何自動(dòng)識(shí)別圖片文字

【KV260視覺入門套件試用體驗(yàn)】Vitis AI Library體驗(yàn)之OCR識(shí)別

【KV260視覺入門套件試用體驗(yàn)】七、VITis AI字符和文本檢測(cè)（OCR&Textmountain）

搜索歷史

大模型時(shí)代的OCR，“CPU” 的味道更重了

金磊 楊凈 發(fā)自 凹非寺 量子位 | 公眾號(hào) QbitAI

△數(shù)據(jù)來源：英特爾合作伙伴

OCR，進(jìn)入CPU時(shí)代

英特爾是如何釋放CPU計(jì)算潛力的？

不再是你以為的CPU

評(píng)論

金磊楊凈發(fā)自凹非寺
量子位 | 公眾號(hào) QbitAI

英特爾是如何釋放CPU計(jì)算潛力的？