數(shù)字化轉(zhuǎn)型是將數(shù)字技術(shù)集成到您業(yè)務(wù)的所有領(lǐng)域的過程——沒有什么比人工智能技術(shù)更具變革性的了,尤其是計(jì)算機(jī)視覺,它可以比人類更快、更準(zhǔn)確地評(píng)估視覺信息。
事實(shí)上,最先進(jìn)的計(jì)算機(jī)視覺策略目前正在利用視頻流傳輸?shù)竭吘壴O(shè)備——檢查、分析和評(píng)估視覺數(shù)據(jù),包括圖片、視頻、衛(wèi)星圖像和實(shí)驗(yàn)室樣本——以進(jìn)行具有一定準(zhǔn)確性和成本水平的即時(shí)評(píng)估——使人眼的能力相形見絀。隨著我們訓(xùn)練越來越多的 AI 模型,計(jì)算機(jī)視覺將適用于幾乎所有的視覺任務(wù)。
我們所說的計(jì)算機(jī)視覺和嵌入式 AI 是什么意思?
直到最近十年,計(jì)算機(jī)可以解釋任何類型的視覺信息(具有與人類相同或更好的敏銳度)的想法被視為計(jì)算機(jī)科學(xué)的一個(gè)不可逾越的前沿。然而,現(xiàn)代計(jì)算機(jī)視覺技術(shù)現(xiàn)在由邊緣設(shè)備上的人工智能模型組成,這些模型可以分析和理解形成圖像和視頻的像素混亂——它們可以比人類更好地執(zhí)行最廣泛的視覺任務(wù)。
事實(shí)上,人工智能解釋的攝像頭饋送目前非常先進(jìn),它們可以比人類更好地計(jì)算載玻片下的細(xì)胞或識(shí)別工廠中有缺陷的瓶蓋,而且他們可以在幾毫秒內(nèi)完成。這只是兩個(gè)狹隘的例子。連接到服務(wù)器上嵌入式人工智能的攝像頭可以檢查商店貨架是否有貨,或者建筑工人是否穿著防護(hù)裝備。在這一點(diǎn)上,如果一項(xiàng)工作需要人眼來做出決定,那么訓(xùn)練有素的計(jì)算機(jī)視覺系統(tǒng)可能會(huì)做得更好。計(jì)算機(jī)視覺基本上是無限的。
計(jì)算機(jī)視覺比人類視覺好在哪里?
與其說無處不在,不如看看為什么計(jì)算機(jī)視覺在許多領(lǐng)域都比人類表現(xiàn)更好。首先,我們需要探索人類視覺的局限性以及它是如何影響準(zhǔn)確性的。
例如,科學(xué)家們?cè)缇椭?,人類的視覺無法準(zhǔn)確客觀地反映我們周圍的世界。正如丹妮絲·格雷迪( Denise Grady)為發(fā)現(xiàn)雜志所寫的那樣,“眼睛和大腦協(xié)同工作,以解釋來自外部世界的相互沖突的信號(hào)。最終,我們會(huì)看到我們的大腦認(rèn)為我們應(yīng)該看到的任何東西?!?/p>
事實(shí)上,我們的大腦不斷地填補(bǔ)盲點(diǎn),以創(chuàng)造對(duì)我們周圍世界的無縫體驗(yàn)——即使他們必須“彌補(bǔ)”信息來做到這一點(diǎn)。大腦改變陰影,改變顏色,并無意識(shí)地決定我們?cè)诳词裁?。在許多情況下,我們只是感知到一種充滿錯(cuò)誤和不準(zhǔn)確的錯(cuò)覺。
例如,您在上圖中看到了什么?鴨子?一只兔子?兩者都是正確的,但不可能同時(shí)看到兩個(gè)圖像。選擇看到兔子暫時(shí)失去鴨子,反之亦然(試一試)。
這些感知差異在日常生活中不會(huì)造成太大問題 - 但在執(zhí)行需要高度準(zhǔn)確度的視覺任務(wù)時(shí),它們絕對(duì)是有害的,例如:
檢查機(jī)器是否存在維修問題
監(jiān)控員工的 PPE 合規(guī)性
檢查基礎(chǔ)設(shè)施資產(chǎn)是否生銹和腐爛
在顯微鏡下計(jì)數(shù)細(xì)胞
檢查商店貨架是否有低庫存
除了簡單地打瞌睡或被手機(jī)分心,我們?yōu)槭裁磿?huì)在任務(wù)中犯錯(cuò)誤?
根據(jù)密歇根州立大學(xué)的研究人員的說法,視覺皮層會(huì)做出復(fù)雜的決定,就像大腦的更高層次一樣,它通常是在無意識(shí)的情況下發(fā)生的。事實(shí)上,視覺皮層決定了我們將要看到的內(nèi)容是否準(zhǔn)確反映了現(xiàn)實(shí)。當(dāng)人類工作者解釋視覺數(shù)據(jù)時(shí),這可能會(huì)產(chǎn)生確認(rèn)偏差和錯(cuò)誤——當(dāng)我們感到無聊、疲勞和分心時(shí),這些偏差和錯(cuò)誤會(huì)變得更糟。
正如 Squilla Capital 的聯(lián)合創(chuàng)始人 Daniel Myakin 所說:
“人們總是保持偏見和情緒化,無論他們是否意識(shí)到這一點(diǎn)。每個(gè)人都知道人們會(huì)犯錯(cuò)誤?!?/p>
與人類解釋容易出錯(cuò)的性質(zhì)相比,計(jì)算機(jī)視覺更客觀地看待和理解視覺數(shù)據(jù)——一次又一次地以絕對(duì)一致性呈現(xiàn)相同的結(jié)果。讓我們來看看為什么計(jì)算機(jī)視覺模型比人類更擅長執(zhí)行視覺任務(wù)的一些主要原因:
一致:視覺 AI 任務(wù)性能的質(zhì)量不會(huì)因一天中的時(shí)間或 AI 運(yùn)行的時(shí)間長短而變化。人工智能也不會(huì)變得無聊、疲倦、分心、生病、宿醉或沮喪——這些都是不可預(yù)測(cè)的變量,會(huì)對(duì)人類的表現(xiàn)產(chǎn)生負(fù)面影響。這些“人”因素都不會(huì)影響計(jì)算機(jī)視覺任務(wù)性能的一致性和準(zhǔn)確性。
始終可用:視覺 AI 系統(tǒng)不會(huì)占用午休時(shí)間、病假、假期或辭職。它們每周 7 天、每天 24 小時(shí)隨時(shí)可用。
可擴(kuò)展:隨著可視化監(jiān)控和評(píng)估任務(wù)量的增加,組織不需要雇用、尋找或培訓(xùn)新員工。只需按一下按鈕,他們就可以無限復(fù)制和擴(kuò)展現(xiàn)有的計(jì)算機(jī)視覺模型,以完成更多的工作。
更準(zhǔn)確:計(jì)算機(jī)視覺系統(tǒng)可以同時(shí)跟蹤更多變量。他們無需同時(shí)關(guān)注三個(gè)安全攝像頭,而是可以查看數(shù)百或數(shù)千個(gè),并且不會(huì)錯(cuò)過任何與安全相關(guān)的事件。他們可以識(shí)別人群中的數(shù)百或數(shù)千張面孔,而不是識(shí)別一張臉。同樣,計(jì)算機(jī)視覺無需花費(fèi) 30 分鐘在顯微鏡下一次計(jì)數(shù)一個(gè)細(xì)胞,而是立即立即計(jì)數(shù)所有細(xì)胞。
最終,計(jì)算機(jī)視覺提供了同時(shí)和客觀地跟蹤無限數(shù)量的視覺因素的能力,并且比人類希望達(dá)到的更關(guān)注細(xì)節(jié)。它不會(huì)因?yàn)槠>?、分心或無聊而產(chǎn)生不一致的分析——而且它具有無限的可擴(kuò)展性。
當(dāng)您考慮使用視覺 AI 代替人眼的諸多優(yōu)勢(shì)時(shí),計(jì)算機(jī)視覺是否會(huì)很快成為企業(yè)簡化工作流程、提高利潤并讓人類工人騰出時(shí)間從事更重要任務(wù)的競爭必需品?
激進(jìn)的數(shù)字化轉(zhuǎn)型已經(jīng)改變了世界
如果您仍然看不到帶有攝像頭的邊緣 AI 將如何改變一切,想想我們所看到的全球智能手機(jī)采用直接導(dǎo)致的根本性變化——這已經(jīng)深刻改變了我們相互交流和娛樂自己的方式。
除了它們只是一種更好、更簡單的交流和娛樂方式之外,智能手機(jī)成功的一個(gè)主要原因與它們變得更加實(shí)惠和易用有關(guān)。向智能手機(jī)添加短信和地圖以及約會(huì)和支付有助于鞏固它們的絕對(duì)必要性。
同樣,計(jì)算機(jī)視覺正變得越來越便宜和易用,為支持人工智能的相機(jī)成為提高商業(yè)、科學(xué)、軍事、政府等無數(shù)視覺任務(wù)的速度、效率和準(zhǔn)確性的競爭必需品鋪平了道路。
現(xiàn)在,無論用例涉及滑倒檢測(cè)、煙霧和火災(zāi)警報(bào),還是監(jiān)視后門以確保沒有庫存,組織都可以在幾天內(nèi)輕松且廉價(jià)地建立獨(dú)特的視覺 AI 系統(tǒng)被盜。當(dāng) AI 檢測(cè)到正在進(jìn)行的跌倒、火災(zāi)或盜竊時(shí),生成的數(shù)據(jù)會(huì)觸發(fā)警報(bào),這是一個(gè)數(shù)字化變革事件。
視覺 AI 模型的快速開發(fā)和部署
就像人類兒童發(fā)展他們的思維來觀察、分析和解釋周圍環(huán)境一樣,視覺 AI 系統(tǒng)也需要訓(xùn)練。曾經(jīng)需要數(shù)年時(shí)間來訓(xùn)練計(jì)算機(jī)視覺模型來執(zhí)行基本的視覺任務(wù)。盡管大多數(shù)視覺 AI 策略仍需要 6 到 9 個(gè)月的時(shí)間來訓(xùn)練和部署,但我們現(xiàn)在看到更新、更快、更易于使用的視覺 AI 平臺(tái)可用。
現(xiàn)在,計(jì)算機(jī)視覺平臺(tái)允許公司在 6 到 9 天內(nèi)開發(fā)和部署 AI 模型。Chooch AI 通過為火災(zāi)、跌倒、面部、缺陷、細(xì)胞計(jì)數(shù)、產(chǎn)品庫存和其他用例提供預(yù)構(gòu)建的視覺 AI 模型庫來實(shí)現(xiàn)這種高速部署。選擇現(xiàn)有模型進(jìn)行即時(shí)部署,例如人體跌倒檢測(cè),為更細(xì)微的應(yīng)用程序添加額外的訓(xùn)練層 - 或在需要時(shí)訓(xùn)練全新的模型。
Chooch AI用于生成和注釋圖像的自動(dòng)化工具也加快了培訓(xùn)速度,為組織提供了巨大的敏捷性和可負(fù)擔(dān)性,以快速開發(fā)新穎的計(jì)算機(jī)視覺解決方案。
最終,隨著計(jì)算機(jī)視覺解決方案的培訓(xùn)和部署變得更容易、更快、更實(shí)惠,嵌入式視覺技術(shù)將像野火一樣蔓延——改變社會(huì)的速度甚至比智能手機(jī)還要快,因?yàn)槌讼鄼C(jī)和設(shè)備之外不需要特殊設(shè)備。
審核編輯:郭婷
-
嵌入式
+關(guān)注
關(guān)注
5060文章
18980瀏覽量
302246 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7383瀏覽量
87643 -
AI
+關(guān)注
關(guān)注
87文章
29862瀏覽量
268154
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論