2024年7月8日-10日,由機器視覺產(chǎn)業(yè)聯(lián)盟(CMVU)主辦,慕尼黑展覽(上海)有限公司承辦的VisionChina2024(上海)機器視覺展暨機器視覺技術(shù)及工業(yè)應(yīng)用研討會在上海新國際博覽中心完美收官。阿丘科技也以其前沿的AI技術(shù)實踐,為觀眾帶來一場AI+工業(yè)的視覺盛宴。
在工業(yè)應(yīng)用研討會現(xiàn)場,阿丘科技研發(fā)副總裁鐘克洪圍繞“工業(yè)視覺進入AI-Native大時代”主題,發(fā)表精彩演講,解析工業(yè)視覺產(chǎn)品新范式,下文為其演講內(nèi)容整理。
大家好,我是阿丘科技研發(fā)負責人鐘克洪。
去年我在VisionChina北京和大家分享了工業(yè)AI視覺演進的一些理解和觀點《工業(yè)視覺AI進化論》。一年來,AI在制造業(yè)的概念認知加速普及。各行業(yè)終端廠商高管積極探索導入AI的路徑,視覺廠商也都紛紛包裝上AI的人設(shè)。
但AI技術(shù)架構(gòu)的視覺產(chǎn)品大多固守在原有視覺產(chǎn)品的認知框架內(nèi),AI技術(shù)更多只是作為一個關(guān)鍵功能組件,AI對于工業(yè)問題的解決并沒有質(zhì)的飛躍。我認為AI技術(shù)架構(gòu)的產(chǎn)品一定要能夠直擊工業(yè)痛點,可這樣的產(chǎn)品到底應(yīng)該長什么樣子?一定是AI-Native。
這個就是我想和大家分享的主題——《工業(yè)視覺進入AI-Native大時代》,也是阿丘科技一年來的一些思考和探索。
今天我分享的內(nèi)容主要分為三個部分,分別是工業(yè)視覺需要解的問題、AI-Native提供了全新的解題框架,以及對產(chǎn)品發(fā)展的一些趨勢觀點。
一、工業(yè)視覺挑戰(zhàn)
整個制造業(yè)目前關(guān)注的核心,我從四個維度概括就是:提質(zhì)、增效、降本、擴柔。一言概之,即“提升規(guī)模效應(yīng)、提高生產(chǎn)柔性”。
前面三個維度相信大家平時思考的比較多,但是“擴柔”這一部分,實際上可能是當前各個制造企業(yè)考慮的必選項。特別是在傳統(tǒng)制造業(yè)中,“小單快反”成為當下制造業(yè)的主流,柔性化生產(chǎn)已經(jīng)成為常規(guī)動作。
那么,目前整個工業(yè)視覺行業(yè)的挑戰(zhàn)有哪些呢?
隨著AI技術(shù)的導入,確實對檢測能力的魯棒性有非常大程度的提升。但是整個視覺系統(tǒng)的泛化能力,我認為并沒有本質(zhì)的改變,甚至直接導致整個產(chǎn)品的適配性非常差。一旦更換新的場景,就還要另外進行模型訓練,即便是在同一個場景下,如果遇到整個產(chǎn)品換型,所消耗的周期也非常長,簡而言之就是“切拉換型周期長、場景遷移能力弱?!?/strong>
而且,整個視覺系統(tǒng)的TCO仍然過高。目前,大部分的視覺系統(tǒng)其實都還是定制的,在評估、開發(fā)、部署、維護層面都要消耗很多人力,這是導致高成本重要原因。俗話說“羊毛出在羊身上”,視覺系統(tǒng)的成本變高之后,終端客戶對其的普及度就會變得很低。
二、AI-Native工業(yè)視覺產(chǎn)品新范式
現(xiàn)在,我們從AI原生的視角,來探究一下前面提出的問題。
首先,什么是AI原生?我們可以從AI和視覺系統(tǒng)結(jié)合形態(tài)的角度,來解讀AI-Native。
當前大部分AI視覺系統(tǒng)都只是把AI作為組件,我們阿丘科技的AIDI、Cognex VisionPro Deep Learning等構(gòu)建的視覺系統(tǒng)即屬于該類,這也是當前AI和視覺系統(tǒng)的主要結(jié)合方式。
另一種方式是對現(xiàn)有的視覺系統(tǒng)進行優(yōu)化,比如阿丘科技的PCB ARS(AI Review System)即是對現(xiàn)有視覺系統(tǒng)進行優(yōu)化,降低人工復判成本,同時進行缺陷分類、根因分析、過程控制,從而提高或保持良率。
這兩種方式本質(zhì)上仍屬于Vision + AI范疇,AI只是視覺系統(tǒng)的核心組件或?qū)ΜF(xiàn)有視覺系統(tǒng)的優(yōu)化,而并沒有基于AI對視覺系統(tǒng)進行重構(gòu),所以視覺系統(tǒng)只是“量”的變化,盡管這個“量”變幅度有些大。
而所謂AI-Native,是將視覺系統(tǒng)的所有組件都AI化,即從基于規(guī)則的傳統(tǒng)視覺系統(tǒng)躍遷為基于Learning的視覺系統(tǒng),它完全基于數(shù)據(jù)驅(qū)動,并且從方案設(shè)計、部署、維護等貫穿全流程。
了解了AI-Native的大體情況之后,接下來我要介紹一下AI-Native重構(gòu)工業(yè)視覺的底層邏輯。
AI技術(shù)是從圖像分析的局部模塊切入,也是當前主流AI和視覺系統(tǒng)結(jié)合方式。圖像分析端到端AI化,這也是我們AIDI 3.0系列的底層設(shè)計邏輯。
目前,主流的成像系統(tǒng)都是基于規(guī)則的,而基于學習的成像系統(tǒng)已經(jīng)初現(xiàn)端倪,即基于物理光學+計算成像,同時將場景自動學習成為成像關(guān)鍵的維度參數(shù),這將革命性提高成像系統(tǒng)場景適應(yīng)性。
我們應(yīng)當明白,工業(yè)視覺檢測的本質(zhì),是把控產(chǎn)品在生產(chǎn)過程的一些關(guān)鍵度量,基于這些度量進行根因分析、過程控制,形成閉環(huán),提高良率,這也是制造業(yè)企業(yè)的本質(zhì)訴求。
所以,基于AI原生的工業(yè)視覺底層邏輯,應(yīng)當是從“成像”,到“圖像分析”再到“工藝優(yōu)化”的完整鏈條,并在其底層有共同的AI-Core做支撐,后面再基于數(shù)據(jù)驅(qū)動做優(yōu)化,對不同場景進行適配,以上是我認為的AI-Native產(chǎn)品的架構(gòu)邏輯。
至此,視覺系統(tǒng)的產(chǎn)品新范式,將從“基于規(guī)則”迭代至“基于學習”。01
當前產(chǎn)品,“規(guī)則”范式
指我們針對特定的場景,甚至是特定的產(chǎn)品型號,來做打光實驗,來設(shè)計算法方案,來做調(diào)差及一些核心策略。在此規(guī)則模式下,人力占比較高,本質(zhì)上是將人員對產(chǎn)品的理解跟洞察,轉(zhuǎn)換成產(chǎn)品中的設(shè)計。
但其實,人類對于經(jīng)驗的歸納和總結(jié)能力是非常有限的,這就造成產(chǎn)品的成功與否大部分基于人員的經(jīng)驗,而經(jīng)驗沉淀的豐富程度則可以決定產(chǎn)品的價值。
同時,這也導致這些“基于規(guī)則”的產(chǎn)品的泛化性較差,且我們還需要針對不同的場景分別做光學評估、方案設(shè)計、部署、維護等,使得TCO過高。
02
AI-Native產(chǎn)品:“學習”范式
AI-Native產(chǎn)品則是基于“學習”的概念,學得越多,模型能力越強,更便于后期基于數(shù)據(jù)來進行規(guī)?;?。產(chǎn)品的主體是算法,這個算法不僅僅是我們前面理解的圖像分析的算法,還包括成像,以及后面整個工藝優(yōu)化,是一個完整的端到端的AI算法。
所以,此時我們的產(chǎn)品價值主要由模型的能力來決定,而產(chǎn)品迭代也將立足于有價值的數(shù)據(jù)之上。這類體系下的產(chǎn)品不但具有較強的泛化能力,同時也會使TCO發(fā)生革命性地降低,AI視覺應(yīng)用也將爆發(fā)。
三、發(fā)展趨勢
我們參考自動駕駛的框架,嘗試構(gòu)建工業(yè)視覺AI-Native成熟度模型,其中,該模型包含兩個關(guān)鍵的維度:AI化程度、人工干預程度。
如圖所示,我們當前的狀態(tài),基本位于“1”與“2”之間,約為1.5。這意味著,AI已經(jīng)作為主題滲透在行業(yè)之中,不管是終端客戶,還是視覺廠商,大家都會把AI作為基本的考核要素,即AI作為視覺系統(tǒng)核心組件的觀點已經(jīng)不可逆轉(zhuǎn)。
那為什么還沒有達到”2“?
簡而言之是當前的視覺系統(tǒng)產(chǎn)品大多沒有統(tǒng)一的Core AI基礎(chǔ)設(shè)施。那么后面我們的工業(yè)視覺產(chǎn)品一定會走到“5“的狀態(tài)嗎?這個問題目前無法確定,但我認為,未來我們至少應(yīng)該會走到”3“的位置,即全部核心組件AI化,整體架構(gòu)基于Core AI基礎(chǔ)設(shè)施,將全部功能組件AI化。
基于AI原生的大趨勢,我也將阿丘科技對未來3-5年工業(yè)AI的一些趨勢觀點與大家分享。
第一,模型性能。雖然當前的模型泛化能力偏弱,但整個垂直行業(yè)的模型化已經(jīng)紛紛開始落地。
比如阿丘科技,我們目前已經(jīng)構(gòu)建出一套基于PCB行業(yè)的通用大模型,提升了PCB行業(yè)的工業(yè)視覺檢測效率,縮短了交付周期,通過流程優(yōu)化,提高了數(shù)據(jù)處理速度及模型穩(wěn)定性。我認為,在未來2-3年,基礎(chǔ)模型/通用模型將會迎來較大的突破,更多行業(yè)的垂直大模型即將涌現(xiàn)。
第二,計算成像。當前主流成像方案還是基于規(guī)則的,定制性偏強。未來,基于AI的計算成像將重塑成像解決方案及產(chǎn)品。這需要視覺系統(tǒng)各Component專業(yè)鏈條上廠商共創(chuàng),并且也會涌現(xiàn)一批新的成像產(chǎn)品廠商,來解決我們共同的現(xiàn)狀問題。
第三,TCO。當前視覺系統(tǒng)的設(shè)計、部署、維護成本過高,幾乎每一個關(guān)鍵環(huán)節(jié)都依賴于人員經(jīng)驗,未來,當端到端全部AI化之后,真正實現(xiàn)全鏈路AI和數(shù)據(jù)驅(qū)動時,將革命性地降低TCO,我預計可能在未來5年后,將會出現(xiàn)這一“殺手級“的產(chǎn)品。
第四,全新AI-Native產(chǎn)品形態(tài)探索。全新的AI-Native產(chǎn)品形態(tài),將驅(qū)動新的技術(shù)和行業(yè)生態(tài)蓬勃發(fā)展,未來5-10年,行業(yè)生態(tài)即將更換一個新模樣,同時廠商也會逐步經(jīng)歷一個新陳代謝、優(yōu)勝劣汰的過程。
-
機器視覺
+關(guān)注
關(guān)注
161文章
4320瀏覽量
119996 -
AI
+關(guān)注
關(guān)注
87文章
29806瀏覽量
268106 -
工業(yè)視覺
+關(guān)注
關(guān)注
0文章
67瀏覽量
7111
發(fā)布評論請先 登錄
相關(guān)推薦
評論