HBO電視劇《硅谷》中曾出現(xiàn)過一個“不是熱狗”(Not Hot Dog)的應用。劇中主角們打造了一個人工智能應用,該應用只能識別熱狗,其他的食物都被簡單粗暴地鑒定為“不是熱狗”。
如果你經(jīng)??慈斯ぶ悄芟嚓P的文章,相信對“計算機視覺”一詞并不陌生。
作為人工智能的一項關鍵能力,計算機視覺總是和人工智能相伴出現(xiàn)。計算機視覺技術目前已有很多應用。
比如你手機相冊里的分類功能。手機根據(jù)相機拍攝的人物、物體、場景幫你分門別類。
正如我們用眼睛和大腦來感知世界,計算機視覺的目標之一,就是通過機器以類似的方式來“觀察”和處理圖像。計算機可以通過多種渠道“看到”我們無法感知到的世界。
計算機視覺并不簡單
HBO 電視劇《硅谷》中曾出現(xiàn)過一個“不是熱狗”(Not Hot Dog)的應用。劇中主角們打造了一個人工智能應用,該應用只能識別熱狗,其他的食物都被簡單粗暴地鑒定為“不是熱狗”。
這個應用場景說明,構(gòu)建一個真正實用的分類器絕非易事。
電視劇之外,片方還真的開發(fā)了這樣一個 App。“不是熱狗”應用的創(chuàng)作者表示,盡管他只花了一個周末,用一臺配備一顆 GPU 的筆記本電腦就完成應用的開發(fā),但卻花了大量時間去打磨用戶界面,又花了數(shù)周來改善應用的整體準確性。
通過機器學習實現(xiàn)對象識別的計算機視覺,本質(zhì)上是訓練模型以便對圖像中的對象進行識別和分類,實現(xiàn)起來并不簡單。
它需要成千上萬的圖像作為訓練數(shù)據(jù),開發(fā)人員也需要花費大量時間、精力和耐心去訓練模型。 “不是熱狗”應用表明,雖然計算機視覺技術具有巨大的潛力,但充分的訓練數(shù)據(jù)對于實現(xiàn)這一目標至關重要。
計算機視覺也會出錯
就像一個正在學習香蕉和方塊之間區(qū)別的小孩子一樣,經(jīng)過大量數(shù)據(jù)訓練的分類器仍然會犯錯誤。
辨別不同物體是圖像分類器的基本能力。我們來看人工智能公司 Clarifai 的分類器如何識別圖像。它取得了驚人的準確率:區(qū)分吉娃娃和松餅的準確率高達 95.8%。
但在識別圖像中其他種類物品時,卻表現(xiàn)不佳。 比如,在識別鴨子時,它不僅沒有識別出鴨子,還把鴨子周圍的水域識別為汽車!
同樣的,當測試人員向微軟的 CaptionBot AI 展示張牙舞爪的蟲子圖片時,它竟然將它識別為一只狗。
識別出錯在一定程度上是數(shù)據(jù)量的問題。分類器擁有的訓練數(shù)據(jù)越多,識別的準確率就越高。所以,如果我們給這些分類器提供更多的鴨子和蟲子圖片,理論上它們應該能夠更好地正確識別圖像。
我們不得不承認,一個顯而易見的事實是:計算機視覺和人類視覺不是一回事。
Qualcomm一直在努力改善我們的人工智能圖像分類能力。在 2015 年,我們在 ImageNet 圖像識別挑戰(zhàn)中拔得頭籌,該比賽重點測試了人工智能的對象定位、對象檢測和場景分類等能力。
我們將繼續(xù)研究計算機視覺在自動駕駛、虛擬現(xiàn)實、增強現(xiàn)實和物聯(lián)網(wǎng)等各種領域的最新應用。
-
人工智能
+關注
關注
1791文章
46671瀏覽量
237142 -
計算機視覺
+關注
關注
8文章
1694瀏覽量
45901
原文標題:我們常說的計算機視覺,究竟是什么?
文章出處:【微信號:Qualcomm_China,微信公眾號:高通中國】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論