通過一張簡單的食物照片你能看到什么?當時和你一起吃飯的人?用餐的那個餐館播放的爵士樂?或者是懷念那一口美味的,自己卻做不出吃不到的家鄉(xiāng)菜?
Facebook最新研究,使用AI技術,只需要一張食物的圖片就可以洞悉它的烹飪方法。
該系統(tǒng)通過新穎的架構預測成分作為集合,在不強加任何順序的情況下對其依賴性進行建模,然后通過同時處理圖像及其推斷成分來生成烹飪指令。
AI變身大廚:看一眼就知道這道菜怎么做的
一份優(yōu)秀的菜譜不僅能夠?qū)懬宄淞希€要有清晰的烹飪步驟,例如大火爆炒幾分鐘,小火慢燉幾分鐘,是切絲還是切塊等等。
之前,傳統(tǒng)的做法是將圖片轉(zhuǎn)圖譜問題看做一種“檢索任務”,即根據(jù)圖片的相似度從食譜譜數(shù)據(jù)集中匹配烹飪方案。
這類系統(tǒng)的性能在很大程度上取決于數(shù)據(jù)集的大小和多樣性,以及圖片的質(zhì)量。如果數(shù)據(jù)集中壓根沒有圖片對應食譜的時候,顯然這個系統(tǒng)非常失敗。
將圖片到食譜看成條件生成問題可以很好的解決傳統(tǒng)系統(tǒng)的難題。換句話說,與直接的圖片匹配不同,后者更多的是預測配料的成分,然后根據(jù)配料和其對應的美食圖片生成烹飪步驟。
更重要的進步:除了食譜,之后可能還能識別卡路里
從食品圖片到菜譜,需要獲得超越僅僅是可見的圖片之外的信息,這對于當前的計算機視覺系統(tǒng)無疑是一個巨大挑戰(zhàn)。
與單純理解自然圖像相比,視覺成分預測需要的還有高級推理和先驗知識,例如,羊角面包中含有黃油。 因為食品具有比較高的類別內(nèi)可變性 intra-class variability,食物的形態(tài)在烹飪過程中發(fā)生改變,一道煮熟的菜肴和生的原料的樣子可能天差地別。
逆烹飪的實現(xiàn)是邁向更廣泛的食品理解系統(tǒng)的第一步,接下來也許就可以通過照片實現(xiàn)系統(tǒng)對于食物的卡路里估算和自動創(chuàng)建食譜。
成分預測也可以用于解決更廣泛的問題,例如實現(xiàn)圖像到集合的預測。
-
AI
+關注
關注
87文章
28902瀏覽量
266280 -
Facebook
+關注
關注
3文章
1429瀏覽量
54479
原文標題:Facebook最新研究:逆烹飪!從食物照片倒推食譜
文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論