0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google: 時(shí)尚與人工智能相遇

Qxwdz168 ? 來(lái)源:計(jì)算機(jī)視覺(jué)芯片設(shè)計(jì) ? 2023-06-20 15:48 ? 次閱讀

如果您看不到或想象自己穿著一件衣服,就很難知道它是否適合您。有多少次你在網(wǎng)上買了一件東西,當(dāng)它送到你家門口時(shí)興奮地打開(kāi)盒子,沖上去試穿,然后……困惑地盯著鏡子?它可能以您意想不到的方式垂墜。或者在您身上看起來(lái)與在在線模型上看起來(lái)完全不同。

本周,google將在 Google.com 上發(fā)布一項(xiàng)新的購(gòu)物功能,旨在為人們提供更有用的在線購(gòu)物體驗(yàn)。虛擬試穿 (VTO) 在具有不同體型和尺寸的真實(shí)模特身上生成栩栩如生的服裝寫照。這些圖像包括那些微妙但至關(guān)重要的細(xì)節(jié),例如某些東西如何懸垂、折疊、緊貼、拉伸和皺紋——所有這些都具有為 VTO 開(kāi)發(fā)的新生成 AI 模型的強(qiáng)大功能。

購(gòu)物者只需選擇一件他們感興趣的服裝,然后選擇一個(gè)款式,瞧,他們已經(jīng)看到試穿了。

01b2471e-0c5e-11ee-962d-dac502259ad0.jpg

“VTO 是在線購(gòu)物向前邁出的激動(dòng)人心的一步,尤其是在顯然需要更多代表性的服裝領(lǐng)域,”購(gòu)物產(chǎn)品經(jīng)理 Shyam Sunder 說(shuō)。“服裝是谷歌搜索最多的購(gòu)物類別之一,因此對(duì)人們和品牌的幫助潛力巨大。統(tǒng)計(jì)數(shù)據(jù)顯示了一個(gè)明確的需求:42% 的在線購(gòu)物者覺(jué)得模特圖片無(wú)法代表他們,59% 的人對(duì)他們?cè)诰W(wǎng)上購(gòu)買的商品感到不滿意,因?yàn)樗雌饋?lái)與他們預(yù)期的不一樣?!?/p>

從一開(kāi)始,該團(tuán)隊(duì)就想為購(gòu)物者提供一系列可以解決這個(gè)問(wèn)題的模型?!爱?dāng)我們?cè)?a target="_blank">網(wǎng)絡(luò)上搜索服裝時(shí),當(dāng)涉及到穿著這些衣服的模特時(shí),我們會(huì)發(fā)現(xiàn)結(jié)果差異很小,”Shyam 說(shuō)。“我記得一個(gè)例子,50 張圖片中只有四張是有色人種。所以問(wèn)題是,即使我們想在購(gòu)物中顯示不同的圖像,我們也做不到,因?yàn)榫W(wǎng)絡(luò)上沒(méi)有足夠的圖像。這是我熱切想要解決的問(wèn)題?!?/p>

因此,該團(tuán)隊(duì)創(chuàng)建了他們自己的資料庫(kù),其中包含 80 個(gè)代表多種尺寸、膚色、身高、年齡和性別的模特,以便在 Google 上購(gòu)物的人可以選擇他們最感興趣的模特,并查看衣服穿在身上的效果。

“一個(gè)關(guān)鍵問(wèn)題是如何在每個(gè)模型上自動(dòng)生成任何服裝,”購(gòu)物研究科學(xué)家 Ira Kemelmacher-Shlizerman 說(shuō)。“人們研究類似技術(shù)已經(jīng)有一段時(shí)間了,但最終的圖像從來(lái)沒(méi)有完全達(dá)到目標(biāo)——它們存在視覺(jué)缺陷,比如錯(cuò)位的褶皺,使衣服看起來(lái)畸形和不自然。所以我們給自己設(shè)定了一個(gè)挑戰(zhàn):創(chuàng)造一種方法,可以為任何體型和體形的人合成逼真的高質(zhì)量圖像。這就是生成人工智能的用武之地。”

該團(tuán)隊(duì)轉(zhuǎn)向了 VTO 的文本到圖像模型,該模型能夠從文本輸入創(chuàng)建高度逼真的圖像。尤其重要的是一種稱為擴(kuò)散的技術(shù),該技術(shù)會(huì)逐漸將噪聲添加到照片中,并訓(xùn)練神經(jīng)網(wǎng)絡(luò)去除這些噪聲像素。

對(duì)于 VTO,該團(tuán)隊(duì)沒(méi)有使用單一的擴(kuò)散網(wǎng)絡(luò)和大型語(yǔ)言模型(如在文本到圖像中使用的那樣),而是創(chuàng)建了一種稱為并行 U-net 的新架構(gòu),它接受兩幅圖像:人物圖像和服裝圖像。每張圖片都通過(guò)自己的神經(jīng)網(wǎng)絡(luò)——U-net——同時(shí)通過(guò)稱為“交叉注意力”的過(guò)程進(jìn)一步相互交流?!敖Y(jié)果是驚人的,”艾拉說(shuō)?!拔覀兊挠脩粞芯勘砻?,我們的方法比最先進(jìn)的方法有很大的優(yōu)勢(shì)——超過(guò) 95% 的時(shí)間。”

該團(tuán)隊(duì)使用 Google 的 Shopping Graph 對(duì)新的 AI 模型進(jìn)行嚴(yán)格訓(xùn)練,這是世界上最全面的產(chǎn)品、賣家、品牌、評(píng)論和庫(kù)存數(shù)據(jù)集。他們使用數(shù)百萬(wàn)對(duì)圖像來(lái)訓(xùn)練模型,每對(duì)圖像都包括一個(gè)穿著衣服的人以兩種不同的姿勢(shì)。人工智能模型學(xué)習(xí)將一個(gè)姿勢(shì)的襯衫形狀與另一個(gè)姿勢(shì)的人相匹配,反之亦然,直到它可以從各個(gè)角度生成該人穿著襯衫的逼真圖像。

01df36f2-0c5e-11ee-962d-dac502259ad0.jpg

在一個(gè)例子中,試穿結(jié)果似乎比原來(lái)的衣服顏色更亮。該團(tuán)隊(duì)對(duì)這些類型的示例進(jìn)行了數(shù)天的審議,但最終決定在發(fā)布時(shí)謹(jǐn)慎行事,當(dāng)出現(xiàn)任何此類錯(cuò)誤時(shí),刪除在模型上虛擬試穿服裝的選項(xiàng)。隨著他們從用戶和品牌那里得到反饋,他們將繼續(xù)做出調(diào)整?!盀樯蓤D像發(fā)明全自動(dòng)評(píng)估仍然是一個(gè)懸而未決的問(wèn)題,我們正在積極努力,”艾拉說(shuō)。

如今,Google Shopping Graph 上數(shù)百個(gè)品牌和零售商的女裝上衣均可試穿,包括 Anthropologie、LOFT、H&M 和 Everlane。隨著時(shí)間的推移,該工具將變得更加精確并擴(kuò)展到更多品牌。到目前為止,品牌反響非常積極。

“當(dāng)我們讓他們了解這項(xiàng)技術(shù)時(shí),我們收到了一些很好的反饋,并且也非??释麉⑴c,”Shyam 說(shuō)。“他們中的一些人非常喜歡它,他們要求使用這項(xiàng)技術(shù)來(lái)支持他們自己的網(wǎng)站?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1754

    瀏覽量

    57374
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29806

    瀏覽量

    268103
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46652

    瀏覽量

    237073
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3112

    瀏覽量

    48658

原文標(biāo)題:Google: 時(shí)尚與人工智能相遇

文章出處:【微信號(hào):計(jì)算機(jī)視覺(jué)芯片設(shè)計(jì),微信公眾號(hào):計(jì)算機(jī)視覺(jué)芯片設(shè)計(jì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得一好書(shū),特此來(lái)分享。感謝平臺(tái),感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這一章詳細(xì)
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    周末收到一本新書(shū),非常高興,也非常感謝平臺(tái)提供閱讀機(jī)會(huì)。 這是一本挺好的書(shū),包裝精美,內(nèi)容詳實(shí),干活滿滿。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》這本書(shū)的第一章,作為整個(gè)著作的開(kāi)篇
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    與人工智能推薦系統(tǒng)中強(qiáng)大的圖形處理器(GPU)一爭(zhēng)高下。其獨(dú)特的設(shè)計(jì)使得該處理器在功耗受限的條件下仍能實(shí)現(xiàn)高性能的圖像處理任務(wù)。 Ceremorphic公司 :該公司開(kāi)發(fā)的分層學(xué)習(xí)處理器結(jié)合了
    發(fā)表于 09-28 11:00

    智能制造與人工智能的區(qū)別

    智能制造與人工智能在定義、技術(shù)組成、應(yīng)用領(lǐng)域以及發(fā)展重點(diǎn)等方面存在明顯的區(qū)別。
    的頭像 發(fā)表于 09-15 14:27 ?558次閱讀

    人工智能ai4s試讀申請(qǐng)

    目前人工智能在繪畫對(duì)話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題,本書(shū)對(duì)ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬按照要求準(zhǔn)備相關(guān)體會(huì)材料??茨芊裼兄谌腴T和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    ! 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》 這本書(shū)便將為讀者徐徐展開(kāi)AI for Science的美麗圖景,與大家一起去了解: 人工智能究竟幫科學(xué)家做了什么? 人工智能將如何改變我們所生
    發(fā)表于 09-09 13:54

    報(bào)名開(kāi)啟!深圳(國(guó)際)通用人工智能大會(huì)將啟幕,國(guó)內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國(guó)際)通用人工智能大會(huì)暨深圳(國(guó)際)通用人工智能產(chǎn)業(yè)博覽會(huì)將在深圳國(guó)際會(huì)展中心(寶安)舉辦。大會(huì)以“魅力AI·無(wú)限未來(lái)”為主題,致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品
    發(fā)表于 08-22 15:00

    串口屏與人工智能的結(jié)合

    在當(dāng)今智能化浪潮中,傳統(tǒng)設(shè)備與新興技術(shù)的融合正不斷推動(dòng)產(chǎn)業(yè)升級(jí),其中,串口屏與人工智能(AI)的結(jié)合尤為引人注目。串口屏作為一種常見(jiàn)的信息展示與交互設(shè)備,在工業(yè)控制、智能家居、醫(yī)療健康等多個(gè)領(lǐng)域發(fā)揮
    的頭像 發(fā)表于 08-16 12:29 ?1246次閱讀

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場(chǎng)可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過(guò)程加速:FPGA可以用來(lái)加速深度學(xué)習(xí)的訓(xùn)練和推理過(guò)程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    計(jì)算機(jī)視覺(jué)與人工智能的關(guān)系是什么

    、交流等方面。計(jì)算機(jī)視覺(jué)與人工智能之間存在著密切的聯(lián)系,計(jì)算機(jī)視覺(jué)是人工智能的一個(gè)重要分支,也是實(shí)現(xiàn)人工智能的關(guān)鍵技術(shù)之一。 計(jì)算機(jī)視覺(jué)的定義與發(fā)展 2.1 計(jì)算機(jī)視覺(jué)的定義 計(jì)算機(jī)視覺(jué)是一門研究如何使計(jì)算機(jī)能夠理解
    的頭像 發(fā)表于 07-09 09:25 ?484次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開(kāi)發(fā)(SC171開(kāi)發(fā)套件V2)

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開(kāi)發(fā)(SC171開(kāi)發(fā)套件V2) 課程類別 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 人工智能 參賽基礎(chǔ)知識(shí)指引 14分50秒 https
    發(fā)表于 05-10 16:46

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開(kāi)發(fā)(SC171開(kāi)發(fā)套件V1)

    課程類別 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 人工智能 參賽基礎(chǔ)知識(shí)指引 14分50秒 https://t.elecfans.com/v/25508.html *附件:參賽基礎(chǔ)知識(shí)指引
    發(fā)表于 04-01 10:40

    FMEA與人工智能的融合發(fā)展

    工具,正逐漸展現(xiàn)出其在賦能人工智能領(lǐng)域的巨大潛力。本文將分享FMEA如何與人工智能相結(jié)合,共同開(kāi)啟智能風(fēng)險(xiǎn)預(yù)防的新紀(jì)元。 一、FMEA與人工智能:相得益彰的結(jié)合 FMEA通過(guò)分析產(chǎn)品或
    的頭像 發(fā)表于 03-18 16:21 ?655次閱讀

    科達(dá)嘉電感器在大數(shù)據(jù)與人工智能領(lǐng)域被廣泛應(yīng)用

    近年來(lái),大數(shù)據(jù)與人工智能成為科技領(lǐng)域的熱門話題。大數(shù)據(jù)為人工智能提供了大量的數(shù)據(jù)作為輸入,使得人工智能算法和模型能夠通過(guò)學(xué)習(xí)做出更準(zhǔn)確的預(yù)測(cè)和決策。
    的頭像 發(fā)表于 02-29 13:56 ?443次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時(shí)代背景下,嵌入式人工智能成為國(guó)家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級(jí)的核心驅(qū)動(dòng)力。同時(shí)在此背景驅(qū)動(dòng)下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局
    發(fā)表于 02-26 10:17