0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI工具將低像素的面孔變成逼真的圖像

倩倩 ? 來(lái)源:新經(jīng)網(wǎng) ? 2020-07-07 09:43 ? 次閱讀

由北卡羅來(lái)納州達(dá)勒姆市杜克大學(xué)的程序設(shè)計(jì)團(tuán)隊(duì)設(shè)計(jì)的照片編輯工具,不僅可以為數(shù)字演示文稿提供更清晰,更清晰的圖像,而且還可以為老式視頻游戲迷帶來(lái)數(shù)小時(shí)的樂(lè)趣,他們現(xiàn)在可以為低矮的視頻生成清晰的面孔。填充早期產(chǎn)品的像素字符。但是該工具也出乎意料地浮出水面,涉及在大規(guī)模機(jī)器學(xué)習(xí)項(xiàng)目中使用數(shù)據(jù)集的偏見(jiàn)。

DUL研究人員創(chuàng)建了PULSE(通過(guò)潛伏空間探索進(jìn)行照片上采樣),以根據(jù)低像素源數(shù)據(jù)創(chuàng)建更逼真的圖像。在今年早些時(shí)候分發(fā)的研究論文中,該團(tuán)隊(duì)解釋了他們的方法與早期從8位圖像生成逼真的圖像的努力有何不同。

報(bào)告稱:“ PULSE不是從低分辨率圖像開(kāi)始,而是慢慢添加細(xì)節(jié),而是遍歷高分辨率自然圖像流形,搜索縮小到原始低分辨率圖像的圖像?!?/p>

這意味著他們用于構(gòu)建逼真的面部表情的算法是從大量真實(shí)人物的圖像數(shù)據(jù)集中提取的。

PULSE系統(tǒng)可以在幾秒鐘內(nèi)將16像素x 16像素的圖像轉(zhuǎn)換為1024像素乘1024像素的圖像。

連同他們的發(fā)現(xiàn),團(tuán)隊(duì)將PULSE上傳到GitHub并鼓勵(lì)進(jìn)行實(shí)驗(yàn)。

俄羅斯開(kāi)發(fā)人員Denis Malimonov上周開(kāi)發(fā)并發(fā)行了自己的應(yīng)用,名為Face Depixelizer。隨著用戶上傳他們自己的幽默作品,這些作品通常來(lái)自經(jīng)典游戲,例如Minecraft的Steve和Creeper,Super Mario的Mario以及Zelda的Legend的Link,因此在Twitter上的反應(yīng)迅速。

杜克大學(xué)團(tuán)隊(duì)認(rèn)識(shí)到PULSE的娛樂(lè)價(jià)值,但指出在一個(gè)探索和研究程度更高的時(shí)代,PULSE應(yīng)該在實(shí)踐上和經(jīng)濟(jì)上證明是有用的。

報(bào)告說(shuō):“在這項(xiàng)工作中,我們旨在將模糊的低分辨率圖像轉(zhuǎn)換為清晰,逼真的高分辨率圖像。” “在許多領(lǐng)域……由于成本,硬件限制或內(nèi)存限制等問(wèn)題,很難獲得清晰的高分辨率圖像?!?/p>

他們列舉了醫(yī)學(xué),天文學(xué),顯微鏡和衛(wèi)星圖像作為可以從他們的努力中受益的領(lǐng)域。

但是上周末,Twitter用戶開(kāi)始報(bào)告他們的實(shí)驗(yàn)趨勢(shì)令人不安。一些報(bào)告說(shuō),當(dāng)他們使用有色人種的圖像時(shí),重新生成的圖像將它們轉(zhuǎn)換為白色圖形。前總統(tǒng)巴拉克·奧巴馬(Barack Obama),已故世界冠軍拳擊手穆罕默德·阿里(Muhammad Ali),女演員露西·劉(Lucy Liu)和紐約州眾議員亞歷山大·奧卡西奧·科爾特斯(Alexandria-Ocasio Cortez)都通過(guò)這些應(yīng)用程序被渲染為白人。

令人遺憾的結(jié)果應(yīng)該不是完全意外的。隨著機(jī)器學(xué)習(xí)人工智能在研究項(xiàng)目中的越來(lái)越多的應(yīng)用,對(duì)海量數(shù)據(jù)集的依賴也越來(lái)越多。但是近年來(lái)的報(bào)告警告說(shuō),一些最常用的數(shù)據(jù)集包含的信息不能代表整個(gè)社會(huì)。一份報(bào)告指出,一個(gè)常用的數(shù)據(jù)庫(kù)包含的內(nèi)容是男性占74%,白人占83%,這凸顯了人們對(duì)性別偏見(jiàn)和種族代表不足的可能性的擔(dān)憂。

在2018年,一種執(zhí)法工具吹噓膚色淺的男人的面部識(shí)別錯(cuò)誤率低于1%,但是在確定膚色較深的受試者的性別時(shí),卻犯了35%的驚人錯(cuò)誤。

微軟,亞馬遜和IBM最近宣布,他們將停止或限制向警察部門銷售面部識(shí)別工具,部分原因是他們對(duì)依賴人工智能的種族,性別,種族和年齡偏見(jiàn)的擔(dān)憂。

在錄像帶致命警察槍擊事件和黑人嫌疑人窒息事件發(fā)生后的最近幾周發(fā)生動(dòng)蕩之后,這種數(shù)據(jù)集偏差尤其令人擔(dān)憂。

正如麻省理工學(xué)院研究生,2018年大學(xué)AI偏見(jiàn)報(bào)告的合著者Irene Chen所說(shuō):“算法僅與使用的數(shù)據(jù)一樣好,我們的研究表明,更好的數(shù)據(jù)通??梢詭?lái)更大的變化”。她補(bǔ)充說(shuō),不是需要更多數(shù)據(jù)來(lái)糾正偏差,而是需要提供更具代表性的數(shù)據(jù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46061

    瀏覽量

    235065
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8306

    瀏覽量

    131848
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Freepik攜手Magnific AI推出AI圖像生成器

    近日,設(shè)計(jì)資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這一里程碑式的發(fā)布標(biāo)志著AI
    的頭像 發(fā)表于 08-30 16:23 ?950次閱讀

    DSP教學(xué)實(shí)驗(yàn)箱_數(shù)字圖像處理操作_案例分享:5-13 灰度圖像二值化

    一、實(shí)驗(yàn)?zāi)康?學(xué)習(xí)灰度圖像二值化的原理,掌握圖像的讀取方法,并實(shí)現(xiàn)在LCD上顯示二值化前后的圖像。 二、實(shí)驗(yàn)原理 圖像二值化 圖像的二值化處
    發(fā)表于 07-25 15:03

    圖像語(yǔ)義分割的實(shí)用性是什么

    圖像語(yǔ)義分割是一種重要的計(jì)算機(jī)視覺(jué)任務(wù),它旨在圖像中的每個(gè)像素分配到相應(yīng)的語(yǔ)義類別中。這項(xiàng)技術(shù)在許多領(lǐng)域都有廣泛的應(yīng)用,如自動(dòng)駕駛、醫(yī)學(xué)圖像
    的頭像 發(fā)表于 07-17 09:56 ?231次閱讀

    深入理解渲染引擎:打造逼真圖像的關(guān)鍵

    在數(shù)字世界中,圖像渲染是創(chuàng)造逼真視覺(jué)效果的核心技術(shù)。渲染引擎,作為這一過(guò)程中的關(guān)鍵組件,負(fù)責(zé)二維或三維的模型、紋理、光照等數(shù)據(jù)轉(zhuǎn)化為人們?nèi)庋劭梢?jiàn)的二維圖像。本文
    的頭像 發(fā)表于 06-29 08:28 ?188次閱讀
    深入理解渲染引擎:打造<b class='flag-5'>逼真</b><b class='flag-5'>圖像</b>的關(guān)鍵

    DSP C6000教學(xué)實(shí)驗(yàn)箱操作教程_數(shù)字圖像處理:5-3 圖像縮放

    ,硬件實(shí)現(xiàn)所需資源少。 缺點(diǎn):得到的圖像質(zhì)量,特別是放大低質(zhì)量的圖像可能產(chǎn)生明顯鋸齒。 最鄰近插值的的思想很簡(jiǎn)單,就是把這個(gè)非整數(shù)坐標(biāo)作一個(gè)四舍五入,取最近的整數(shù)點(diǎn)坐標(biāo)處的點(diǎn)的顏色。
    發(fā)表于 06-20 11:28

    DSP教學(xué)實(shí)驗(yàn)箱_數(shù)字圖像處理_操作教程:5-1 圖像旋轉(zhuǎn)

    一、實(shí)驗(yàn)?zāi)康?學(xué)習(xí)圖像旋轉(zhuǎn)的原理,掌握圖像的讀取方法,并實(shí)現(xiàn)圖像旋轉(zhuǎn)。 二、實(shí)驗(yàn)原理 圖像旋轉(zhuǎn) 圖像的旋轉(zhuǎn)是指以
    發(fā)表于 06-14 14:03

    OpenAI發(fā)布圖像檢測(cè)分類器,可區(qū)分AI生成圖像與實(shí)拍照片

    據(jù)OpenAI介紹,初步測(cè)試結(jié)果表明,該分類器在辨別非AI生成圖像與DALL·E 3生成圖像時(shí),成功率高達(dá)近98%,僅有不到0.5%的非AI圖像
    的頭像 發(fā)表于 05-09 09:57 ?334次閱讀

    OpenCV圖像卷積與濾波詳解

    圖像的濾波器是一種用于增強(qiáng)或抑制圖像中特定特征的工具。它通常是一個(gè)小矩陣,定義了如何對(duì)圖像中的像素進(jìn)行操作。
    的頭像 發(fā)表于 03-26 14:57 ?952次閱讀
    OpenCV<b class='flag-5'>圖像</b>卷積與濾波詳解

    Stability AI試圖通過(guò)新的圖像生成人工智能模型保持領(lǐng)先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領(lǐng)先的前身Stable Diffusion更快、更強(qiáng)大,而Stable Diffusion是許多其他文本到圖像生成
    的頭像 發(fā)表于 02-19 16:03 ?781次閱讀
    Stability <b class='flag-5'>AI</b>試圖通過(guò)新的<b class='flag-5'>圖像</b>生成人工智能模型保持領(lǐng)先地位

    什么是像素流送?像素流送如何應(yīng)用?

    芯片像素
    dianliang02
    發(fā)布于 :2023年12月13日 15:56:04

    什么是像素流送?像素流送如何應(yīng)用?

    送又是如何應(yīng)用的呢? 簡(jiǎn)單來(lái)說(shuō), 像素流送利用云計(jì)算和延遲傳輸技術(shù),通過(guò)在云端服務(wù)器上部署應(yīng)用程序和操作內(nèi)容,并以視頻流的形式傳輸?shù)浇K端設(shè)備進(jìn)行顯示和操作。 這種技術(shù)方案帶來(lái)了一種新的改變,原本對(duì)硬件要求
    的頭像 發(fā)表于 12-13 15:43 ?436次閱讀

    免費(fèi)開(kāi)源圖像修復(fù)工具lama-cleaner介紹

    Lama Cleaner 是由 SOTA AI 模型提供支持的免費(fèi)開(kāi)源圖像修復(fù)工具??梢詮膱D片中移除任何不需要的物體、缺陷和人,或者擦除并替換(powered by stable diffusion)圖片上的任何東西。
    的頭像 發(fā)表于 12-04 10:23 ?2059次閱讀
    免費(fèi)開(kāi)源<b class='flag-5'>圖像</b>修復(fù)<b class='flag-5'>工具</b>lama-cleaner介紹

    阿迪達(dá)斯與 Covision Media 使用 AI 和 NVIDIA RTX 創(chuàng)建逼真的 3D 內(nèi)容

    Covision 的基于 AI 的 3D 技術(shù)可幫助企業(yè)掃描數(shù)千種產(chǎn)品,為網(wǎng)站和移動(dòng)應(yīng)用創(chuàng)建逼真的 3D 圖像、視頻和 AR 體驗(yàn)。 實(shí)體產(chǎn)品掃描成 3D 模型是一項(xiàng)十分耗時(shí)的工作。
    的頭像 發(fā)表于 11-28 18:45 ?545次閱讀
    阿迪達(dá)斯與 Covision Media 使用 <b class='flag-5'>AI</b> 和 NVIDIA RTX 創(chuàng)建<b class='flag-5'>逼真的</b> 3D 內(nèi)容

    Ansys即將推出Ansys SimAI和Ansys AI+技術(shù)

    Ansys即將推出的基于AI的軟件工具繼續(xù)增強(qiáng)客戶體驗(yàn),加速仿真的普及并將繼續(xù)推進(jìn)新一代創(chuàng)新與洞察
    的頭像 發(fā)表于 11-04 14:15 ?1069次閱讀

    格科微:3200萬(wàn)像素圖像傳感器產(chǎn)品量產(chǎn)出貨

    近日,格科微3200萬(wàn)像素圖像傳感器已實(shí)現(xiàn)量產(chǎn)出貨。
    的頭像 發(fā)表于 10-19 14:20 ?667次閱讀