0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

像在word里一樣便捷地編輯圖像中的文字

nlfO_thejiangme ? 來源:lp ? 2019-03-08 09:38 ? 次閱讀

你想像編輯word文本一樣便捷地編輯照片中的文字嗎?像這樣:

和這樣:

讓別人感覺不到任何人為編輯的跡象:

近日來自印度的研究人員們近日提出了一種基于自編碼模型的字符替換方法,通過字符生成、顏色調(diào)節(jié)和重置完成對圖像中目標(biāo)文字的修改,并且能生成十分自然的圖像,圖像中被編輯過的文字毫無違和感。圖片上的文字信息對于我們理解圖片十分重要。字符的缺失和改變有的時候會嚴(yán)重的影響我們對于圖像內(nèi)涵的理解。除了會造成忍俊不禁的錯別字,有時候還會讓人們誤解造成嚴(yán)重的損失!

另一方面,對于不同視角、環(huán)境下得到字符缺失的圖片,如何進行有效的編輯和修復(fù)也是視覺領(lǐng)域一個重要的問題,甚至對于古文獻修復(fù)和案件偵破都有著重要意義。

像編輯文本一樣編輯圖像中的文字

如果我們能夠像文本編輯器一樣編輯圖像中的文字就好了。先前的人員提出過基于字符幾何特征的合成方法,但卻缺乏泛化性。但隨著深度學(xué)習(xí)的發(fā)展,研究人員提出了利用GAN來進行字符生成,但基于GAN生成字符進行編輯的方法也需要面臨一系列問題。首先基于GAN的生成需要對目標(biāo)字符進行精確的識別,但字符識別本身就是一個復(fù)雜的問題,任何誤差都會在整個過程積累十分有可能造成字符編輯的錯誤;其次,字符在同一張圖像內(nèi)具有多種字體類型,GAN模型需要對字體進行多次觀察,并在生成前對字符進行較為嚴(yán)格的字體去失真過程,這對于不同情況下的字符編輯來說十分復(fù)雜。

所以研究人員聚焦字符級別的生成模型,來代替單詞級別的生成模型最大化模型的靈活性和適應(yīng)性。那么為了編輯圖像中的文字,怎樣才能又快又好呢?你需要四個步驟:定位到你要修改的字符、生成目標(biāo)字符、調(diào)整目標(biāo)字符的顏色、將字符融合回圖像中去。這一工作的核心在于解決如何生成具有相同字體的目標(biāo)字符,并為它賦予原字符相同的顏色風(fēng)格。為此,研究人員提出了下圖所示的FANet和ColorNet聯(lián)合完成。

首先選取需要修改的字符,并利用算法將原字符轉(zhuǎn)變?yōu)槎祱D像輸入網(wǎng)絡(luò)。FANet首先通過一個三層卷積和兩次全連接將輸入字符編碼到512長度的向量上,其中包含了字體的風(fēng)格信息。此外,目標(biāo)字符的編碼通過26個字符的獨熱編碼轉(zhuǎn)換到512維的編碼上與先前得到的輸入字符圖像編碼拼接得到1024維的隱空間編碼。隨后利用兩個全連接和三次上采樣最終得到與原字符相同風(fēng)格的目標(biāo)字符。但這時候的字符還沒有顏色。那么就把原字符的顏色信息拿過來,繼續(xù)進行處理。通過編碼器解碼器的結(jié)構(gòu),將原字符上的顏色信息遷移到了新字符上。最后對原圖的對應(yīng)區(qū)域進行背景去除,區(qū)域連續(xù)性處理,將得到的新字符放到合適的位置就可以得到修改后的圖片了!來看看效果~~

這本jave書有點厲害!

看到這些圖,你可能會覺得這些路標(biāo)好像和上次看到的不一樣了!

為了訓(xùn)練這個網(wǎng)絡(luò),研究人員們利用了谷歌字符庫中的1000中字體,其中訓(xùn)練集中包含了67.6萬個數(shù)據(jù),驗證集則有20.2萬個數(shù)據(jù)。

最終的網(wǎng)絡(luò)不僅可以編輯字符,同時還能由輸入的單一字符生成出全部26個字母的新字體,下圖中的的字體都是由一個輸入字符生成出來的。

同樣顏色也可以遷移,下圖中的第二行表示輸入字符的顏色,第三行就是將第二行的顏色遷移到第一行字符的結(jié)果。

中文字符

那么按道理,我們也可以開心的編輯照片中的漢字了。華中科技大學(xué)和曠視去年就提出了一篇可以生成各種風(fēng)格漢字書法的工作,利用生成器和判別器實現(xiàn)了中文書法字符的合成。

這是文章中的網(wǎng)絡(luò)結(jié)構(gòu):

和最后得到的結(jié)果:

我們可以基于同樣的思路將圖像中的中文字符也進行轉(zhuǎn)換,把照片中的漢字都變成優(yōu)秀的書法作品啦。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • word
    +關(guān)注

    關(guān)注

    1

    文章

    78

    瀏覽量

    21850
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1075

    瀏覽量

    40274
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    915

    瀏覽量

    54651

原文標(biāo)題:如何如文本般順滑來編輯照片中的文字?

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Word文字錄入技巧

    Word文字錄入技巧1.1.1  疊字輕松輸入在漢字中經(jīng)常遇到重疊字,比如“爸爸”、“媽媽”“歡歡喜喜”等,在Word輸入時除了利用輸入法自帶的功能快速輸入外,還有沒有其
    發(fā)表于 03-10 17:51

    word按空格自動刪除后面的文字

    養(yǎng)成碰到問題及時解決的習(xí)慣。原因分析:可能是不小心碰到Insert鍵了,按了這個鍵就會把平常WORD輸入文字時的插入狀態(tài)變成改寫狀態(tài)了,在改寫狀態(tài)下,你每輸入個字符,就會自動把插入
    發(fā)表于 01-05 23:27

    pdf文件文字怎么進行編輯

    文件文字怎么編輯,發(fā)現(xiàn)百度出來的步驟好多,覺著好麻煩。所以又去百度有什么pdf編輯器可以簡單操作修改pdf文件今天小編就把我知道的款好
    發(fā)表于 07-10 10:29

    在Labview Communication Design System Suite如何創(chuàng)建屬性節(jié)點,就像在labview右鍵創(chuàng)建屬性節(jié)點一樣

    在Labview Communication Design System Suite如何創(chuàng)建屬性節(jié)點,就像在labview右鍵創(chuàng)建屬性節(jié)點一樣
    發(fā)表于 02-03 14:40

    請問怎么將WORD文字復(fù)制到虛擬機Linux的VI編輯?

    如何將WORD文字復(fù)制到虛擬機Linux的VI編輯
    發(fā)表于 03-27 07:45

    如何實現(xiàn)圖片轉(zhuǎn)Word文檔

    脫軌了,現(xiàn)在有個圖片轉(zhuǎn)word便捷方法,可以輕松幫你提取圖片中的文字信息,快來試試吧!使用工具:迅捷OCR文字識別工具;操作方法:第二步:
    發(fā)表于 04-19 15:05

    CAD圖紙的CAD文字復(fù)制到Word文檔變成了黑色框怎么辦?

    我們在使用浩辰CAD制圖軟件繪制完成圖紙后,有些時候?qū)AD圖形復(fù)制到Word文檔后部分CAD文字出現(xiàn)了問題,這個時候該怎么解決呢?接下來給大家介紹下問題產(chǎn)生的原因以及解決方法吧!
    發(fā)表于 01-20 11:00

    有哪幾種辦法可實現(xiàn)單片機像在pc終端一樣打印log呢

    有哪幾種辦法可實現(xiàn)單片機像在pc終端一樣打印log呢?stm32實現(xiàn)printf打印log的辦法有哪些呢?
    發(fā)表于 12-01 06:39

    請問在emwin TEXT控件文字可以更改嗎?

    請問在 emwinTEXT控件文字可以更改嗎?如果字體不一樣,修改了字體,能不能改?謝謝
    發(fā)表于 11-06 08:22

    如何在Word怎么畫電路圖?

    如何在Word怎么畫電路圖? 編制物理試卷時,很多人認(rèn)為用Word畫圖困難,喜歡用windows自帶的畫圖程序畫圖,或
    發(fā)表于 12-26 10:24 ?1.2w次閱讀
    如何在<b class='flag-5'>Word</b><b class='flag-5'>中</b>怎么<b class='flag-5'>樣</b>畫電路圖?

    年成為Emacs高手,像神一樣使用編輯

    年成為Emacs高手,像神一樣使用編輯
    發(fā)表于 10-29 11:03 ?8次下載
    <b class='flag-5'>一</b>年成為Emacs高手,像神<b class='flag-5'>一樣</b>使用<b class='flag-5'>編輯</b>器

    微軟計劃研究盲人VR導(dǎo)航系統(tǒng),讓盲人可以像在真實世界一樣行走

    VR主要還是種針對視覺上“欺騙”的技術(shù),相對而言視障人士來說就有點難以領(lǐng)略VR的魅力。微軟個最新的研究項目能讓盲人以現(xiàn)實世界的導(dǎo)航方式在VR世界中進行導(dǎo)航,盲人可以在VR環(huán)境像在
    發(fā)表于 08-02 14:18 ?2440次閱讀

    怎樣簡單識別圖片文字轉(zhuǎn)換到Word

      工作我們經(jīng)常會處理到各種各樣的圖片文件,有時候還需要將圖片文件上的信息整理到Word類的文檔,這樣編輯起來就很方便,那怎樣簡單識別
    發(fā)表于 03-27 13:50 ?793次閱讀

    如何解決MathType公式與文字錯位的詳細(xì)資料說明

    按鈕、在word 文檔設(shè)置。本文將詳解這三種方法的具體運用,幫您徹底解決MathType 公式與文字錯位的問題。
    發(fā)表于 05-30 17:26 ?4次下載
    如何解決MathType<b class='flag-5'>中</b>公式與<b class='flag-5'>文字</b>錯位的詳細(xì)資料說明

    Office Word新功能“微軟編輯器”:檢查并修正語法錯誤

    )和機器學(xué)習(xí)技術(shù),當(dāng)用戶使用Word或者Outlook等微軟產(chǎn)品時,它能夠?qū)崟r發(fā)現(xiàn)拼寫和語法錯誤。在升級Word之后,你就可以在微軟Word打開你的文檔,免費的
    的頭像 發(fā)表于 12-24 17:26 ?2727次閱讀