0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一款工具,借助深度學(xué)習(xí)模型可以一鍵摳去漫畫(huà)中的文字

m3Fp_almosthuma ? 來(lái)源:機(jī)器之心 ? 2020-01-27 11:12 ? 次閱讀

漫畫(huà)摳圖是漢化組翻譯中必不可少而又工作量很大的一項(xiàng)工作,主要內(nèi)容是將漫畫(huà)中的文字摳去,以便替換成另一種語(yǔ)言?,F(xiàn)在,這項(xiàng)工作可以自動(dòng)化地完成了,一位韓國(guó)的開(kāi)發(fā)者開(kāi)源了一款工具,借助深度學(xué)習(xí)模型可以一鍵摳去漫畫(huà)中的文字,連背景圖中的文字都可以被摳去,效果十分驚人。

很多人都喜歡看日本漫畫(huà),不少作品已經(jīng)成為很多人心中的童年回憶。但是對(duì)于漫畫(huà)的翻譯人員來(lái)說(shuō),他們需要去除原有漫畫(huà)的對(duì)話框和背景文字,并將其替換為讀者使用的語(yǔ)言。由于一本漫畫(huà)可能有數(shù)萬(wàn)個(gè)對(duì)話框和對(duì)話,因此工作量是很大的。

現(xiàn)在,摳圖的工作人員可以基本上解放他們的雙手了。只要你有 TensorFlow,就可以快速實(shí)現(xiàn)一鍵摳圖,將漫畫(huà)圖像中的所有文字一鍵去除。

SickZil-Machine,一鍵摳圖

SickZil 是韓文中的作者提供了一個(gè)視頻,用于展示這一工具的效果。

作者同時(shí)提供了自動(dòng)工具摳圖的案例。

對(duì)話框中的文字可以被完全消除。

有時(shí)候會(huì)有些文字消除不干凈的情況,但基本不影響畫(huà)面(漫畫(huà)右上角標(biāo)題符號(hào))。同時(shí),背景中被去掉文字后,背景畫(huà)面可以被自動(dòng)補(bǔ)全,基本不改變畫(huà)面效果(畫(huà)面右上角背景文字)。

從視頻中可以看出,這一工具非常的方便。只需要選擇待處理的漫畫(huà),然后運(yùn)行工具即可。如果有一些畫(huà)面被誤去除,或者有一些去除不干凈的情況下,用戶可以手動(dòng)修改需要被去除的文字。

那么,這一工具背后是什么技術(shù)呢?

技術(shù)

模型架構(gòu)

據(jù)項(xiàng)目作者介紹,這一工具背后使用了兩個(gè)模型,第一個(gè)是 Seg Net,用于檢測(cè)漫畫(huà)中的問(wèn)題。另一個(gè)則是 Compl Net,用于處理漫畫(huà)圖像,去除文字并補(bǔ)全缺失的圖像部分。

Seg Net 使用的是 U-NET。這是一種編碼器-解碼器架構(gòu)。編碼器逐漸減少池化層的空間維度,解碼器逐步修復(fù)物體的細(xì)節(jié)和空間維度。

U-Net 的架構(gòu),將輸入圖像逐步池化后進(jìn)行上采樣,從而還原圖像細(xì)節(jié)。

而 Compl Net 使用的是 deepfill v2,這是一個(gè)用于對(duì)任意被 mask 的圖像進(jìn)行修復(fù)的模型,可以適應(yīng)各種 mask 的方式(塊狀遮蓋或線條遮蓋都可以)。deepfill 是 Adobe 等機(jī)構(gòu)提出一系列圖像修復(fù)工具,機(jī)器之心也曾用過(guò) deepfill v1,但是效果似乎沒(méi)有論文展示的那么好。

目前 deepfill v2 并沒(méi)有官方開(kāi)源,但 GitHub 上有其他開(kāi)發(fā)者復(fù)現(xiàn)。

deepfill v2 的模型架構(gòu),可以進(jìn)行圖像修復(fù)。

有了這兩大神器,基本上可以實(shí)現(xiàn)漫畫(huà)文字的檢測(cè)識(shí)別和去除文本后的圖像補(bǔ)全。

數(shù)據(jù)集和訓(xùn)練

有了模型還不夠,很多讀者想知道,整個(gè)系統(tǒng)是怎樣訓(xùn)練的。

在 Seg Net 上,作者使用了原始的漫畫(huà)圖像和文本內(nèi)容遮蓋數(shù)據(jù),用于覆蓋原始漫畫(huà)中所有的文字部分。在 Compl Net 上,模型的輸入為被移除了文字的漫畫(huà)圖像。模型使用了 285 個(gè)圖像-遮蓋對(duì)和 31500 張漫畫(huà)圖像,其中有將近 12000 張漫畫(huà)是有文字的,因此訓(xùn)練的數(shù)據(jù)比較平衡。

安裝和使用

作者沒(méi)有透露訓(xùn)練模型的相關(guān)參數(shù),但是提供了開(kāi)發(fā)者需要準(zhǔn)備的硬件配置。 對(duì)于開(kāi)發(fā)者而言,運(yùn)行代碼需要準(zhǔn)備 NVIDIA 驅(qū)動(dòng) 410.x,CUDA 10.0,CUDNN >= 7.4.1,TensorFlow 需要大于 1.13 版本。

配置代碼步驟如下:

首先克隆相關(guān)代碼:git clone https://github.com/KUR-creative/SickZil-Machine.git; cd SickZil-Machine

下載 zip 文件,地址:https://github.com/KUR-creative/SickZil-Machine/releases。

解壓并復(fù)制文件:SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/cnet 和 SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/snet 到文件目錄:SickZil-Machine/resource.

進(jìn)入目錄并安裝:pip install -r requirements.txt

運(yùn)行主程序:cd src; python main.py

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3123

    瀏覽量

    48664
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4730

    瀏覽量

    68259
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5473

    瀏覽量

    120910

原文標(biāo)題:漫畫(huà)漢化組福音:深度學(xué)習(xí)工具一鍵摳圖

文章出處:【微信號(hào):almosthuman2014,微信公眾號(hào):機(jī)器之心】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    在中壓開(kāi)關(guān)柜上使用微機(jī)五防鎖是否可以實(shí)現(xiàn)一鍵順控

    蜀瑞創(chuàng)新為大家科普:雖然微機(jī)五防鎖是實(shí)現(xiàn)“一鍵順控”的重要組成部分之,但它本身并不能單獨(dú)完成整個(gè)過(guò)程。需要結(jié)合其他自動(dòng)化控制技術(shù)和設(shè)備,以及合適的軟件平臺(tái)來(lái)實(shí)現(xiàn)真正的“一鍵順控”。
    的頭像 發(fā)表于 11-06 11:58 ?44次閱讀
    在中壓開(kāi)關(guān)柜上使用微機(jī)五防鎖是否<b class='flag-5'>可以</b>實(shí)現(xiàn)<b class='flag-5'>一鍵</b>順控

    FPGA加速深度學(xué)習(xí)模型的案例

    FPGA(現(xiàn)場(chǎng)可編程門陣列)加速深度學(xué)習(xí)模型是當(dāng)前硬件加速領(lǐng)域的個(gè)熱門研究方向。以下是些FPGA加速
    的頭像 發(fā)表于 10-25 09:22 ?118次閱讀

    AI大模型深度學(xué)習(xí)的關(guān)系

    AI大模型深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進(jìn),相輔相成。以下是對(duì)兩者關(guān)系的介紹: 、深度
    的頭像 發(fā)表于 10-23 15:25 ?321次閱讀

    開(kāi)關(guān)柜可視化和一鍵順控可以結(jié)合起嗎?

    蜀瑞創(chuàng)新為大家科普:開(kāi)關(guān)柜可視化與一鍵順控系統(tǒng)的結(jié)合,可以進(jìn)步增強(qiáng)電力系統(tǒng)的智能化管理水平。這種結(jié)合主要體現(xiàn)在以下幾個(gè)方面:
    的頭像 發(fā)表于 10-14 09:38 ?124次閱讀
    開(kāi)關(guān)柜可視化和<b class='flag-5'>一鍵</b>順控<b class='flag-5'>可以</b>結(jié)合<b class='flag-5'>一</b>起嗎?

    一鍵斷電開(kāi)關(guān)的種類有哪些

    一鍵斷電開(kāi)關(guān)的種類主要可以從其功能和實(shí)現(xiàn)方式上進(jìn)行分類。以下是些常見(jiàn)的一鍵斷電開(kāi)關(guān)種類: 1. 繼電器式一鍵斷電開(kāi)關(guān) 定義 :這種開(kāi)關(guān)通過(guò)
    的頭像 發(fā)表于 09-13 16:45 ?649次閱讀

    一鍵斷電開(kāi)關(guān)的控制原理是什么

    一鍵斷電開(kāi)關(guān),也被稱為緊急斷電開(kāi)關(guān)或緊急停止開(kāi)關(guān),是種安全裝置,用于在緊急情況下迅速切斷電源,以防止事故的發(fā)生或擴(kuò)大。這種開(kāi)關(guān)的設(shè)計(jì)和應(yīng)用在工業(yè)、實(shí)驗(yàn)室、醫(yī)療設(shè)備以及任何需要快速斷電的場(chǎng)合都
    的頭像 發(fā)表于 09-13 16:28 ?690次閱讀

    OOTDiffusion整合包一鍵AI換裝, 免費(fèi)生成高端服裝模特照! 電商必備省錢工具!

    保姆級(jí)OOTDiffusion換裝教程,小白也能迅速上手 提供免費(fèi)學(xué)習(xí)工具,學(xué)習(xí)期內(nèi)無(wú)限制使用,24小時(shí)暢通服務(wù); 工具簡(jiǎn)單,三步玩轉(zhuǎn)AI換裝,視頻教程+1對(duì)1輔導(dǎo);
    的頭像 發(fā)表于 08-09 20:06 ?406次閱讀
    OOTDiffusion整合包<b class='flag-5'>一鍵</b>AI換裝, 免費(fèi)生成高端服裝模特照! 電商必備省錢<b class='flag-5'>工具</b>!

    變電站一鍵順控系統(tǒng)和開(kāi)關(guān)柜一鍵順控有區(qū)別嗎?

    變電站一鍵順控系統(tǒng)和開(kāi)關(guān)柜一鍵順控技術(shù)雖然都涉及到“一鍵順控”的概念,但它們?cè)趹?yīng)用范圍和具體實(shí)現(xiàn)上有所不同,因此變電站一鍵順控系統(tǒng)和開(kāi)關(guān)柜一鍵
    的頭像 發(fā)表于 07-31 13:34 ?411次閱讀
    變電站<b class='flag-5'>一鍵</b>順控系統(tǒng)和開(kāi)關(guān)柜<b class='flag-5'>一鍵</b>順控有區(qū)別嗎?

    深度學(xué)習(xí)中的模型權(quán)重

    深度學(xué)習(xí)充滿無(wú)限可能性的領(lǐng)域中,模型權(quán)重(Weights)作為其核心組成部分,扮演著至關(guān)重要的角色。它們不僅是模型
    的頭像 發(fā)表于 07-04 11:49 ?854次閱讀

    2021路虎攬勝運(yùn)動(dòng)版車遙控及一鍵起動(dòng)功能失效

    2021路虎攬勝運(yùn)動(dòng)版車遙控及一鍵起動(dòng)功能失效蔡永福故障現(xiàn)象故障診斷故障排除輛2021路虎攬勝運(yùn)動(dòng)版車,搭載AJ20-P6H3L發(fā)動(dòng)機(jī),累計(jì)行駛里程約為2.5萬(wàn)km。車主反映,使
    的頭像 發(fā)表于 07-04 08:09 ?365次閱讀
    2021<b class='flag-5'>款</b>路虎攬勝運(yùn)動(dòng)版車遙控及<b class='flag-5'>一鍵</b>起動(dòng)功能失效

    寶塔面板Docker一鍵安裝:部署GPTAcademic,開(kāi)發(fā)私有GPT學(xué)術(shù)優(yōu)化工具

    人工智能的浪潮中,GPT模型因其強(qiáng)大的自然語(yǔ)言處理能力備受矚目。然而,為了更好地應(yīng)用于學(xué)術(shù)領(lǐng)域,許多人希望能部署自己私有的GPT學(xué)術(shù)優(yōu)化工具。本文將詳細(xì)介紹如何通過(guò)寶塔面板和Docker一鍵安裝
    的頭像 發(fā)表于 07-02 11:58 ?2410次閱讀
    寶塔面板Docker<b class='flag-5'>一鍵</b>安裝:部署GPTAcademic,開(kāi)發(fā)私有GPT學(xué)術(shù)優(yōu)化<b class='flag-5'>工具</b>

    深度學(xué)習(xí)模型訓(xùn)練過(guò)程詳解

    深度學(xué)習(xí)模型訓(xùn)練是個(gè)復(fù)雜且關(guān)鍵的過(guò)程,它涉及大量的數(shù)據(jù)、計(jì)算資源和精心設(shè)計(jì)的算法。訓(xùn)練個(gè)深度
    的頭像 發(fā)表于 07-01 16:13 ?1035次閱讀

    一鍵閃測(cè)儀使用時(shí)的注意事項(xiàng)有哪些?

    中圖儀器VX系列一鍵閃測(cè)儀采用雙遠(yuǎn)心高分辨率光學(xué)鏡頭,結(jié)合高精度圖像分析算法,并融入一鍵閃測(cè)原理,可以對(duì)工件平面的點(diǎn)、線、圓等基本元素作精密測(cè)量,測(cè)量精度高,并且操作簡(jiǎn)單、性能優(yōu)良穩(wěn)定。
    的頭像 發(fā)表于 12-13 09:28 ?792次閱讀
    <b class='flag-5'>一鍵</b>閃測(cè)儀使用時(shí)的注意事項(xiàng)有哪些?

    一鍵動(dòng)態(tài)切換IP腳本

    T*o*r*Proxy一鍵搭建動(dòng)態(tài)代*理,通過(guò)利用T*o*r搭建Socks5代*理,最終實(shí)現(xiàn)動(dòng)態(tài)切換IP的效果。
    的頭像 發(fā)表于 12-08 10:25 ?1007次閱讀
    <b class='flag-5'>一鍵</b>動(dòng)態(tài)切換IP腳本

    Neuro-T:零代碼自動(dòng)深度學(xué)習(xí)訓(xùn)練平臺(tái)

    友思特 Neuro-T為傳統(tǒng)的深度學(xué)習(xí)視覺(jué)檢測(cè)方案提供了“自動(dòng)深度學(xué)習(xí)”的解決方案,結(jié)合自動(dòng)標(biāo)注功能,一鍵生成高性能視覺(jué)檢測(cè)
    的頭像 發(fā)表于 11-24 17:58 ?571次閱讀
    Neuro-T:零代碼自動(dòng)<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>訓(xùn)練平臺(tái)