久久精品亚洲AV无码乱码三区,久久亚洲精品23p,无码专区人妻系列专区

編者按：在這篇教程中，作者Adrian Rosebrock將教你如何用OpenCV、Python和深度學(xué)習(xí)技術(shù)對圖像和實時視頻進行神經(jīng)風(fēng)格遷移。

2015年，Gatsys等人在論文A Neural Algorithm of Artistic Style中提出了最初的神經(jīng)風(fēng)格遷移算法。2016年，Johnson等人發(fā)表了Perceptual Losses for Real-Time Style Transfer and Super-Resolutioin一文，將神經(jīng)網(wǎng)絡(luò)遷移作為用感知損失處理超分辨率問題的框架。結(jié)果表明該算法比Gatys等人的方法快了三倍。接下來，我將介紹如何在自己的圖像和視頻流中應(yīng)用神經(jīng)風(fēng)格遷移。

用OpenCV進行神經(jīng)風(fēng)格遷移

首先說明的一點是，今天討論的方法在一個CPU上可以達到近乎實時的效果，如果在GPU上則完全可以實現(xiàn)實時效果。

首先我們會簡單塔倫下什么是神經(jīng)風(fēng)格遷移，以及它是如何運作的。之后我們會用OpenCV和Python動手操作。

什么是神經(jīng)風(fēng)格遷移？

從左至右：我們的內(nèi)容圖像；風(fēng)格圖像；輸出的風(fēng)格遷移圖像

神經(jīng)風(fēng)格遷移主要有兩個過程：

提取某張圖片的風(fēng)格

將該種風(fēng)格應(yīng)用到另一張圖片上

上圖就是將梵高著名的畫作《星夜》的風(fēng)格應(yīng)用到普通的生活照上，我們保留了原照片中的山、人物和啤酒等所有內(nèi)容，但全部替換成了梵高的油畫風(fēng)格。

問題就是，我們應(yīng)該如何定義一個神經(jīng)網(wǎng)絡(luò)，讓它執(zhí)行神經(jīng)風(fēng)格遷移呢？

神經(jīng)風(fēng)格遷移如何工作？

在Gatys等人提出的首篇論文中，神經(jīng)風(fēng)格遷移算法不需要新的架構(gòu)。相反，我們可以用一個預(yù)訓(xùn)練網(wǎng)絡(luò)（通常在ImageNet上進行的預(yù)訓(xùn)練），并且定義一個損失函數(shù)，能讓我們達到風(fēng)格遷移的目標，然后對損失函數(shù)不斷優(yōu)化。

那么，這里的問題就不是“該用什么神經(jīng)網(wǎng)絡(luò)”了，而是“該用什么損失函數(shù)”。

答案包括：內(nèi)容損失、風(fēng)格損失和總變差損失。每個部分都是單獨計算，然后在一個元損失函數(shù)中結(jié)合。通過將元損失函數(shù)最小化，我們將依次對內(nèi)容、風(fēng)格和總變差損失進行優(yōu)化。

雖然Gatys等人的方法能生成不錯的神經(jīng)風(fēng)格遷移結(jié)果，但是它的速度非常慢。2016年，Johnson等人在Gatys的基礎(chǔ)上提出的全新算法速度快了三倍，但同時也存在著缺點，即用戶不能隨機選擇想要應(yīng)用的風(fēng)格圖像。用戶首先要訓(xùn)練一個網(wǎng)絡(luò)，生成你想要的風(fēng)格。網(wǎng)絡(luò)訓(xùn)練好后，你可以將它應(yīng)用到任意內(nèi)容圖像上。

然而到了2017年，Ulyanov等人發(fā)表了Instance Normalization: The Missing Ingredient for Fast Stylization一文，他們表示將batch normalization替換成instance normalization（然后在訓(xùn)練和測試時都應(yīng)用instance normalization），可以達到更快的效果，并且藝術(shù)效果也更好。

項目結(jié)構(gòu)

在開始今天的教程前，請先下載我提供的資料（點擊文末原文地址獲取資料）。準備好了腳本、模型和圖像后，你可以用tree指令檢查項目的結(jié)構(gòu)：

如果你從下載了.zip文件，就無需上網(wǎng)找其他素材了。我在其中提供了很多測試用的圖像和模型。同時還有三種Python腳本。

開始神經(jīng)風(fēng)格遷移

接下來讓我們用OpenCV和Python進行神經(jīng)風(fēng)格遷移的實踐。

首先打開neural_style_transfer.py文件，插入如下代碼：

首先，我們導(dǎo)入所需的包并解析命令行參數(shù)。

導(dǎo)入的有：

imutils：這個包可以通過pip install --upgrade imutils安裝。最近我發(fā)布了imutils==0.5.1，所以不要忘記更新！

OpenCV：你需要一個OpenCV 3.4或者更高版本。

該腳本下需要兩個命令行：

--model：神經(jīng)風(fēng)格遷移的模型路徑。在“下載”區(qū)中，我加入了11中經(jīng)過與訓(xùn)練的模型。

--image：需要進行風(fēng)格遷移的圖像（輸入圖像）。在其中我放入了四張圖片。

你不需要改變命令行代碼，參數(shù)會在運行過程中進行處理。如果你不熟悉這一過程，可以閱讀我另一篇文章：www.pyimagesearch.com/2018/03/12/python-argparse-command-line-arguments/

接下來的部分比較有趣，我們要下載圖像和模型，然后計算神經(jīng)風(fēng)格遷移：

在這部分代碼中，我們進行了：

將下載的預(yù)訓(xùn)練神經(jīng)風(fēng)格遷移模型稱為net（第17行）；

下載輸入圖像并調(diào)整尺寸（21和22行）；

用均值減法創(chuàng)建blob（27和28行）；

執(zhí)行forward，獲取output圖像（31行）。

接下來，重要的是對輸出圖像進行后處理：

最后一步是將輸出圖像顯示在屏幕上：

神經(jīng)風(fēng)格遷移結(jié)果

當你下載好文件后，打開終端執(zhí)行以下命令：

現(xiàn)在，對命令行參數(shù)做簡單改變，然后用《侏羅紀公園》中的截圖作為內(nèi)容圖像，進行風(fēng)格遷移：

另一個例子：

這是我最喜歡的案例，感覺都能當做酒吧的裝飾畫了。

實時神經(jīng)風(fēng)格遷移

上面我們講了如何在單一圖像上應(yīng)用風(fēng)格遷移，現(xiàn)在我們要把這一過程放在視頻上。

大致流程和圖像處理差不多，在這一腳本中，我們將：

利用一個特殊的Python迭代器，它可以讓我們在模型路徑中循環(huán)使用所有可用的神經(jīng)風(fēng)格遷移模型。

啟動網(wǎng)絡(luò)攝像頭視頻流，我們會（近乎）實時處理攝像頭的幀。對于某些較大的模型，系統(tǒng)可能會慢一些。

在每一幀上應(yīng)用風(fēng)格遷移，對輸出進行后處理，并將結(jié)果顯示在屏幕上。

如果用戶按下“n”鍵，我們將把迭代器循環(huán)運用到下一個神經(jīng)風(fēng)格遷移模型上，不用重啟腳本。

首先，打開neural_style_transfer_video.py文件，插入以下代碼：

之后，創(chuàng)建模型路徑迭代器：

一旦我們開始在while循環(huán)中處理幀，“n”按鍵就會在迭代器中下載“下一個”模型。

為了創(chuàng)建模型迭代器，我們：

搜集所有神經(jīng)風(fēng)格遷移模型并分類（18和19行）

為每種模型分配ID（23行）

利用itertools和cycle創(chuàng)建迭代器（27行）。

讓我們開始下載第一個模型并對視頻進行處理：

在32行，我們讀取了第一個模型利用的路徑。在36和37行，啟動了視頻，從攝像頭中采集幀。

之后在幀與幀之間進行循環(huán)：

接著進行后處理并將輸出圖像展示出來：

對按鍵的處理：

兩種不同的按鍵會對腳本運行產(chǎn)生不同的影響：

“n”：抓取下一個模型的路徑和ID，并進行下載。如果我們已經(jīng)獲取上一個模型，迭代器就會從頭開始循環(huán)。

“q”：按下q會退出while循環(huán)。

實時風(fēng)格遷移的結(jié)果

執(zhí)行以下命令就可以在視頻上運用風(fēng)格遷移啦：

可以看到，只需要按一個按鍵就能輕松地進行循環(huán)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

cpu

cpu

+關(guān)注

關(guān)注
68

文章
10702

瀏覽量
209366
圖像

圖像

+關(guān)注

關(guān)注
2

文章
1075

瀏覽量
40269
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5422

瀏覽量
120592

原文標題：無需GPU，只用OpenCV和Python實現(xiàn)圖像和視頻的風(fēng)格遷移

文章出處：【微信號：jqr_AI，微信公眾號：論智】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

opencv-python和opencv一樣嗎

不一樣。OpenCV（Open Source Computer Vision Library）是一個開源的計算機視覺和機器學(xué)習(xí)軟件庫，它提供了大量的圖像和視頻處理功能。

發(fā)表于 07-16 10:38 ?438次閱讀

基于Python的深度學(xué)習(xí)人臉識別方法

基于Python的深度學(xué)習(xí)人臉識別方法是一個涉及多個技術(shù)領(lǐng)域的復(fù)雜話題，包括計算機視覺、深度學(xué)習(xí)

發(fā)表于 07-14 11:52 ?941次閱讀

卷積神經(jīng)網(wǎng)絡(luò)有何用途卷積神經(jīng)網(wǎng)絡(luò)通常運用在哪里

卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Networks，簡稱CNN）是一種深度學(xué)習(xí)模型，廣泛應(yīng)用于圖像識別、視頻分析、自然

發(fā)表于 07-11 14:43 ?762次閱讀

神經(jīng)網(wǎng)絡(luò)的基本原理及Python編程實現(xiàn)

神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)算法的基本構(gòu)建模塊，模擬了人腦的行為，通過互相連接的節(jié)點（也稱為“神經(jīng)元”）實現(xiàn)對輸入數(shù)據(jù)的處理、模式識別和結(jié)果預(yù)測等功能。本文將深入探討

發(fā)表于 07-03 16:11 ?220次閱讀

深度學(xué)習(xí)常用的Python庫

深度學(xué)習(xí)作為人工智能的一個重要分支，通過模擬人類大腦中的神經(jīng)網(wǎng)絡(luò)來解決復(fù)雜問題。Python作為一種流行的編程語言，憑借其簡潔的語法和豐富的庫支持，成為了

發(fā)表于 07-03 16:04 ?390次閱讀

深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

隨著人工智能技術(shù)的飛速發(fā)展，深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network, CNN）作為其中的重要分支，已經(jīng)在多個領(lǐng)域取得了顯著的應(yīng)用成果。從

發(fā)表于 07-02 18:19 ?559次閱讀

深度神經(jīng)網(wǎng)絡(luò)模型cnn的基本概念、結(jié)構(gòu)及原理

深度神經(jīng)網(wǎng)絡(luò)模型CNN（Convolutional Neural Network）是一種廣泛應(yīng)用于圖像識別、視頻分析和自然語言處理等領(lǐng)域的深度

發(fā)表于 07-02 10:11 ?8784次閱讀

如何使用Python進行神經(jīng)網(wǎng)絡(luò)編程

神經(jīng)網(wǎng)絡(luò)簡介 神經(jīng)網(wǎng)絡(luò)是一種受人腦啟發(fā)的機器學(xué)習(xí)模型，由大量的節(jié)點（或稱為“神經(jīng)元”）組成，這些節(jié)點在網(wǎng)絡(luò)中相互連接。每個節(jié)點可以接收輸入，對輸入進

發(fā)表于 07-02 09:58 ?271次閱讀

如何使用Python進行圖像識別的自動學(xué)習(xí)自動訓(xùn)練？

如何使用Python進行圖像識別的自動學(xué)習(xí)自動訓(xùn)練？使用Python進行

發(fā)表于 01-12 16:06 ?446次閱讀

詳解深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

在如今的網(wǎng)絡(luò)時代，錯綜復(fù)雜的大數(shù)據(jù)和網(wǎng)絡(luò)環(huán)境，讓傳統(tǒng)信息處理理論、人工智能與人工神經(jīng)網(wǎng)絡(luò)都面臨巨大的挑戰(zhàn)。近些年，深度學(xué)習(xí)逐漸走進人們的視線，通過深度

發(fā)表于 01-11 10:51 ?1604次閱讀

使用圖像處理庫OpenCV從攝像頭獲取數(shù)據(jù)并在PyQt5上顯示出來

OpenCV能夠處理圖像、視頻、深度圖像等各種類型的視覺數(shù)據(jù)

發(fā)表于 01-05 17:32 ?1783次閱讀

使用Python卷積神經(jīng)網(wǎng)絡(luò)(CNN)進行圖像識別的基本步驟

Python 卷積神經(jīng)網(wǎng)絡(luò)（CNN）在圖像識別領(lǐng)域具有廣泛的應(yīng)用。通過使用卷積神經(jīng)網(wǎng)絡(luò)，我們可以讓計算機從圖像中

發(fā)表于 11-20 11:20 ?4134次閱讀

基于OpenCV的DNN圖像風(fēng)格遷移

/deep-photo-styletransfer 項目，需要安裝 CUDA、pytorch、cudnn等等，配置能花一天的時間。不過最近我發(fā)現(xiàn)一個非常好的開源應(yīng)用項目，那就是基于OpenCV的DNN圖像風(fēng)格

發(fā)表于 10-30 10:03 ?423次閱讀

神經(jīng)渲染：圖形學(xué)與深度學(xué)習(xí)的完美結(jié)合

神經(jīng)渲染是一種利用深度學(xué)習(xí)和圖形學(xué)技術(shù)，實現(xiàn)高質(zhì)量、高效率、高靈活性的圖像合成和渲染的方法。神經(jīng)

發(fā)表于 09-23 08:30 ?902次閱讀

視覺深度學(xué)習(xí)遷移學(xué)習(xí)訓(xùn)練框架Torchvision介紹

Torchvision是基于Pytorch的視覺深度學(xué)習(xí)遷移學(xué)習(xí)訓(xùn)練框架，當前支持的圖像分類、對象檢測、實例分割、語義分割、姿態(tài)評估模型的

發(fā)表于 09-22 09:49 ?748次閱讀