在這篇文章中,將教大家實(shí)現(xiàn)一個(gè)網(wǎng)頁(yè)應(yīng)用程序,該程序可以接收狗的圖片,然后輸出其品種,其準(zhǔn)確率超過(guò)80%!
我們將使用深度學(xué)習(xí)來(lái)訓(xùn)練一個(gè)識(shí)別狗品種的模型,數(shù)據(jù)集是狗圖像與他們的品種信息,通過(guò)學(xué)習(xí)圖像的特征來(lái)區(qū)分狗的品種。數(shù)據(jù)分析數(shù)據(jù)集可以從這里下載(https://s3-us-west-1.a(chǎn)mazonaws.com/udacity-aind/dog-project/dogImages.zip)。以下是關(guān)于數(shù)據(jù)的一些介紹:犬種總數(shù):133狗圖片總數(shù):8351(訓(xùn)練集:6680,驗(yàn)證集:835,測(cè)試集:836)最受歡迎的品種:阿拉斯加對(duì)應(yīng)96個(gè)樣本,博德牧羊犬對(duì)應(yīng)93個(gè)樣本按圖片數(shù)量排序的前30個(gè)品種如下:
我們還可以在這里看到一些狗的圖片和它們的品種:
數(shù)據(jù)預(yù)處理我們會(huì)把每個(gè)圖像作為一個(gè)numpy數(shù)組進(jìn)行加載,并將它們的大小調(diào)整為224x224,這是大多數(shù)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)接受圖像的默認(rèn)大小,另外我們?yōu)閳D像的數(shù)量添加為另一個(gè)維度。from keras.preprocessing import image from tqdm import tqdm
def path_to_tensor(img_path): '''將給定路徑下的圖像轉(zhuǎn)換為張量''' img = image.load_img(img_path, target_size=(224, 224)) x = image.img_to_array(img) return np.expand_dims(x, axis=0)
def paths_to_tensor(img_paths): '''將給定路徑中的所有圖像轉(zhuǎn)換為張量''' list_of_tensors = [path_to_tensor(img_path) for img_path in tqdm(img_paths)] return np.vstack(list_of_tensors)最后,我們使用ImageDataGenerator對(duì)圖像進(jìn)行動(dòng)態(tài)縮放和增強(qiáng)train_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255, horizontal_flip=True, vertical_flip=True, rotation_range=20)
valid_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255.)
test_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255.)
train_generator = train_datagen.flow(train_tensors, train_targets, batch_size=32)valid_generator = train_datagen.flow(valid_tensors, valid_targets, batch_size=32)test_generator = train_datagen.flow(test_tensors, test_targets, batch_size=32)CNN我們將在預(yù)處理數(shù)據(jù)集上從頭開(kāi)始訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN),如下所示:model = tf.keras.models.Sequential([ tf.keras.layers.Conv2D(16, (3,3), activation='relu', input_shape=(224, 224, 3)), tf.keras.layers.MaxPooling2D(2, 2), tf.keras.layers.Conv2D(32, (3,3), activation='relu'), tf.keras.layers.MaxPooling2D(2,2), tf.keras.layers.Conv2D(64, (3,3), activation='relu'), tf.keras.layers.MaxPooling2D(2,2), tf.keras.layers.Conv2D(128, (3,3), activation='relu'), tf.keras.layers.MaxPooling2D(2,2), tf.keras.layers.Conv2D(256, (3,3), activation='relu'), tf.keras.layers.MaxPooling2D(2,2), tf.keras.layers.Flatten(), tf.keras.layers.Dense(2048, activation='softmax'), tf.keras.layers.Dropout(0.5), tf.keras.layers.Dense(1024, activation='softmax'), tf.keras.layers.Dropout(0.5), tf.keras.layers.Dense(133, activation='softmax')])
model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])
checkpointer = tf.keras.callbacks.ModelCheckpoint(filepath='../saved_models/weights_best_custom.hdf5', verbose=1, save_best_only=True)
model.fit(train_generator, epochs=5, validation_data=valid_generator, callbacks=[checkpointer])我們使用一個(gè)ModelCheckpoint的回調(diào)來(lái)保存驗(yàn)證分?jǐn)?shù)較高的模型。通過(guò)測(cè)試模型,我們得到的準(zhǔn)確率只有1%左右使用遷移學(xué)習(xí)現(xiàn)在,我們使用遷移學(xué)習(xí)來(lái)實(shí)現(xiàn)更高的準(zhǔn)確率。首先我們下載ResNet-50,可以通過(guò)運(yùn)行下面的代碼來(lái)提取相應(yīng)的訓(xùn)練集、測(cè)試和驗(yàn)證集:bottleneck_features = np.load('Data/bottleneck_features/DogResnet50Data.npz')train_Resnet50 = bottleneck_features['train']valid_Resnet50 = bottleneck_features['valid']test_Resnet50 = bottleneck_features['test']我們現(xiàn)在再次定義模型,并對(duì)提取的特征使用GlobalAveragePooling2D,它將一組特征平均為一個(gè)值。最后,如果驗(yàn)證損失在兩個(gè)連續(xù)的epoch內(nèi)沒(méi)有增加,我們使用額外的回調(diào)來(lái)降低學(xué)習(xí)率;如果驗(yàn)證損失在連續(xù)的5個(gè)epoch內(nèi)沒(méi)有增加,可以提前停止訓(xùn)練。Resnet50_model = tf.keras.models.Sequential()Resnet50_model.a(chǎn)dd(tf.keras.layers.GlobalAveragePooling2D(input_shape=train_Resnet50.shape[1:]))Resnet50_model.a(chǎn)dd(tf.keras.layers.Dense(1024, activation='relu'))Resnet50_model.a(chǎn)dd(tf.keras.layers.Dense(133, activation='softmax'))
Resnet50_model.compile(loss='categorical_crossentropy', optimizer='rmsprop', metrics=['accuracy'])
checkpointer = tf.keras.callbacks.ModelCheckpoint(filepath='saved_models/weights_best_Resnet50.hdf5', verbose=1, save_best_only=True)early_stopping = tf.keras.callbacks.EarlyStopping(patience=5, monitor='val_loss')
reduce_lr = tf.keras.callbacks.ReduceLROnPlateau(patience=2, monitor='val_loss')Resnet50_model.fit(train_Resnet50, train_targets, validation_data=(valid_Resnet50, valid_targets), epochs=50, batch_size=20, callbacks=[checkpointer, early_stopping, reduce_lr], verbose=1)### 訓(xùn)練模型最后在測(cè)試集上的準(zhǔn)確率為82.65%,這與我們白手起家訓(xùn)練的模型相比,是一個(gè)巨大的進(jìn)步。構(gòu)建web應(yīng)用程序?qū)τ趙eb應(yīng)用程序,我們首先編寫(xiě)了一個(gè)helper函數(shù),該函數(shù)接受圖像路徑并返回品種。label_to_cat字典將每個(gè)數(shù)字標(biāo)簽映射到它的狗品種。def predict_breed(img_path): '''預(yù)測(cè)給定圖像的品種''' # 提取特征 bottleneck_feature = extract_Resnet50(path_to_tensor(img_path)) bottleneck_feature = tf.keras.models.Sequential([ tf.keras.layers.GlobalAveragePooling2D(input_shape=bottleneck_feature.shape[1:]) ]).predict(bottleneck_feature).reshape(1, 1, 1, 2048) # 獲得預(yù)測(cè)向量 predicted_vector = Resnet50_model.predict(bottleneck_feature) # 模型預(yù)測(cè)的犬種 return label_to_cat[np.a(chǎn)rgmax(predicted_vector)]對(duì)于web應(yīng)用程序,我們將使用flaskweb框架來(lái)幫助我們用最少的代碼創(chuàng)建web應(yīng)用程序。我們定義一個(gè)接受圖像的路由,并用狗的品種呈現(xiàn)一個(gè)輸出模板@app.route('/upload', methods=['POST','GET'])def upload_file(): if request.method == 'GET': return render_template('index.html') else: file = request.files['image'] full_name = os.path.join(UPLOAD_FOLDER, file.filename) file.save(full_name) dog_breed = dog_breed_classifier(full_name) return render_template('predict.html', image_file_name = file.filename, label = dog_breed)predict.html是分別顯示圖像及其犬種的模板。
結(jié)論
祝賀你!你已經(jīng)成功地實(shí)現(xiàn)了一個(gè)狗品種分類(lèi)器,并且可以準(zhǔn)確地分辨出狗的品種。讓我們總結(jié)一下我們?cè)谶@里學(xué)到的知識(shí):我們對(duì)數(shù)據(jù)集進(jìn)行了分析和預(yù)處理。機(jī)器學(xué)習(xí)算法需要單獨(dú)的訓(xùn)練集、測(cè)試集和驗(yàn)證集來(lái)進(jìn)行置信預(yù)測(cè)。我們從零開(kāi)始使用CNN,由于未能提取特征,所以表現(xiàn)不佳。然后我們使用了遷移學(xué)習(xí),準(zhǔn)確度大大提高最后,我們構(gòu)建了一個(gè)Flask web應(yīng)用程序來(lái)實(shí)現(xiàn)我們的項(xiàng)目封裝我們確實(shí)學(xué)到了很多東西,但你還可以嘗試很多其他的事情。你可以在heroku上部署web應(yīng)用程序,也可以嘗試使用不同的層(如Dropout層)來(lái)提高準(zhǔn)確性。
參考鏈接:https://towardsdatascience.com/dont-know-the-breed-of-your-dog-ml-can-h(huán)elp-6558eb5f7f05
責(zé)編AJX
-
算法
+關(guān)注
關(guān)注
23文章
4551瀏覽量
92012 -
應(yīng)用程序
+關(guān)注
關(guān)注
37文章
3198瀏覽量
57356 -
python
+關(guān)注
關(guān)注
53文章
4752瀏覽量
84065
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論