0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在PyTorch中實現(xiàn)LeNet-5網(wǎng)絡(luò)

CHANBAEK ? 來源:網(wǎng)絡(luò)整理 ? 2024-07-11 10:58 ? 次閱讀

在PyTorch中實現(xiàn)LeNet-5網(wǎng)絡(luò)是一個涉及深度學(xué)習(xí)基礎(chǔ)知識、PyTorch框架使用以及網(wǎng)絡(luò)架構(gòu)設(shè)計的綜合性任務(wù)。LeNet-5是卷積神經(jīng)網(wǎng)絡(luò)(CNN)的早期代表之一,由Yann LeCun等人提出,主要用于手寫數(shù)字識別任務(wù)(如MNIST數(shù)據(jù)集)。下面,我將詳細(xì)闡述如何在PyTorch中從頭開始實現(xiàn)LeNet-5網(wǎng)絡(luò),包括網(wǎng)絡(luò)架構(gòu)設(shè)計、參數(shù)初始化、前向傳播、損失函數(shù)選擇、優(yōu)化器配置以及訓(xùn)練流程等方面。

一、引言

LeNet-5網(wǎng)絡(luò)以其簡潔而有效的結(jié)構(gòu),在深度學(xué)習(xí)發(fā)展史上占有重要地位。它主要由卷積層、池化層、全連接層等構(gòu)成,通過堆疊這些層來提取圖像中的特征,并最終進行分類。在PyTorch中實現(xiàn)LeNet-5,不僅可以幫助我們理解CNN的基本原理,還能為更復(fù)雜網(wǎng)絡(luò)的設(shè)計和實現(xiàn)打下基礎(chǔ)。

二、PyTorch環(huán)境準(zhǔn)備

在開始編寫代碼之前,請確保已安裝PyTorch及其依賴庫。可以通過PyTorch官網(wǎng)提供的安裝指令進行安裝。此外,還需要安裝NumPy、Matplotlib等庫,用于數(shù)據(jù)處理和結(jié)果可視化。

三、LeNet-5網(wǎng)絡(luò)架構(gòu)設(shè)計

LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)通常包括兩個卷積層、兩個池化層、兩個全連接層以及一個輸出層。下面是在PyTorch中定義LeNet-5結(jié)構(gòu)的代碼示例:

import torch  
import torch.nn as nn  
import torch.nn.functional as F  
  
class LeNet5(nn.Module):  
    def __init__(self, num_classes=10):  
        super(LeNet5, self).__init__()  
        self.conv1 = nn.Conv2d(1, 6, kernel_size=5, stride=1, padding=2)  
        self.relu1 = nn.ReLU(inplace=True)  
        self.pool1 = nn.MaxPool2d(kernel_size=2, stride=2)  
          
        self.conv2 = nn.Conv2d(6, 16, kernel_size=5, stride=1)  
        self.relu2 = nn.ReLU(inplace=True)  
        self.pool2 = nn.MaxPool2d(kernel_size=2, stride=2)  
          
        self.fc1 = nn.Linear(16 * 5 * 5, 120)  # 假設(shè)輸入圖像大小為32x32  
        self.relu3 = nn.ReLU(inplace=True)  
        self.fc2 = nn.Linear(120, 84)  
        self.relu4 = nn.ReLU(inplace=True)  
        self.fc3 = nn.Linear(84, num_classes)  
  
    def forward(self, x):  
        x = self.pool1(self.relu1(self.conv1(x)))  
        x = self.pool2(self.relu2(self.conv2(x)))  
        x = x.view(-1, 16 * 5 * 5)  # 展平  
        x = self.relu3(self.fc1(x))  
        x = self.relu4(self.fc2(x))  
        x = self.fc3(x)  
        return x

四、參數(shù)初始化

在PyTorch中,模型參數(shù)(如權(quán)重和偏置)的初始化對模型的性能有很大影響。LeNet-5的權(quán)重通常使用隨機初始化方法,如正態(tài)分布或均勻分布。PyTorch的nn.Module在初始化時會自動調(diào)用reset_parameters()方法(如果定義了的話),用于初始化所有可學(xué)習(xí)的參數(shù)。但在上面的LeNet5類中,我們沒有重寫reset_parameters()方法,因為nn.Conv2dnn.Linear已經(jīng)提供了合理的默認(rèn)初始化策略。

五、前向傳播

forward方法中,我們定義了數(shù)據(jù)通過網(wǎng)絡(luò)的前向傳播路徑。輸入數(shù)據(jù)x首先經(jīng)過兩個卷積層和兩個池化層,提取圖像特征,然后將特征圖展平為一維向量,最后通過兩個全連接層進行分類。

六、損失函數(shù)與優(yōu)化器

在訓(xùn)練過程中,我們需要定義損失函數(shù)和優(yōu)化器。對于分類任務(wù),常用的損失函數(shù)是交叉熵?fù)p失(CrossEntropyLoss)。優(yōu)化器則用于更新模型的參數(shù),以最小化損失函數(shù)。常用的優(yōu)化器包括SGD、Adam等。

criterion = nn.CrossEntropyLoss()  
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

七、訓(xùn)練流程

訓(xùn)練流程通常包括以下幾個步驟:

  1. 數(shù)據(jù)加載 :使用PyTorch的`DataLoader來加載和預(yù)處理訓(xùn)練集和驗證集(或測試集)。
  2. 模型實例化 :創(chuàng)建LeNet-5模型的實例。
  3. 訓(xùn)練循環(huán) :在訓(xùn)練集中迭代,對每個批次的數(shù)據(jù)執(zhí)行前向傳播、計算損失、執(zhí)行反向傳播并更新模型參數(shù)。
  4. 驗證/測試 :在每個epoch結(jié)束時,使用驗證集(或測試集)評估模型的性能,以便監(jiān)控訓(xùn)練過程中的過擬合情況或評估最終模型的性能。
  5. 保存模型 :在訓(xùn)練完成后,保存模型以便將來使用。

下面是訓(xùn)練流程的代碼示例:

# 假設(shè)已有DataLoader實例 train_loader, val_loader  
  
# 實例化模型  
model = LeNet5(num_classes=10)  # 假設(shè)是10分類問題  
  
# 損失函數(shù)和優(yōu)化器  
criterion = nn.CrossEntropyLoss()  
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)  
  
# 訓(xùn)練模型  
num_epochs = 10  
for epoch in range(num_epochs):  
    model.train()  # 設(shè)置模型為訓(xùn)練模式  
    total_loss = 0  
    for images, labels in train_loader:  
        # 將數(shù)據(jù)轉(zhuǎn)移到GPU(如果可用)  
        images, labels = images.to(device), labels.to(device)  
          
        # 前向傳播  
        outputs = model(images)  
        loss = criterion(outputs, labels)  
          
        # 反向傳播和優(yōu)化  
        optimizer.zero_grad()  # 清除之前的梯度  
        loss.backward()        # 反向傳播計算梯度  
        optimizer.step()       # 更新權(quán)重  
          
        # 累加損失  
        total_loss += loss.item()  
      
    # 在驗證集上評估模型  
    model.eval()  # 設(shè)置模型為評估模式  
    val_loss = 0  
    correct = 0  
    with torch.no_grad():  # 評估時不計算梯度  
        for images, labels in val_loader:  
            images, labels = images.to(device), labels.to(device)  
            outputs = model(images)  
            _, predicted = torch.max(outputs.data, 1)  
            val_loss += criterion(outputs, labels).item()  
            correct += (predicted == labels).sum().item()  
      
    # 打印訓(xùn)練和驗證結(jié)果  
    print(f'Epoch {epoch+1}, Train Loss: {total_loss/len(train_loader)}, Val Loss: {val_loss/len(val_loader)}, Val Accuracy: {correct/len(val_loader.dataset)*100:.2f}%')  
  
# 保存模型  
torch.save(model.state_dict(), 'lenet5_model.pth')

八、模型評估與測試

在訓(xùn)練完成后,我們通常會在一個獨立的測試集上評估模型的性能,以確保模型在未見過的數(shù)據(jù)上也能表現(xiàn)良好。評估過程與驗證過程類似,但通常不會用于調(diào)整模型參數(shù)。

九、模型部署

訓(xùn)練好的模型可以部署到各種環(huán)境中,如邊緣設(shè)備、服務(wù)器或云端。部署時,需要確保模型與目標(biāo)平臺的兼容性,并進行適當(dāng)?shù)膬?yōu)化以提高性能。

十、結(jié)論

在PyTorch中實現(xiàn)LeNet-5網(wǎng)絡(luò)是一個理解卷積神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)和訓(xùn)練流程的好方法。通過實踐,我們可以掌握PyTorch框架的使用方法,了解如何設(shè)計網(wǎng)絡(luò)架構(gòu)、選擇損失函數(shù)和優(yōu)化器、編寫訓(xùn)練循環(huán)等關(guān)鍵步驟。此外,通過調(diào)整網(wǎng)絡(luò)參數(shù)、優(yōu)化訓(xùn)練過程和使用不同的數(shù)據(jù)集,我們可以進一步提高模型的性能,并探索深度學(xué)習(xí)在更多領(lǐng)域的應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7387

    瀏覽量

    88208
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5422

    瀏覽量

    120587
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    794

    瀏覽量

    13009
收藏 人收藏

    評論

    相關(guān)推薦

    FPGA實現(xiàn)LeNet-5卷積神經(jīng)網(wǎng)絡(luò)

    ,利用 FPGA 實現(xiàn)神經(jīng)網(wǎng)絡(luò)成為了一種高效、低功耗的解決方案,特別適合于邊緣計算和嵌入式系統(tǒng)。本文將詳細(xì)介紹如何使用 FPGA 實現(xiàn) LeNet-5
    的頭像 發(fā)表于 07-11 10:27 ?1649次閱讀

    一文讀懂物體分類AI算法:LeNet-5 AlexNet VGG Inception ResNet MobileNet

    等很簡單的應(yīng)用場景,故一直沒有火起來。但作為CNN應(yīng)用的開山鼻祖,學(xué)習(xí)CNN勢必先從學(xué)習(xí)LetNet-5開始。LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)如下圖LeNet-5輸入為32x32的二維像素矩陣,
    發(fā)表于 06-07 17:26

    【NanoPi K1 Plus試用體驗】深度學(xué)習(xí)---實現(xiàn)Lenet

    了resnet,殘差網(wǎng)絡(luò),實現(xiàn)了150層的網(wǎng)絡(luò)結(jié)構(gòu)可訓(xùn)練化,這些我們之后會慢慢講到。下面實現(xiàn)一下最簡單的Lenet,使用mnist手寫子體作
    發(fā)表于 07-23 16:05

    與V.35網(wǎng)絡(luò)的接口

    DN94- 與V.35網(wǎng)絡(luò)的接口
    發(fā)表于 08-08 11:07

    實現(xiàn)用于專業(yè)視頻的JPEG 2000網(wǎng)絡(luò),看完你就懂了

    實現(xiàn)用于專業(yè)視頻的JPEG 2000網(wǎng)絡(luò),看完你就懂了
    發(fā)表于 05-21 06:04

    如何利用低成本CAT5網(wǎng)絡(luò)電纜傳輸視頻信號?

    如何利用低成本CAT5網(wǎng)絡(luò)電纜傳輸視頻信號?
    發(fā)表于 05-26 06:50

    IPv4網(wǎng)絡(luò)和IPv6網(wǎng)絡(luò)互連技術(shù)對比分析哪個好?

    NAT-PT實現(xiàn)互連原理是什么?NAT-PT的工作機制是怎樣的?IPv4網(wǎng)絡(luò)和IPv6網(wǎng)絡(luò)互連技術(shù)對比分析哪個好?
    發(fā)表于 05-26 07:07

    何在音視頻范例網(wǎng)絡(luò)多媒體系統(tǒng)應(yīng)用DS80C400網(wǎng)絡(luò)型微控制器?

    本文對如何在音視頻范例網(wǎng)絡(luò)多媒體系統(tǒng)應(yīng)用DS80C400網(wǎng)絡(luò)型微控制器進行分析與討論。
    發(fā)表于 06-02 06:24

    STM32網(wǎng)絡(luò)的三大件

    之前的推文已經(jīng)將STM32網(wǎng)絡(luò)的三大件講完了①PHY接口,《STM32網(wǎng)絡(luò)電路設(shè)計》②MAC控制器,《STM32網(wǎng)絡(luò)之MAC控制器》③DMA控制器,《STM32網(wǎng)絡(luò)之DMA控制器》本文
    發(fā)表于 08-02 09:54

    STM32網(wǎng)絡(luò)控制器的SMI接口

    在上篇文章《STM32網(wǎng)絡(luò)之SMI接口》,我們介紹了STM32網(wǎng)絡(luò)控制器的SMI接口,SMI接口主要是用于和外部PHY芯片通信,配置PHY寄存器用的。真正網(wǎng)絡(luò)通信的數(shù)據(jù)流并不是通過S
    發(fā)表于 08-05 07:01

    何在PyTorch上學(xué)習(xí)和創(chuàng)建網(wǎng)絡(luò)模型呢?

    之一。在本文中,我們將在 PyTorch 上學(xué)習(xí)和創(chuàng)建網(wǎng)絡(luò)模型。PyTorch安裝參考官網(wǎng)步驟。我使用的 Ubuntu 16.04 LTS 上安裝的 Python 3.5 不支持最新的
    發(fā)表于 02-21 15:22

    IPv6網(wǎng)絡(luò)基于域名的通用用戶標(biāo)識系統(tǒng)

    現(xiàn)有的互聯(lián)網(wǎng)用戶標(biāo)識系統(tǒng)普遍存在缺乏認(rèn)證機制、難以獲取和解析以及作用范圍受限等問題。該文提出一種在IPv6網(wǎng)絡(luò)基于域名的通用用戶標(biāo)識系統(tǒng),在CERNET2網(wǎng)絡(luò)
    發(fā)表于 04-21 09:47 ?11次下載

    R4網(wǎng)絡(luò)的關(guān)鍵技術(shù)

    摘要 本文對R4網(wǎng)絡(luò)由于引入軟交換概念而增加的新設(shè)備(MSC Server和MGW)、新的接口(Me,Nc,Nb)以及網(wǎng)絡(luò)的新特征進行了介紹,并對R4網(wǎng)絡(luò)
    發(fā)表于 06-17 10:33 ?1783次閱讀

    BUFFALO HD-H1.OTGL/R5網(wǎng)絡(luò)存儲器評測

    BUFFALO HD-H1.OTGL/R5網(wǎng)絡(luò)存儲器評測
    發(fā)表于 11-03 18:28 ?19次下載

    基于網(wǎng)絡(luò)地址和協(xié)議轉(zhuǎn)換實現(xiàn)IPv4網(wǎng)絡(luò)和IPv6網(wǎng)絡(luò)互連

    IPv4 的缺陷和Internet的飛速發(fā)展導(dǎo)致IPv6的產(chǎn)生和發(fā)展,目前,IPv6網(wǎng)絡(luò)正從試驗性網(wǎng)絡(luò)逐步走向?qū)嶋H應(yīng)用,但未來一段時間內(nèi),IPv4網(wǎng)絡(luò)仍然占據(jù)主導(dǎo)地位,IPv4網(wǎng)絡(luò)和I
    的頭像 發(fā)表于 06-19 17:12 ?3597次閱讀
    基于<b class='flag-5'>網(wǎng)絡(luò)</b>地址和協(xié)議轉(zhuǎn)換<b class='flag-5'>實現(xiàn)</b>IPv4<b class='flag-5'>網(wǎng)絡(luò)</b>和IPv6<b class='flag-5'>網(wǎng)絡(luò)</b>互連