国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

深度學習實戰(zhàn)基礎案例——卷積神經網絡（CNN）基于SqueezeNet的眼疾識別|第1例

2年前作者：心無旁騖~分類：Toy博客閱讀(27)違法舉報

這篇具有很好參考價值的文章主要介紹了深度學習實戰(zhàn)基礎案例——卷積神經網絡（CNN）基于SqueezeNet的眼疾識別|第1例。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

前言

SqueezeNet是一種輕量且高效的CNN模型，它參數比AlexNet少50倍，但模型性能（accuracy）與AlexNet接近。顧名思義，Squeeze的中文意思是壓縮和擠壓的意思，所以我們通過算法的名字就可以猜想到，該算法一定是通過壓縮模型來降低模型參數量的。當然任何算法的改進都是在原先的基礎上提升精度或者降低模型參數，因此該算法的主要目的就是在于降低模型參數量的同時保持模型精度。

我的環(huán)境：

基礎環(huán)境：python3.7
編譯器：pycharm
深度學習框架：pytorch
數據集代碼獲?。烘溄樱ㄌ崛〈a：2357 ）

一、數據準備

本案例使用的數據集是眼疾識別數據集iChallenge-PM。

1.1 數據集介紹

iChallenge-PM是百度大腦和中山大學中山眼科中心聯合舉辦的iChallenge比賽中，提供的關于病理性近視（Pathologic Myopia，PM）的醫(yī)療類數據集，包含1200個受試者的眼底視網膜圖片，訓練、驗證和測試數據集各400張。

training.zip：包含訓練中的圖片和標簽
validation.zip：包含驗證集的圖片
valid_gt.zip：包含驗證集的標簽

該數據集是從AI Studio平臺中下載的，具體信息如下：
深度學習實戰(zhàn)基礎案例——卷積神經網絡（CNN）基于SqueezeNet的眼疾識別|第1例,零基礎深度學習項目實戰(zhàn),深度學習,cnn,人工智能

1.2 數據集文件結構

數據集中共有三個壓縮文件，分別是：

training.zip

├── PALM-Training400
│   ├── PALM-Training400.zip
│   │   ├── H0002.jpg
│   │   └── ...
│   ├── PALM-Training400-Annotation-D&F.zip
│   │   └── ...
│   └── PALM-Training400-Annotation-Lession.zip
        └── ...

valid_gt.zip：標記的位置里面的PM_Lable_and_Fovea_Location.xlsx就是標記文件

├── PALM-Validation-GT
│   ├── Lession_Masks
│   │   └── ...
│   ├── Disc_Masks
│   │   └── ...
│   └── PM_Lable_and_Fovea_Location.xlsx

validation.zip：測試數據集

├── PALM-Validation
│   ├── V0001.jpg
│   ├── V0002.jpg
│   └── ...

二、項目實戰(zhàn)

項目結構如下:
深度學習實戰(zhàn)基礎案例——卷積神經網絡（CNN）基于SqueezeNet的眼疾識別|第1例,零基礎深度學習項目實戰(zhàn),深度學習,cnn,人工智能

2.1 數據標簽劃分

該眼疾數據集格式有點復雜，這里我對數據集進行了自己的處理，將訓練集和驗證集寫入txt文本里面，分別對應它的圖片路徑和標簽。

import os
import pandas as pd
# 將訓練集劃分標簽
train_dataset = r"F:\SqueezeNet\data\PALM-Training400\PALM-Training400"
train_list = []
label_list = []


train_filenames = os.listdir(train_dataset)

for name in train_filenames:
    filepath = os.path.join(train_dataset, name)
    train_list.append(filepath)
    if name[0] == 'N' or name[0] == 'H':
        label = 0
        label_list.append(label)
    elif name[0] == 'P':
        label = 1
        label_list.append(label)
    else:
        raise('Error dataset!')


with open('F:/SqueezeNet/train.txt', 'w', encoding='UTF-8') as f:
    i = 0
    for train_img in train_list:
        f.write(str(train_img) + ' ' +str(label_list[i]))
        i += 1
        f.write('\n')
# 將驗證集劃分標簽
valid_dataset = r"F:\SqueezeNet\data\PALM-Validation400"
valid_filenames = os.listdir(valid_dataset)
valid_label = r"F:\SqueezeNet\data\PALM-Validation-GT\PM_Label_and_Fovea_Location.xlsx"
data = pd.read_excel(valid_label)
valid_data = data[['imgName', 'Label']].values.tolist()

with open('F:/SqueezeNet/valid.txt', 'w', encoding='UTF-8') as f:
    for valid_img in valid_data:
        f.write(str(valid_dataset) + '/' + valid_img[0] + ' ' + str(valid_img[1]))
        f.write('\n')

2.2 數據預處理

這里采用到的數據預處理，主要有調整圖像大小、隨機翻轉、歸一化等。

import os.path
from PIL import Image
from torch.utils.data import DataLoader, Dataset
from torchvision.transforms import transforms

transform_BZ = transforms.Normalize(
    mean=[0.5, 0.5, 0.5],
    std=[0.5, 0.5, 0.5]
)


class LoadData(Dataset):
    def __init__(self, txt_path, train_flag=True):
        self.imgs_info = self.get_images(txt_path)
        self.train_flag = train_flag

        self.train_tf = transforms.Compose([
            transforms.Resize(224),  # 調整圖像大小為224x224
            transforms.RandomHorizontalFlip(),  # 隨機左右翻轉圖像
            transforms.RandomVerticalFlip(),  # 隨機上下翻轉圖像
            transforms.ToTensor(),  # 將PIL Image或numpy.ndarray轉換為tensor，并歸一化到[0,1]之間
            transform_BZ  # 執(zhí)行某些復雜變換操作
        ])
        self.val_tf = transforms.Compose([
            transforms.Resize(224),  # 調整圖像大小為224x224
            transforms.ToTensor(),  # 將PIL Image或numpy.ndarray轉換為tensor，并歸一化到[0,1]之間
            transform_BZ  # 執(zhí)行某些復雜變換操作
        ])

    def get_images(self, txt_path):
        with open(txt_path, 'r', encoding='utf-8') as f:
            imgs_info = f.readlines()
            imgs_info = list(map(lambda x: x.strip().split(' '), imgs_info))
        return imgs_info

    def padding_black(self, img):
        w, h = img.size
        scale = 224. / max(w, h)
        img_fg = img.resize([int(x) for x in [w * scale, h * scale]])
        size_fg = img_fg.size
        size_bg = 224
        img_bg = Image.new("RGB", (size_bg, size_bg))
        img_bg.paste(img_fg, ((size_bg - size_fg[0]) // 2,
                              (size_bg - size_fg[1]) // 2))

        img = img_bg
        return img

    def __getitem__(self, index):
        img_path, label = self.imgs_info[index]

        img_path = os.path.join('', img_path)
        img = Image.open(img_path)
        img = img.convert("RGB")
        img = self.padding_black(img)
        if self.train_flag:
            img = self.train_tf(img)
        else:
            img = self.val_tf(img)
        label = int(label)
        return img, label

    def __len__(self):
        return len(self.imgs_info)

2.3 構建模型

import torch
import torch.nn as nn
import torch.nn.init as init


class Fire(nn.Module):

    def __init__(self, inplanes, squeeze_planes,
                 expand1x1_planes, expand3x3_planes):
        super(Fire, self).__init__()
        self.inplanes = inplanes
        self.squeeze = nn.Conv2d(inplanes, squeeze_planes, kernel_size=1)
        self.squeeze_activation = nn.ReLU(inplace=True)
        self.expand1x1 = nn.Conv2d(squeeze_planes, expand1x1_planes,
                                   kernel_size=1)
        self.expand1x1_activation = nn.ReLU(inplace=True)
        self.expand3x3 = nn.Conv2d(squeeze_planes, expand3x3_planes,
                                   kernel_size=3, padding=1)
        self.expand3x3_activation = nn.ReLU(inplace=True)

    def forward(self, x):
        x = self.squeeze_activation(self.squeeze(x))
        return torch.cat([
            self.expand1x1_activation(self.expand1x1(x)),
            self.expand3x3_activation(self.expand3x3(x))
        ], 1)


class SqueezeNet(nn.Module):

    def __init__(self, version='1_0', num_classes=1000):
        super(SqueezeNet, self).__init__()
        self.num_classes = num_classes
        if version == '1_0':
            self.features = nn.Sequential(
                nn.Conv2d(3, 96, kernel_size=7, stride=2),
                nn.ReLU(inplace=True),
                nn.MaxPool2d(kernel_size=3, stride=2, ceil_mode=True),
                Fire(96, 16, 64, 64),
                Fire(128, 16, 64, 64),
                Fire(128, 32, 128, 128),
                nn.MaxPool2d(kernel_size=3, stride=2, ceil_mode=True),
                Fire(256, 32, 128, 128),
                Fire(256, 48, 192, 192),
                Fire(384, 48, 192, 192),
                Fire(384, 64, 256, 256),
                nn.MaxPool2d(kernel_size=3, stride=2, ceil_mode=True),
                Fire(512, 64, 256, 256),
            )
        elif version == '1_1':
            self.features = nn.Sequential(
                nn.Conv2d(3, 64, kernel_size=3, stride=2),
                nn.ReLU(inplace=True),
                nn.MaxPool2d(kernel_size=3, stride=2, ceil_mode=True),
                Fire(64, 16, 64, 64),
                Fire(128, 16, 64, 64),
                nn.MaxPool2d(kernel_size=3, stride=2, ceil_mode=True),
                Fire(128, 32, 128, 128),
                Fire(256, 32, 128, 128),
                nn.MaxPool2d(kernel_size=3, stride=2, ceil_mode=True),
                Fire(256, 48, 192, 192),
                Fire(384, 48, 192, 192),
                Fire(384, 64, 256, 256),
                Fire(512, 64, 256, 256),
            )
        else:
            # FIXME: Is this needed? SqueezeNet should only be called from the
            # FIXME: squeezenet1_x() functions
            # FIXME: This checking is not done for the other models
            raise ValueError("Unsupported SqueezeNet version {version}:"
                             "1_0 or 1_1 expected".format(version=version))

        # Final convolution is initialized differently from the rest
        final_conv = nn.Conv2d(512, self.num_classes, kernel_size=1)
        self.classifier = nn.Sequential(
            nn.Dropout(p=0.5),
            final_conv,
            nn.ReLU(inplace=True),
            nn.AdaptiveAvgPool2d((1, 1))
        )

        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                if m is final_conv:
                    init.normal_(m.weight, mean=0.0, std=0.01)
                else:
                    init.kaiming_uniform_(m.weight)
                if m.bias is not None:
                    init.constant_(m.bias, 0)

    def forward(self, x):
        x = self.features(x)
        x = self.classifier(x)
        return torch.flatten(x, 1)

2.4 開始訓練

import torch
import torch.nn as nn
from torch.utils.data import DataLoader, Dataset
from model import SqueezeNet
import torchsummary
from dataloader import LoadData
import copy

device = "cuda:0" if torch.cuda.is_available() else "cpu"
print("Using {} device".format(device))

model = SqueezeNet(num_classes=2).to(device)
# print(model)
#print(torchsummary.summary(model, (3, 224, 224), 1))


# 加載訓練集和驗證集
train_data = LoadData(r"F:\SqueezeNet\train.txt", True)
train_dl = torch.utils.data.DataLoader(train_data, batch_size=16, pin_memory=True,
                                           shuffle=True, num_workers=0)
test_data = LoadData(r"F:\SqueezeNet\valid.txt", True)
test_dl = torch.utils.data.DataLoader(test_data, batch_size=16, pin_memory=True,
                                           shuffle=True, num_workers=0)


# 編寫訓練函數
def train(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)  # 訓練集的大小
    num_batches = len(dataloader)  # 批次數目, (size/batch_size，向上取整)
    print('num_batches:', num_batches)
    train_loss, train_acc = 0, 0  # 初始化訓練損失和正確率

    for X, y in dataloader:  # 獲取圖片及其標簽
        X, y = X.to(device), y.to(device)
        # 計算預測誤差
        pred = model(X)  # 網絡輸出
        loss = loss_fn(pred, y)  # 計算網絡輸出和真實值之間的差距，targets為真實值，計算二者差值即為損失

        # 反向傳播
        optimizer.zero_grad()  # grad屬性歸零
        loss.backward()  # 反向傳播
        optimizer.step()  # 每一步自動更新

        # 記錄acc與loss
        train_acc += (pred.argmax(1) == y).type(torch.float).sum().item()
        train_loss += loss.item()

    train_acc /= size
    train_loss /= num_batches

    return train_acc, train_loss

# 編寫驗證函數
def test(dataloader, model, loss_fn):
    size = len(dataloader.dataset)  # 測試集的大小
    num_batches = len(dataloader)  # 批次數目, (size/batch_size，向上取整)
    test_loss, test_acc = 0, 0

    # 當不進行訓練時，停止梯度更新，節(jié)省計算內存消耗
    with torch.no_grad():
        for imgs, target in dataloader:
            imgs, target = imgs.to(device), target.to(device)

            # 計算loss
            target_pred = model(imgs)
            loss = loss_fn(target_pred, target)

            test_loss += loss.item()
            test_acc += (target_pred.argmax(1) == target).type(torch.float).sum().item()

    test_acc /= size
    test_loss /= num_batches

    return test_acc, test_loss




# 開始訓練

epochs = 20

train_loss = []
train_acc = []
test_loss = []
test_acc = []

best_acc = 0  # 設置一個最佳準確率，作為最佳模型的判別指標


loss_function = nn.CrossEntropyLoss()  # 定義損失函數
optimizer = torch.optim.Adam(model.parameters(), lr=0.001) # 定義Adam優(yōu)化器

for epoch in range(epochs):

    model.train()
    epoch_train_acc, epoch_train_loss = train(train_dl, model, loss_function, optimizer)

    model.eval()
    epoch_test_acc, epoch_test_loss = test(test_dl, model, loss_function)

    # 保存最佳模型到 best_model
    if epoch_test_acc > best_acc:
        best_acc = epoch_test_acc
        best_model = copy.deepcopy(model)

    train_acc.append(epoch_train_acc)
    train_loss.append(epoch_train_loss)
    test_acc.append(epoch_test_acc)
    test_loss.append(epoch_test_loss)

    # 獲取當前的學習率
    lr = optimizer.state_dict()['param_groups'][0]['lr']

    template = ('Epoch:{:2d}, Train_acc:{:.1f}%, Train_loss:{:.3f}, Test_acc:{:.1f}%, Test_loss:{:.3f}, Lr:{:.2E}')
    print(template.format(epoch + 1, epoch_train_acc * 100, epoch_train_loss,
                          epoch_test_acc * 100, epoch_test_loss, lr))

# 保存最佳模型到文件中
PATH = './best_model.pth'  # 保存的參數文件名
torch.save(best_model.state_dict(), PATH)

print('Done')

深度學習實戰(zhàn)基礎案例——卷積神經網絡（CNN）基于SqueezeNet的眼疾識別|第1例,零基礎深度學習項目實戰(zhàn),深度學習,cnn,人工智能

2.5 結果可視化

import matplotlib.pyplot as plt
#隱藏警告
import warnings
warnings.filterwarnings("ignore")               #忽略警告信息
plt.rcParams['font.sans-serif']    = ['SimHei'] # 用來正常顯示中文標簽
plt.rcParams['axes.unicode_minus'] = False      # 用來正常顯示負號
plt.rcParams['figure.dpi']         = 100        #分辨率

epochs_range = range(epochs)

plt.figure(figsize=(12, 3))
plt.subplot(1, 2, 1)

plt.plot(epochs_range, train_acc, label='Training Accuracy')
plt.plot(epochs_range, test_acc, label='Test Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Test Accuracy')

plt.subplot(1, 2, 2)
plt.plot(epochs_range, train_loss, label='Training Loss')
plt.plot(epochs_range, test_loss, label='Test Loss')
plt.legend(loc='upper right')
plt.title('Training and Test Loss')
plt.show()

可視化結果如下：
深度學習實戰(zhàn)基礎案例——卷積神經網絡（CNN）基于SqueezeNet的眼疾識別|第1例,零基礎深度學習項目實戰(zhàn),深度學習,cnn,人工智能
可以自行調整學習率以及batch_size，這里我的超參數并沒有調整。

三、數據集個體預測

import matplotlib.pyplot as plt
from PIL import Image
from torchvision.transforms import transforms
from model import SqueezeNet
import torch

data_transform = transforms.Compose(
    [transforms.ToTensor(),
     transforms.Resize((224, 224)),
     transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

img = Image.open("F:\SqueezeNet\data\PALM-Validation400\V0008.jpg")
plt.imshow(img)
img = data_transform(img)
img = torch.unsqueeze(img, dim=0)
name = ['非病理性近視', '病理性近視']
model_weight_path = r"F:\SqueezeNet\best_model.pth"
model = SqueezeNet(num_classes=2)
model.load_state_dict(torch.load(model_weight_path))
model.eval()
with torch.no_grad():
    output = torch.squeeze(model(img))

    predict = torch.softmax(output, dim=0)
    # 獲得最大可能性索引
    predict_cla = torch.argmax(predict).numpy()
    print('索引為', predict_cla)
print('預測結果為：{},置信度為: {}'.format(name[predict_cla], predict[predict_cla].item()))
plt.show()

索引為 1
預測結果為：病理性近視,置信度為: 0.9768268465995789

深度學習實戰(zhàn)基礎案例——卷積神經網絡（CNN）基于SqueezeNet的眼疾識別|第1例,零基礎深度學習項目實戰(zhàn),深度學習,cnn,人工智能

更詳細的請看paddle版本的實現：深度學習實戰(zhàn)基礎案例——卷積神經網絡（CNN）基于SqueezeNet的眼疾識別文章來源地址http://www.zghlxwxcb.cn/news/detail-652152.html

到了這里，關于深度學習實戰(zhàn)基礎案例——卷積神經網絡（CNN）基于SqueezeNet的眼疾識別|第1例的文章就介紹完了。如果您還想了解更多內容，請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章，希望大家以后多多支持TOY模板網！

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如若轉載，請注明出處：如若內容造成侵權/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經查實，立即刪除！

分享到：

領支付寶紅包贊助服務器費用

【AI機器學習入門與實戰(zhàn)】CNN卷積神經網絡識別圖片驗證碼案例
??【 AI機器學習入門與實戰(zhàn) 】目錄 ?? 基礎篇 ?? 第一篇：【AI機器學習入門與實戰(zhàn)】AI 人工智能介紹 ?? 第二篇：【AI機器學習入門與實戰(zhàn)】機器學習核心概念理解 ?? 第三篇：【AI機器學習入門與實戰(zhàn)】機器學習算法都有哪些分類？ ?? 第四篇：【AI機器學習入門與實戰(zhàn)】
2024年02月02日
瀏覽(68)
項目實戰(zhàn)解析：基于深度學習搭建卷積神經網絡模型算法，實現圖像識別分類
隨著人工智能的不斷發(fā)展，深度學習這門技術也越來越重要，很多人都開啟了學習機器學習，本文將通過項目開發(fā)實例，帶領大家從零開始設計實現一款基于深度學習的圖像識別算法。學習本章內容，你需要掌握以下基礎知識： Python 基礎語法計算機視覺庫(OpenCV) 深度學習
2024年02月03日
瀏覽(99)
深度學習基礎——卷積神經網絡的感受野、參數量、計算量
深度學習在圖像處理領域取得了巨大的成功，其中卷積神經網絡（Convolutional Neural Networks，CNN）是一種非常重要的網絡結構。本文將介紹卷積神經網絡的三個重要指標：感受野、參數量和計算量。首先，會對這些指標進行定義，然后介紹如何計算它們，并通過Python實現示例代
2024年04月28日
瀏覽(25)
深度學習圖像分類實戰(zhàn)——pytorch搭建卷積神經網絡(AlexNet, LeNet, ResNet50)進行場景圖像分類（詳細）
目錄 1??一、實驗過程 1.1??實驗目的 1.2??實驗簡介 1.3??數據集的介紹 1.4??一、LeNet5網絡模型 1.5??二、AlexNet網絡模型 1.6??三、ResNet50（殘差網絡）網絡模型 ?二、實驗代碼導入實驗所需要的庫 ?參數配置數據預處理重新DataSet 加載數據轉為DataLoader函數可視化一批訓練
2024年02月05日
瀏覽(28)
深度學習基礎入門篇[8]：：計算機視覺與卷積神經網絡、卷積模型CNN綜述、池化講解、CNN參數計算
計算機視覺作為一門讓機器學會如何去“看”的學科，具體的說，就是讓機器去識別攝像機拍攝的圖片或視頻中的物體，檢測出物體所在的位置，并對目標物體進行跟蹤，從而理解并描述出圖片或視頻里的場景和故事，以此來模擬人腦視覺系統(tǒng)。因此，計算機視覺也通常被叫
2024年02月05日
瀏覽(35)
深度學習，卷積神經網絡
? CV領域發(fā)展 CV領域是計算機視覺（Computer Vision）領域的簡稱。計算機視覺是指利用計算機模擬人類視覺系統(tǒng)的科學，讓計算機具有類似于人類在觀察外界的視覺、圖像的能力，包括圖像處理、圖像分析、圖像理解等。計算機視覺領域發(fā)展有以下特點：視覺系統(tǒng)的出現和不
2024年02月15日
瀏覽(26)
深度學習｜卷積神經網絡
卷積神經網絡（Convolutional Neural Network，CNN）是一種深度學習神經網絡結構，主要用于圖像識別、計算機視覺等領域。該結構在處理圖像等高維數據時表現出色，因為它具有共享權重和局部感知的特點，一方面減少了權值的數量使得網絡易于優(yōu)化，另一方面降低了模型的復
2024年02月11日
瀏覽(25)
【深度學習】6-1 卷積神經網絡 - 卷積層
卷積神經網絡(Convolutional Neural Network， CNN )。 CNN 被用于圖像識別、語音識別等各種場合，在圖像識別的比賽中，基于深度學習的方法幾乎都以 CNN 為基礎。首先，來看一下 CNN 的網絡結構，了解 CNN 的大致框架。CNN 和之前介紹的神經網絡一樣，可以像樂高積木一樣通過組裝層
2024年02月10日
瀏覽(23)
PyToch 深度學習 || 3. 卷積神經網絡 | 3.1 深度學習中的卷積操作
加權求和是一種非常重要的運算，可以整合局部數字特征進而是提取局部信息的重要手段。這種加權求和的形式被稱作卷積或者濾波，對于兩個信號 f ( x
2024年02月15日
瀏覽(20)
深度學習——CNN卷積神經網絡
卷積神經網絡（Convolutional Neural Network，CNN）是一種深度學習中常用于處理具有網格結構數據的神經網絡模型。它在計算機視覺領域廣泛應用于圖像分類、目標檢測、圖像生成等任務。 CNN 的核心思想是通過利用局部感知和參數共享來捕捉輸入數據的空間結構信息。相比于傳統(tǒng)
2024年02月15日
瀏覽(26)

<track id="p0tri"><pre id="p0tri"></pre></track>