尤物av在线,蜜桃秘?av一区二区三区安全,91纯肉动漫

構建自定義CNN模型：識別COVID-19

2022-03-01 15:26

磐創AI

關注

本文讓我們從頭開始，通過訓練和測試我們的自定義圖像數據集，來構建我們自己的自定義CNN（卷積神經網絡）模型。

我們將使用驗證集方法來訓練模型，從而將我們的數據集劃分為訓練、驗證和測試數據集。

在結束時，你將能夠為 COVID－19 構建你自己的自定義 CNN 模型，通過使用你自己的數據集進行訓練來執行多類圖像分類！

此外，我們還將通過獲取其分類報告和混淆矩陣，在驗證和測試數據集上徹底評估訓練模型。此外，我們還將使用 Streamlit 創建一個漂亮而簡單的前端，并將我們的模型與 Web 應用程序集成。

目前已經使用 Google Colab 進行所有實施。此外，已將數據集上傳到項目的Google drive 。Streamlit Web 應用程序可以從 Google Colab 輕松啟動。

那么，讓我們開始吧！

· 介紹

· 應用

· 執行

· 結論

介紹

首先，自定義數據集是你自己準備的數據集，就像你去外面玩并拍攝照片以收集你感興趣的圖像一樣，或者從知名網站下載并使用開源圖像數據集來獲取數據集，例如 Kaggle、GitHub 等。

總而言之，它是你自己的數據集，其中你將所需類的圖像存儲在不同的文件夾中——每個類的文件夾。

在本文中，將解釋如何使用 TensorFlow 在 CT 掃描的 COVID 多類數據集之一上為 COVID－19 構建 CNN 模型。可以直接從這里下載。現在，暫停并確保你下載數據集以跟隨實施。

給定的 Kaggle 數據集包括患有新型 COVID－19、其他肺部疾病和健康患者的患者的胸部 CT 掃描圖像。對于這三個類別中的每一個，都有多個患者，并且對于每個類別，都有相應的多個 CT 掃描圖像。

我們將使用這些 CT 掃描圖像來訓練我們的 CNN 模型，以識別給定的 CT 掃描是 COVID 患者、患有除 COVID 以外的其他肺部疾病的患者，還是健康患者的 CT 掃描。該問題包括 3 類，即：COVID、健康和其他肺部疾病，簡稱為“其他”。

應用

我們知道，進行 RTPCR 檢測 COVID 是有風險的，因為拭子檢測通過鼻子到達喉嚨，導致咳嗽，從而將病毒顆粒傳播到空氣中，從而危及衛生工作者的生命。

因此，研究人員表示，CT 掃描比此類拭子測試更安全。此外，建議在對 COVID 陽性患者進行 RTPCR 測試后進行 CT 掃描測試。

這就是我們現在正在做的項目可以證明對醫學界有幫助的地方。

執行

Step－1：圖像預處理

Step－2：訓練－測試－驗證拆分

Step－3：模型構建

Step－4：模型評估

Step－5：構建 Streamlit Web 應用程序

首先，讓我們導入所有需要的包，如下所示：

from tensorflow．keras．layers import Input， Lambda， Dense， Flatten，Dropout，Conv2D，MaxPooling2D

from tensorflow．keras．models import Model

from tensorflow．keras．preprocessing import image

from sklearn．metrics import accuracy＿score，classification＿report，confusion＿matrix

from tensorflow．keras．preprocessing．image import ImageDataGenerator

from sklearn．model＿selection import train＿test＿split

from tensorflow．keras．models import Sequential

import numpy as np

import pandas as pd

import os

import cv2

import matplotlib．pyplot as plt

Step－1 圖像預處理

每當我們處理圖像數據時，圖像預處理是第一步，也是最關鍵的一步。

在這里，我們將所有圖像重新縮放為所需的大小（在這個項目中為 100×100）并將它們除以 255 進行標準化。

根據我們數據集的目錄結構，如上一節所述，我們必須遍歷文件夾 2（患者文件夾）中存在的每個圖像，該圖像進一步存在于文件夾 1（類別文件夾：COVID、健康或其他）。

因此，相同的代碼是這樣的：

＃ re－size all the images to this

IMAGE＿SIZE ＝（100，100）

path＝＂／content／drive／MyDrive／MLH Project／dataset＂

data＝［］

c＝0

for folder in os．listdir（path）：

sub＿path＝path＋＂／＂＋folder

for folder2 in os．listdir（sub＿path）：

sub＿path2＝sub＿path＋＂／＂＋folder2

for img in os．listdir（sub＿path2）：

image＿path＝sub＿path2＋＂／＂＋img

img＿arr＝cv2．imread（image＿path）

try：

img＿arr＝cv2．resize（img＿arr，IMAGE＿SIZE）

data．append（img＿arr）

except：

c＋＝1

continue

print（＂Number of images skipped＝＂，c）

注意：在案例中可能會跳過兩個圖像。我們可以忽略它們，因為只是 2 張圖像，而不是跳過大量的圖像。

下面的代碼執行圖像的標準化：

x＝np．array（data）

x＝x／255．0

現在，由于我們的自定義數據集在文件夾中有圖像，我們如何獲取標簽？

使用 ImageDataGenerator 以及以下代碼實現：

datagen ＝ ImageDataGenerator（rescale ＝ 1．／255）

dataset ＝ datagen．flow＿from＿directory（path，
target＿size ＝ IMAGE＿SIZE，
batch＿size ＝ 32，
class＿mode ＝＇sparse＇）

此外，要注意類的索引并將這些類分配為標簽，請使用以下代碼：

dataset．class＿indices

y＝dataset．classes

y．shape

運行上面的代碼，你將觀察到以下索引已用于相應的類：

注意：在這一步的最后，所有的圖像都將被調整到100×100，盡管它們是CT掃描，但它們已被作為彩色圖像提供在選定的Kaggle數據集中。這就是為什么當我們在下一節中嘗試查看 x＿train，x＿val 和 x＿test 的形狀時，會得到100x100x3。這里，3表示彩色圖像（R－G－B）

Step－2：訓練－測試－驗證拆分

在這一步中，我們將數據集劃分為訓練集、測試集和驗證集，以便使用驗證集方法來訓練我們的模型，以便在 COVID、健康或其他的 CT 掃描中進行分類。

我們可以使用傳統的 sklearn 來實現。

x＿train，x＿test，y＿train，y＿test＝train＿test＿split（x，y，test＿size＝0．1）

x＿train，x＿val，y＿train，y＿val＝train＿test＿split（x＿train，y＿train，test＿size＝0．2）

此外，使用以下代碼查看每個數據集的大小：

x＿train．shape，y＿train．shape

x＿val．shape，y＿val．shape

x＿test．shape，y＿test．shape

從上面的代碼中，你將觀察到 3002 幅圖像屬于訓練集，751 幅圖像屬于驗證集，418 幅圖像屬于測試集。

Step－3 模型構建

現在，我們都準備好從頭開始為 COVID－19 編碼我們的 CNN 模型了。為此，我們只需要不斷添加層，主要是 Conv2D 來提取特征，MaxPooling2D 來執行圖像的下采樣。

此外，還使用了 BatchNormalization 層來提高模型在訓練和驗證準確性方面的性能。

因此，我們可以編寫我們自己的 CNN 模型，如下所示：

model＝Sequential（）

＃covolution layer

model．add（Conv2D（32，（3，3），activation＝＇relu＇，input＿shape＝（100，100，3）））

＃pooling layer

model．add（MaxPooling2D（2，2））

model．add（BatchNormalization（））

＃covolution layer

model．add（Conv2D（32，（3，3），activation＝＇relu＇））

＃pooling layer

model．add（MaxPooling2D（2，2））

model．add（BatchNormalization（））

＃covolution layer

model．add（Conv2D（64，（3，3），activation＝＇relu＇））

＃pooling layer

model．add（MaxPooling2D（2，2））

model．add（BatchNormalization（））

＃covolution layer

model．add（Conv2D（64，（3，3），activation＝＇relu＇））

＃pooling layer

model．add（MaxPooling2D（2，2））

model．add（BatchNormalization（））

＃i／p layer

model．add（Flatten（））

＃o／p layer

model．add（Dense（3，activation＝＇softmax＇））

model．summary（）

卷積神經網絡由幾個卷積層和池化層組成。我添加了四個 Conv2D 和 MaxPooling 層。Conv2D 層的第一個參數是我們必須在其中進行大量操作以達到最佳模型。

你可以從 Keras 官方文檔中了解更多關于 Conv2D、MaxPooling2D 和 BatchNormalization 的語法。

添加卷積層和最大池化層后，包含了 BatchNormalization 層，然后使用 Flatten（）函數添加了輸入層。

這里沒有隱藏層，因為它們對提高模型在訓練期間的性能沒有用處。

最后，添加了輸出層，它確實給了我們最后的輸出！Dense（）函數也用于相同的目的。它需要參數 3，因為我們有 3 個類別：COVID、健康和其他。

此外，這里使用的激活函數是 softmax 函數，因為這是一個多類問題。

這是模型架構。現在，在我們訓練它之前，我們必須按如下方式編譯它：

使用的優化器是常見的 Adam 優化器。由于所考慮的數據集的標簽是分類的而不是獨熱編碼的，我們必須選擇稀疏分類交叉熵損失函數。

提前停止用于避免過度擬合。當它開始過度擬合時，它會停止訓練我們的模型，而過擬合又通過驗證損失的突然增加被識別出來。

＃compile model：

model．compile（optimizer＝＇adam＇，loss＝＇sparse＿categorical＿crossentropy＇，metrics＝［＇accuracy＇］）

提前停止可用于避免過度擬合。這樣做是因為我們不知道我們的模型必須訓練多少個 epoch。

from tensorflow．keras．callbacks import EarlyStopping

early＿stop＝EarlyStopping（monitor＝＇val＿loss＇，mode＝＇min＇，verbose＝1，patience＝5）

＃Early stopping to avoid overfitting of model

現在，讓我們最終訓練我們的自定義 CNN 模型，比如 30 個 epoch：

history＝model．fit（x＿train，y＿train，validation＿data＝（x＿val，y＿val），epochs＝30，callbacks＝［early＿stop］，shuffle＝True）

在第 16 個 epoch 遇到了提前停止，因此模型只訓練了 16 個 epoch，在結束時它顯示出 100％的訓練準確度和 78．83％的驗證準確度。

Step－4 模型評估

可視化我們的模型訓練的最佳方法是使用損失和準確度圖。

以下代碼可用于獲取我們訓練的模型的損失和準確度圖：

＃loss graph

plt．plot（history．history［＇loss＇］，label＝＇train loss＇）

plt．plot（history．history［＇val＿loss＇］，label＝＇val loss＇）

plt．legend（）

plt．savefig（＇loss－graph．png＇）

plt．show（）

＃accuracies

plt．plot（history．history［＇accuracy＇］， label＝＇train acc＇）

plt．plot（history．history［＇val＿accuracy＇］， label＝＇val acc＇）

plt．legend（）

plt．savefig（＇acc－graph．png＇）

plt．show（）

準確率和損失圖如下：

驗證數據集的分類報告和混淆矩陣：

y＿val＿pred＝model．predict（x＿val）

y＿val＿pred＝np．argmax（y＿val＿pred，axis＝1）

print（classification＿report（y＿val＿pred，y＿val））

confusion＿matrix（y＿val＿pred，y＿val）

因此，可以清楚地得出結論，我們用于 COVID CT 掃描的 CNN 模型是最好的。它顯示了其他肺部疾病類別的平均表現。

然而，它對健康患者的表現相對較差。此外，我們的模型在驗證數據集上顯示出 79％的準確率。

測試數據集的分類報告和混淆矩陣，這對我們的模型來說是全新的：

y＿pred＝model．predict（x＿test）

y＿pred＝np．argmax（y＿pred，axis＝1）

print（classification＿report（y＿pred，y＿test））

confusion＿matrix（y＿pred，y＿test）

它在測試數據集上顯示了 75％的準確度，與驗證數據集的性能相似。

總的來說，我們可以得出結論，我們已經從頭開始為 COVID－19 開發了一個現實的 CNN 模型。

現在讓我們使用以下代碼保存模型：

model．save（＇／content／drive／MyDrive／MLH Project／model－recent．h5＇）

Step－5 構建 Streamlit Web 應用程序

在這一步中，我們將使用 Streamlit 創建一個前端，用戶可以在其中上傳胸部 CT 掃描的圖像。單擊“預測”按鈕將輸入圖像預處理為 100×100，這是我們用于 COVID－19 的 CNN 模型的輸入形狀，然后將其發送到我們的模型。

為了檢查我們的模型預測該圖像是哪個類別，我們使用 np．argmax（）函數獲得對應于最大值的索引，從而根據步驟 1 表中討論的標簽索引得出結論。

首先，我們必須安裝 Streamlit 并導入 ngrok：

！pip install streamlit －－quiet

！pip install pyngrok＝＝4．1．1 －－quiet

from pyngrok import ngrok

然后是實際代碼。

這里，我們主要加載保存的模型——h5文件，并使用它進行預測。模型文件的名稱是 model－recent．h5。可以選擇直接從本地系統上傳圖像并檢查其類別－如果 CT 掃描是 COVID 或健康或其他肺部疾病。

st． button（‘Predict’）創建一個寫有“Predict”的按鈕，并在用戶單擊按鈕時返回 True。st．title（）使其參數中的文本以深色粗體顯示。

這些是要討論的一些 Streamlit 功能。

％％writefile app．py

import streamlit as st

import tensorflow as tf

import numpy as np

from PIL import Image ＃ Strreamlit works with PIL library very easily for Images

import cv2

model＿path＝＇／content／drive／MyDrive／MLH Project／model－recent．h5＇

st．title（＂COVID－19 Identification Using CT Scan＂）

upload ＝ st．file＿uploader（＇Upload a CT scan image＇）

if upload is not None：

file＿bytes ＝ np．asarray（bytearray（upload．read（））， dtype＝np．uint8）

opencv＿image ＝ cv2．imdecode（file＿bytes， 1）

opencv＿image ＝ cv2．cvtColor（opencv＿image，cv2．COLOR＿BGR2RGB）

＃ Color from BGR to RGB

img ＝ Image．open（upload）

st．image（img，caption＝＇Uploaded Image＇，width＝300）

if（st．button（＇Predict＇））：

model ＝ tf．keras．models．load＿model（model＿path）

x ＝ cv2．resize（opencv＿image，（100，100））

x ＝ np．expand＿dims（x，axis＝0）

y ＝ model．predict（x）

ans＝np．argmax（y，axis＝1）

if（ans＝＝0）：

st．title（＇COVID＇）

elif（ans＝＝1）：

st．title（＇Healthy＇）

else：

st．title（＇Other Pulmonary Disorder＇）

最后，從以下位置獲取 Web 應用程序的 URL：

！nohup streamlit run app．py ＆

url ＝ ngrok．connect（port＝＇8501＇）

url

將此 URL 粘貼到 Chrome 網絡瀏覽器中以查看我們漂亮的應用程序。

結果

使用瀏覽按鈕上傳圖像然后單擊預測按鈕后，你的 Web 應用程序應如下所示。

結論

因此，我們使用我們的數據集成功構建并訓練了我們自己的 COVID－19 CNN 模型！相同的方法可用于兩個或更多類。你所要做的就是更改輸出層或模型架構的最后一層中的類數量。

原文標題 : 構建自定義CNN模型：識別COVID-19

卷積神經網絡

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯系舉報。

發表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞