如何用Tensorflow框架構(gòu)建用于食品分類(lèi)的機(jī)器學(xué)習(xí)模型?
摘要
在今天的報(bào)告中,我們將分析食品以預(yù)測(cè)它們是否可以食用。我們應(yīng)用最先進(jìn)的 遷移學(xué)習(xí)方法和 Tensorflow 框架來(lái)構(gòu)建用于食品分類(lèi)的機(jī)器學(xué)習(xí)模型。
介紹
圖像分類(lèi)是機(jī)器預(yù)測(cè)圖片屬于哪個(gè)類(lèi)別的工作。在深度學(xué)習(xí)開(kāi)始蓬勃發(fā)展之前,圖像分類(lèi)等任務(wù)無(wú)法達(dá)到人類(lèi)水平。這是因?yàn)闄C(jī)器學(xué)習(xí)模型無(wú)法確定圖像的鄰域知識(shí)。模型只接收像素級(jí)命令。由于深度學(xué)習(xí)的潛力,圖像分類(lèi)任務(wù)可以利用被描述為卷積神經(jīng)網(wǎng)絡(luò) (CNN) 的模型來(lái)傳遞人類(lèi)水平的性能。CNN 是一種研究圖像表征的深度學(xué)習(xí)模型。該模型無(wú)需個(gè)人參與即可確定從平面到高級(jí)的特征。該模型不僅接收像素級(jí)別的數(shù)據(jù)。該模型還通過(guò)稱(chēng)為卷積的機(jī)制從圖像中獲取相鄰數(shù)據(jù)。卷積將通過(guò)將范圍內(nèi)的像素的編譯相乘并將它們相加為一個(gè)值來(lái)聚合鄰域數(shù)據(jù)。ML 模型將接受這些特征以將圖片分類(lèi)為一組。深度學(xué)習(xí)雖然可以完成人類(lèi)級(jí)別的生產(chǎn),但需要大量的數(shù)據(jù)。
如果我們沒(méi)有它們?cè)趺崔k?我們可以應(yīng)用一種稱(chēng)為遷移學(xué)習(xí)的理論。
遷移學(xué)習(xí)是一種在海量數(shù)據(jù)上為我們的查詢(xún)訓(xùn)練模型的技術(shù)。因此,我們僅通過(guò)微調(diào)模型來(lái)準(zhǔn)備它們。我們將注意到的優(yōu)勢(shì)是模型將在一段時(shí)間內(nèi)學(xué)會(huì)。本文將幫助你練習(xí)使用 TensorFlow (Python) 進(jìn)行食品圖像分類(lèi)的遷移學(xué)習(xí)。因?yàn)轭A(yù)處理步驟是基本過(guò)程,我還將解釋如何將數(shù)據(jù)提供給我們的深度學(xué)習(xí)模型。
執(zhí)行
步驟1:導(dǎo)入庫(kù)
我們要求做的第一步是導(dǎo)入庫(kù)。我們想要 TensorFlow、NumPy、os 和 pandas。如果你還沒(méi)有修復(fù)包,你可以應(yīng)用 pip 命令來(lái)安裝所需的庫(kù)。請(qǐng)注意,我命令使用的 TensorFlow 是 2.4.1 版本,因此請(qǐng)安裝該版本。另外,如果你希望采用 GPU 來(lái)訓(xùn)練深度學(xué)習(xí)模型,請(qǐng)安裝 11.0 版的 CUDA,因?yàn)樵摪姹景?2.4.1 版的 TensorFlow。
下面是安裝和加載所需庫(kù)的代碼。# ! pip install tensorflow==2.4.1
# ! pip install pandas
# ! pip install numpy
import os
import numpy as np
import pandas as pd
import tensorflow as tf
步驟2:準(zhǔn)備數(shù)據(jù)
安排好庫(kù)后,下一步是修復(fù)我們的數(shù)據(jù)集。在此示例中,我們將應(yīng)用名為Food-5K的數(shù)據(jù)集。https://www.kaggle.com/binhminhs10/food5k該數(shù)據(jù)集由 5000 張圖片組成,分為兩類(lèi),即食物和非食物。FOOD-5K 分為訓(xùn)練、驗(yàn)證和測(cè)試數(shù)據(jù)集。數(shù)據(jù)集文件夾的格式如下:
正如你在上面看到的,每個(gè)文件夾都由圖片組成。每個(gè)圖片文件名包括類(lèi)別和由下劃線分隔的標(biāo)識(shí)符。我們需要產(chǎn)生帶有圖像文件名的列和帶有該文件夾排列的標(biāo)簽的數(shù)據(jù)框。修復(fù)數(shù)據(jù)集的代碼如下所示,def dframe(dtype):
X = []
y = []
path = 'Food-5K/' + dtype + '/'
for i in os.listdir(path):
# Image
X.a(chǎn)ppend(i)
# Label
y.a(chǎn)ppend(i.split('_')[0])
X = np.a(chǎn)rray(X)
y = np.a(chǎn)rray(y)
df = pd.DataFrame()
df['filename'] = X
df['label'] = y
return df
df_train = dframe('training')
df_val = dframe('validation')
df_test = dframe('evaluation')
df_train.head()
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-10.29立即報(bào)名>> 2024德州儀器嵌入式技術(shù)創(chuàng)新發(fā)展研討會(huì)
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車(chē)
-
11月14日立即報(bào)名>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
推薦專(zhuān)題
- 1 Intel宣布40年來(lái)最重大轉(zhuǎn)型:年底前裁員15000人、拋掉2/3房產(chǎn)
- 2 因美封殺TikTok,字節(jié)股價(jià)骨折!估值僅Meta1/5
- 3 宏山激光重磅發(fā)布行業(yè)解決方案,助力智能制造產(chǎn)業(yè)新飛躍
- 4 國(guó)產(chǎn)AI芯片公司破產(chǎn)!白菜價(jià)拍賣(mài)
- 5 具身智能火了,但規(guī)模落地還需時(shí)間
- 6 三次錯(cuò)失風(fēng)口!OpenAI前員工殺回AI編程賽道,老東家捧金相助
- 7 國(guó)產(chǎn)英偉達(dá)們,抓緊沖刺A股
- 8 英特爾賦能智慧醫(yī)療,共創(chuàng)數(shù)字化未來(lái)
- 9 英偉達(dá)的麻煩在后頭?
- 10 將“網(wǎng)紅”變成“商品”,AI“爆改”實(shí)力拉滿(mǎn)
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市