微網(wǎng)站怎么做的好網(wǎng)站優(yōu)化推廣公司
? ? ? ? 在機(jī)器學(xué)習(xí)中,絕大部分模型都需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí)(包括有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)),然而在實(shí)際應(yīng)用中經(jīng)常會(huì)遇到訓(xùn)練數(shù)據(jù)不足的問(wèn)題。就比如圖像分類這樣的計(jì)算機(jī)視覺(jué)任務(wù),確實(shí)依賴于大規(guī)模且多樣化的訓(xùn)練數(shù)據(jù)以確保模型能夠有效地泛化到未見(jiàn)過(guò)的實(shí)例上。然而,實(shí)踐中遭遇訓(xùn)練數(shù)據(jù)不足是很常見(jiàn)的挑戰(zhàn)。當(dāng)訓(xùn)練一個(gè)圖像分類模型時(shí),如果訓(xùn)練樣本比較少,該如何處理呢?
一、訓(xùn)練數(shù)據(jù)不足會(huì)造成什么問(wèn)題?
(1)過(guò)擬合
????????圖像分類任務(wù)上,訓(xùn)練數(shù)據(jù)不足帶來(lái)的問(wèn)題主要表現(xiàn)在過(guò)擬合方面。處理策略大致可以歸納為兩大類:
- 依賴模型的方法:其核心在于采取降低過(guò)擬合風(fēng)險(xiǎn)的策略。這包括簡(jiǎn)化模型結(jié)構(gòu)(例如,將復(fù)雜的非線性模型簡(jiǎn)化為更易處理的線性模型)、引入正則化項(xiàng)以縮小模型假設(shè)空間(如采用L1或L2正則化技術(shù))、運(yùn)用集成學(xué)習(xí)方法以及調(diào)整Dropout超參數(shù)等手段。
- 基于數(shù)據(jù)的方法:主要通過(guò)數(shù)據(jù)增強(qiáng)技術(shù)來(lái)實(shí)施。這類方法依據(jù)特定的先驗(yàn)知識(shí),在保留關(guān)鍵信息的同時(shí)對(duì)原始數(shù)據(jù)進(jìn)行合適的轉(zhuǎn)換,旨在擴(kuò)展數(shù)據(jù)集并提高模型的泛化能力。
(2)欠擬合
????????在圖像分類任務(wù)上,訓(xùn)練數(shù)據(jù)不足也有可能帶來(lái)欠擬合的問(wèn)題。欠擬合是指模型的復(fù)雜度不足以捕捉到數(shù)據(jù)集中的所有重要特征和模式,導(dǎo)致模型在訓(xùn)練集上的表現(xiàn)也不理想,更不用說(shuō)在未見(jiàn)過(guò)的測(cè)試集上了。當(dāng)訓(xùn)練數(shù)據(jù)不足時(shí),模型可能無(wú)法從有限的樣本中學(xué)習(xí)到足夠的信息來(lái)概括整個(gè)數(shù)據(jù)分布,表現(xiàn)為模型的泛化能力較弱。
????????可以通過(guò)上面的兩種思路來(lái)嘗試緩解欠擬合:
- 依賴模型的方法:使用更大規(guī)?;蛘吒顚哟蔚纳窠?jīng)網(wǎng)絡(luò)結(jié)構(gòu),使模型具有更強(qiáng)的學(xué)習(xí)能力來(lái)捕捉數(shù)據(jù)中的復(fù)雜關(guān)系?;蚴褂眠w移學(xué)習(xí)、集成學(xué)習(xí)的方法。
- 基于數(shù)據(jù)的方法:數(shù)據(jù)增強(qiáng)技術(shù),對(duì)現(xiàn)有的少量訓(xùn)練數(shù)據(jù)進(jìn)行各種變換,例如旋轉(zhuǎn)、翻轉(zhuǎn)、裁剪、縮放、顏色抖動(dòng)等,以模擬更多的訓(xùn)練樣本。
????????關(guān)于跟多過(guò)擬合與欠擬合的概念,可以看看我之前的文章:
【機(jī)器學(xué)習(xí)300問(wèn)】27、高偏差與高方差是什么?他們對(duì)評(píng)估機(jī)器學(xué)習(xí)模型起何作用?http://t.csdnimg.cn/EalJu
二、如何解決數(shù)據(jù)不足帶來(lái)的問(wèn)題?
? ? ? ? 這里有很多方法,我之前的文章已經(jīng)講過(guò)了,我在本文中拓展將一下圖像的數(shù)據(jù)增強(qiáng)技術(shù)。?
(1)遷移學(xué)習(xí)
?????????利用預(yù)訓(xùn)練的深度學(xué)習(xí)模型,保留其底層特征提取層,并在頂部添加新的全連接層或卷積層,僅用少量標(biāo)注圖像對(duì)該部分進(jìn)行微調(diào)。
【機(jī)器學(xué)習(xí)300問(wèn)】37、什么是遷移學(xué)習(xí)?http://t.csdnimg.cn/Q7aQQ
(2)欠采樣/過(guò)采樣技術(shù)
?????????對(duì)于類別不平衡問(wèn)題,可以通過(guò)欠采樣冗余類別或過(guò)采樣少數(shù)類別的方法來(lái)平衡數(shù)據(jù)分布。
【機(jī)器學(xué)習(xí)300問(wèn)】31、不平衡數(shù)據(jù)集如何進(jìn)行機(jī)器學(xué)習(xí)?http://t.csdnimg.cn/f8SL8
(3)數(shù)據(jù)增強(qiáng)
????????通過(guò)對(duì)現(xiàn)有的圖像數(shù)據(jù)進(jìn)行各種變換,如翻轉(zhuǎn)、旋轉(zhuǎn)、裁剪、縮放、顏色抖動(dòng)、平移等操作,生成新的訓(xùn)練樣本,從而擴(kuò)大訓(xùn)練集的大小而不引入額外的真實(shí)數(shù)據(jù)。
【機(jī)器學(xué)習(xí)300問(wèn)】29、訓(xùn)練數(shù)據(jù)少該怎么辦?數(shù)據(jù)增強(qiáng)http://t.csdnimg.cn/uhLP5
① 色彩空間轉(zhuǎn)換
? ? ? ? 比如手勢(shì)識(shí)別中,如果圖像訓(xùn)練數(shù)據(jù)過(guò)少,可以采取顏色變換的方式增加圖像。圖像處理中常見(jiàn)的顏色空間分布有 RGB、HSV 和 YCrCb 三種空間模型。比較這三種空間模型后發(fā)現(xiàn) RGB 空間由于亮度信息存在三個(gè)顏色通道中,并不相互獨(dú)立,難以從 RGB 顏色空間中有效提取出手勢(shì)的膚色信息,而 YCrCb 和 HSV 顏色空間都具有亮度與色度相分離的特點(diǎn),并且膚色范圍緊密,不易受光照后其他物體的干擾,相對(duì)來(lái)說(shuō)更適用提取手勢(shì)的膚色信息。RGB 與 YCrCb 空間轉(zhuǎn)化的計(jì)算公式如下所示。
????????這里的R、G、B代表原始RGB顏色空間中的紅色、綠色和藍(lán)色通道值,Y是計(jì)算出的亮度值,Cb和Cr是對(duì)應(yīng)于藍(lán)色和紅色的色度分量。公式中加上的128是為了將色度分量的取值范圍從-127至128調(diào)整到0至255的標(biāo)準(zhǔn)8位顏色值區(qū)間。通過(guò)這種轉(zhuǎn)換后,可以根據(jù)Cr和Cb的值來(lái)判斷像素是否屬于膚色區(qū)域。
② 二值化
????????圖像的二值化處理是將圖像上所有像素點(diǎn)的灰度值設(shè)置為 0 或者 255 過(guò)程,使得整個(gè)圖像呈現(xiàn)出明顯的黑白效果,通常選取一個(gè)合適的閾值,當(dāng)圖像中像素值大于或者等于閾值時(shí)判定為前景,將其值設(shè)為 255,反之則判定為背景,將其值設(shè)為 0。圖像的二值化使得圖像變得簡(jiǎn)單明了,通過(guò)前景和背景的像素值重置可以有效降低背景噪聲,在一定程度增強(qiáng)了特征。
? ? ? ? 下面介紹一個(gè)常用的選取合適閾值的方法——最大類間方差法(也稱Otsu)。其基本思想是將圖像看做前景目標(biāo)和背景環(huán)境兩個(gè)部分組成,用兩部分像素值的方差來(lái)估計(jì)前景目標(biāo)和背景環(huán)境之間的差別,通過(guò)像素劃分各部分出現(xiàn)的概率和平均灰度級(jí)來(lái)計(jì)算兩部分的方差,得到使得前景目標(biāo)和環(huán)境背景的類間方差達(dá)到最大的灰度級(jí)值默認(rèn)為最佳閾值。最佳閾值的標(biāo)準(zhǔn)判別公式如下所示。
?
? ? ? ? 其中,是當(dāng)前的閾值。
和
分別是背景(閾值以下)和前景(閾值以上)的像素占比。
和
分別是背景和前景的像素平均灰度值。
表示類間方差,即背景與前景之間的差異。Otsu的方法就是通過(guò)遍歷全部可能的t值,找到最大化
的那個(gè)t值,即最佳閾值。在實(shí)踐中,最大類間方差法是一種高效且自動(dòng)的閾值選擇方法,尤其在物體識(shí)別和圖像分割中被廣泛使用。