江蘇建設(shè)廳官方網(wǎng)站安全員北京專門做seo
文章目錄
- 摘要
- 算法
- 2.1網(wǎng)絡(luò)設(shè)計(jì)
- 2.2Anchor輔助訓(xùn)練
- 2.3自蒸餾
- 實(shí)驗(yàn)
- 消融實(shí)驗(yàn)
- 結(jié)論
論文: 《YOLOv6 v3.0: A Full-Scale Reloading 》
github: https://github.com/meituan/YOLOv6
上版本參考 YOLOv6
摘要
YOLOv6 v3.0中YOLOv6-N達(dá)到37.5AP,1187FPS;
YOLOv6-S達(dá)到45AP,484FPS;
擴(kuò)展backbone及neck,YOLOv6-M/L達(dá)到50/52.8AP,耗時(shí)基本不變;
YOLOv6-L6在實(shí)時(shí)目標(biāo)檢測(cè)達(dá)到SOTA;圖1中YOLOv6與其他版本進(jìn)行比較。
YOLOv6貢獻(xiàn)總結(jié)如下:
1、更新neck為RepBi-PAN,引入SiC模塊及SimCSPSPPF Block;
2、使用對(duì)耗時(shí)無(wú)影響的AAT(Anchor-Aided Training)策略;
3、YOLOv6在backbone和neck中增加一個(gè)stage,強(qiáng)化在高分辨率輸入下的表現(xiàn);
4、引入一種自監(jiān)督策略提升YOLOv6小模型性能,訓(xùn)練時(shí)使用高參數(shù)量DFL分支輔助訓(xùn)練回歸分支,推理時(shí)去除,避免耗時(shí)增加。
算法
2.1網(wǎng)絡(luò)設(shè)計(jì)
作者基于PAN,提出Bi-directional Concatenation(BiC)模塊,如圖2,融合backbone Ci-1層及Pi層特征,更多精確位置信號(hào)被保留,有利于小目標(biāo)定位。
作者簡(jiǎn)化SPPF block為SimCSPSPPF Block,增強(qiáng)表達(dá)能力。YOLOv6中neck定義為RepBi-PAN。
2.2Anchor輔助訓(xùn)練
作者發(fā)現(xiàn)基于anchor的YOLOv6-N優(yōu)于anchor-free方案,如表1
作者提出anchor輔助訓(xùn)練方案 (AAT)結(jié)合anchor-based及anchor-free優(yōu)勢(shì),如圖3,訓(xùn)練時(shí)輔助分支與anchor-free分支獨(dú)立計(jì)算損失,輔助分支可幫助優(yōu)化anchor-free head,推理時(shí)除去輔助分支,提升性能,速度不變。
2.3自蒸餾
上個(gè)版本YOLOv6中自監(jiān)督損失函數(shù)如式1,使用DFL進(jìn)行蒸餾框回歸分支。
蒸餾早期教師模型使用軟標(biāo)簽,隨著訓(xùn)練進(jìn)行硬標(biāo)簽更合適,因此作者對(duì)蒸餾權(quán)重使用余弦weight decay,如式3,
DFL將影響模型推理速度,對(duì)此作者設(shè)計(jì)Decoupled Localization Distillation(DLD),蒸餾時(shí),學(xué)生裝備原始回歸分支和與DFL結(jié)合的輔助分支,教師僅使用輔助分支,原始回歸分支使用硬標(biāo)簽訓(xùn)練,輔助分支使用硬標(biāo)簽及教師模型更新;蒸餾后,移除輔助分支。
實(shí)驗(yàn)
作者使用FP16精度進(jìn)行各個(gè)方案比較,結(jié)果如表2,圖1所示,
YOLOv6-N超越Y(jié)OLOv5-N/YOLOv7-Tiny 9.5%/4.2%;
YOLOv6-S超越Y(jié)OLOX-S/PPYOLOE-S 3.5%/0.9%,且耗時(shí)更短;
YOLOv6- M超越Y(jié)OLOv5-M 4.6;
YOLOv6-L超越Y(jié)OLOX-L/PPYOLOE-L 3.1%/1.4%;
與YOLOv8系列相比,性能接近。
作者類似YOLOv5在backbone 增加C6層用于檢測(cè)更大目標(biāo),neck相應(yīng)做出調(diào)整, 分別命名為YOLOv6- N6/S6/M6/L6;實(shí)驗(yàn)結(jié)果如表2,
與YOLOv5相比,性能提升,推理速度基本不變;
與YOLOv7-E6E相比,YOLOv6-L6性能提升0.4,耗時(shí)縮短63%;
消融實(shí)驗(yàn)
消融實(shí)驗(yàn)如表3,BiC+SimCSPSPPF使得性能提升0.6%;AAT使得性能提升0.3%;DLD使得性能提升0.7%;
BiC模塊影響實(shí)驗(yàn)如表4,在PAN top-down路徑插入BiC,YOLOv6-S/L性能提升0.6%/0.4%;但插入bottom-up路徑為帶來(lái)增益,作者分析由于bottom-up路徑中BiC將導(dǎo)致檢測(cè)頭易混淆不同尺度特征;
表5表示不同類型SPP block影響,SimSPPF*3表示P3, P4 and P5層使用SimSPPF blocks,SimSPPCSPC在 YOLOv6-N/S上超越SimSPPF 1.6%/0.3%,但耗時(shí)增加;
在YOLOv6- N/S/M上,SimCSPSPPF超越SimSPPF 1.1%/0.4%/0.1%;
考慮到性能與耗時(shí)均衡,作者在YOLOv6-N/S使用SimCSPSPPF,YOLOv6-M/L使用SimSPPF blocks;
如表6,anchor輔助訓(xùn)練(AAT)在YOLOv6-S/M/L上,帶來(lái)0.3%/0.5%/0.5%性能提升;在YOLOv6-N/S/M上小目標(biāo)性能顯著提升;
表7表明在YOLOv6-L上weight decay使得性能提升0.6%;
表8表明在YOLOv6-S上DLD帶來(lái)0.7%性能提升;
結(jié)論
作者將YOLOv6進(jìn)一步提升,在實(shí)時(shí)目標(biāo)檢測(cè)領(lǐng)域達(dá)到SOTA。