響應(yīng)式網(wǎng)站適合優(yōu)化嗎百度優(yōu)化插件
YOLOv7
- 1 摘要
- 2 網(wǎng)絡(luò)架構(gòu)
- 3 改進(jìn)點
- 4 和YOLOv4及YOLOR的對比
YOLO系列博文:
- 【第1篇:概述物體檢測算法發(fā)展史、YOLO應(yīng)用領(lǐng)域、評價指標(biāo)和NMS】
- 【第2篇:YOLO系列論文、代碼和主要優(yōu)缺點匯總】
- 【第3篇:YOLOv1——YOLO的開山之作】
- 【第4篇:YOLOv2——更好、更快、更強】
- 【第5篇:YOLOv3——多尺度預(yù)測】
- 【第6篇:YOLOv4——最優(yōu)速度和精度】
- 【第7篇:YOLOv5——使用Pytorch框架、AutoAnchor、多尺度預(yù)訓(xùn)練模型】
- 【第8篇:YOLOv6——更高的并行度、引入量化和蒸餾以提高性能加速推理】
- 【第9篇:YOLOv7——跨尺度特征融合】
- 【第10篇:YOLOv8——集成檢測、分割和跟蹤能力】
- 【第11篇:YOLO變體——YOLO+Transformers、DAMO、PP、NAS】
- 【第12篇:YOLOv9——可編程梯度信息(PGI)+廣義高效層聚合網(wǎng)絡(luò)(GELAN)】
- 【第13篇:YOLOv10——實時端到端物體檢測】
- 【第14篇:YOLOv11——在速度和準(zhǔn)確性方面具有無與倫比的性能】
- 【第15篇(完結(jié)):討論和未來展望】
1 摘要
- 發(fā)表日期:2022年7月
- 作者:Wong Kin-Yiu, Alexey Bochkovskiy, Chien-Yao Wang
- 論文:YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
- 代碼:https://github.com/WongKinYiu/yolov7
- 主要優(yōu)缺點:
- 在COCO數(shù)據(jù)集上達(dá)到新的速度與精度平衡;
- 跨尺度特征融合提高對不同尺度物體的檢測能力;
- 改進(jìn)訓(xùn)練過程中的標(biāo)簽分配方式提高訓(xùn)練效率。
2 網(wǎng)絡(luò)架構(gòu)
2022年7月,YOLOv7由YOLOv4和YOLOR的同一組作者發(fā)布在ArXiv上。當(dāng)時,它在5 FPS到160 FPS的速度范圍內(nèi),在速度和精度上超過了所有已知的目標(biāo)檢測器。與YOLOv4一樣,它僅使用MS COCO數(shù)據(jù)集進(jìn)行訓(xùn)練,而沒有使用預(yù)訓(xùn)練的Backbone。YOLOv7提出了一些架構(gòu)上的改進(jìn)和一系列bag-of-freebies,這些改進(jìn)提高了準(zhǔn)確性,但不影響推理速度,只增加了訓(xùn)練時間。
下圖展示了YOLOv7的詳細(xì)架構(gòu)。
3 改進(jìn)點
YOLOv7的架構(gòu)變化包括:
- 擴展高效層聚合網(wǎng)絡(luò)(E-ELAN):ELAN是一種通過控制最短最長梯度路徑,使深度模型能夠更高效地學(xué)習(xí)和收斂的策略。YOLOv7提出了E-ELAN,適用于具有無限堆疊計算塊的模型。E-ELAN通過打亂和合并基數(shù)來結(jié)合不同組的特征,增強網(wǎng)絡(luò)的學(xué)習(xí)能力,而不破壞原始的梯度路徑。
- 基于拼接模型的模型縮放:通過調(diào)整一些模型屬性生成不同大小的模型。YOLOv7的架構(gòu)是基于拼接的架構(gòu),在這種架構(gòu)中,標(biāo)準(zhǔn)的縮放技術(shù)(如深度縮放)會導(dǎo)致過渡層輸入通道和輸出通道之間的比例變化,從而導(dǎo)致模型硬件利用率的下降。YOLOv7提出了一種新的縮放策略,其中塊的深度和寬度以相同的因子縮放,以保持模型的最佳結(jié)構(gòu)。
YOLOv7中使用的bag-of-freebies包括:
- 計劃重參數(shù)化卷積:類似于YOLOv6,YOLOv7的架構(gòu)也受到重參數(shù)化卷積(RepConv)[98] 的啟發(fā)。然而,他們發(fā)現(xiàn)RepConv中的恒等連接會破壞ResNet [61] 中的殘差和DenseNet [109] 中的拼接。因此,他們移除了恒等連接,并將其稱為RepConvN。
- 輔助頭的粗標(biāo)簽分配和主頭的細(xì)標(biāo)簽分配:主頭負(fù)責(zé)最終輸出,而輔助頭則幫助訓(xùn)練。
- 卷積-批量歸一化-激活中的批量歸一化:這將批量歸一化的均值和方差集成到卷積層的偏置和權(quán)重中,以便在推理階段使用。
- 受YOLOR啟發(fā)的隱性知識。
- **指數(shù)移動平均(EMA)**作為最終推理模型。
4 和YOLOv4及YOLOR的對比
YOLOv7相對于同一組作者開發(fā)的先前YOLO模型的改進(jìn)如下:
- 與YOLOv4相比,YOLOv7參數(shù)量減少了75%,計算量減少36%,同時AP提高了1.5%。
- 與YOLOv4-tiny相比,YOLOv7-tiny分別減少了39%的參數(shù)量和49%的計算量,同時保持了相同的AP。
- 與YOLOR相比,YOLOv7分別減少了43%的參數(shù)量和15%的計算量,并且AP略微提高了0.4%。
在MS COCO 2017測試開發(fā)集上的評估顯示,YOLOv7-E6在輸入尺寸為1280像素的情況下,在NVIDIA V100上以50 FPS的速度達(dá)到了55.9%的AP和73.5%的AP50。