建設(shè)網(wǎng)站地圖鄭州網(wǎng)站制作
這是BMVC2022的論文,提出了一個(gè)輕量化的局部全局雙支路的低光照?qǐng)D像質(zhì)量增強(qiáng)網(wǎng)絡(luò),有監(jiān)督。
- 思路是先用encoder f(?)f(\cdot)f(?)轉(zhuǎn)到raw-RGB域,再用decoder gt(?)g_t(\cdot)gt?(?)模擬ISP過程轉(zhuǎn)到sRGB域。雖然文章好像沒有明確指出,但我看 gt(?)g_t(\cdot)gt?(?)過于簡(jiǎn)單,應(yīng)該是在f(?)f(\cdot)f(?)就已經(jīng)進(jìn)行增強(qiáng)了。也就是說,f(?)f(\cdot)f(?)先把暗圖的sRGB轉(zhuǎn)成亮圖的raw-RGB,再轉(zhuǎn)到sRGB域。
- gt(?)=(max(∑cjWci.cj(?),?))γ,ci,cj∈{r,g,b}g_t(\cdot)=(max(\sum_{c_j}W_{c_i. c_j}(\cdot),\epsilon))^\gamma,c_i,c_j\in\{r,g,b\}gt?(?)=(max(∑cj??Wci?.cj??(?),?))γ,ci?,cj?∈{r,g,b}
- 從公式可以看出,decoder是一個(gè)3x3的矩陣WWW,這是一個(gè)簡(jiǎn)化的ISP過程,用3x3的矩陣來模擬ISP的白平衡過程,用?\epsilon?作為下限閾值的γ\gammaγ校正來模擬ISP的非線性映射過程
- f(Ii)=Ii⊙M+Af(I_i)=I_i\odot M+Af(Ii?)=Ii?⊙M+A
- 從公式可以看出,encoder用element-wise的乘和加來實(shí)現(xiàn)逆ISP的過程,并同時(shí)對(duì)圖像進(jìn)行增強(qiáng)。
- 網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示:
- 網(wǎng)絡(luò)結(jié)構(gòu)就不詳細(xì)展開了,結(jié)果而言就是通過網(wǎng)絡(luò)來預(yù)測(cè)上面公式中的M,A,W,γM,A,W,\gammaM,A,W,γ,來實(shí)現(xiàn)增強(qiáng)
- 給出了幾種實(shí)驗(yàn)結(jié)果,一是在LOL和fivek數(shù)據(jù)集上的對(duì)比
- 二是在(Learning multi-scale photo exposure correction(CVPR2021))提出的 exposure correction dataset 上對(duì)比:
- 三是在高層視覺任務(wù)上對(duì)三個(gè)黑暗圖像數(shù)據(jù)集進(jìn)行對(duì)比
- appendix里面給出了一些有意思的分析,和我在研究的方向幾乎一致。
- 文章提出,直接對(duì)暗圖進(jìn)行增強(qiáng)后用訓(xùn)練在正常光照?qǐng)D像上的目標(biāo)檢測(cè)模型去檢測(cè)會(huì)存在“target inconsistency(human vision v.s. machine vision)”,因此應(yīng)該將兩個(gè)網(wǎng)絡(luò)聯(lián)合訓(xùn)練
- 這一實(shí)驗(yàn)結(jié)果顯示,用預(yù)訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行joint training是更有效的方式。也就是說先在增強(qiáng)數(shù)據(jù)集上訓(xùn)練好增強(qiáng)網(wǎng)絡(luò),再和預(yù)訓(xùn)練好的目標(biāo)檢測(cè)模型一起在黑暗圖像目標(biāo)檢測(cè)數(shù)據(jù)集上聯(lián)合訓(xùn)練能夠得到更好的結(jié)果。而我此前之所以出現(xiàn)不好的結(jié)果是因?yàn)槲业木W(wǎng)絡(luò)是無監(jiān)督網(wǎng)絡(luò),從而我會(huì)試圖在聯(lián)合訓(xùn)練時(shí)也為增強(qiáng)網(wǎng)絡(luò)提供增強(qiáng)任務(wù)的損失,而文章的網(wǎng)絡(luò)是有監(jiān)督網(wǎng)絡(luò),它無法實(shí)現(xiàn)這點(diǎn),但卻得到了好的結(jié)果,說明聯(lián)合訓(xùn)練時(shí)不應(yīng)該提供增強(qiáng)任務(wù)的損失。