使用生成對抗網絡(GAN)進行圖像超分辨率(SR)已經在恢復逼真細節方面取得了巨大成功。然而,眾所周知,基于 GAN 的 SR 模型會產生令人難以接受的偽影,特別是在實際場景中。以往的研究通常在訓練階段通過額外的損失懲罰來抑制瑕疵,但這些方法只適用于訓練過程中生成的同分布下的瑕疵類型。而當這些方法應用于真實世界場景中時,我們觀察到這些方法在推理過程中仍然會產生明顯的瑕疵。針對此,來自騰訊 ARC Lab,XPixel 團隊和澳門大學的研究者們提出了 DeSRA 的新方法并發表論文。它能夠對在推理階段中產生的超分瑕疵進行檢測并消除。該論文被 ICML 2023 所接收。
![40d1b7b0-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYmAaymeAACN8pFNoUo194.png)
![wKgZomTYhi6ADQ8lAAew2v7nUa8419.png](https://file1.elecfans.com/web2/M00/90/58/wKgZomTYhi6ADQ8lAAew2v7nUa8419.png)
第一列:低清輸入;第二列:現有超分方法引起瑕疵;第三列:DeSRA 檢測出瑕疵區域;第四列:DeSRA 去除瑕疵
為了緩解瑕疵的生成,LDL [3] 通過分析紋理類型,計算每個像素是瑕疵的概率,并在訓練過程中通過增加損失進而對瑕疵進行抑制。雖然它確實改善了 GAN-SR 的結果,但我們仍然可以觀察到 LDL 在推理真實世界測試數據時會存在明顯瑕疵,如上圖所示。因此,僅僅通過改善模型的訓練很難解決這些瑕疵問題,因為這些瑕疵在 GAN-SR 模型的訓練過程中可能并不出現。 這里我們區分一下 GAN 訓練出現的瑕疵和測試出現的瑕疵:
- GAN 訓練出現的瑕疵(GAN-training artifacts):出現在訓練階段,主要是由于訓練時網絡優化的不穩定和在同分布數據上的 SR 的 ill-pose 導致。在有干凈的高清圖像存在的情況下,可以在訓練過程中對這些瑕疵加以約束,進而緩解瑕疵的生成,如 LDL [3]。
- GAN 推理出現的瑕疵(GAN-inference artifacts):出現在推理階段,這些偽影通常是在真實世界未見過的數據中出現的。這些瑕疵通常不在訓練數據的分布中,并不會在訓練階段出現。因此,通過改善訓練過程的方法(例如 LDL [3])無法解決這些瑕疵問題。
![wKgaomTYhkiAM7kxAAOMxYtiSfg837.png](https://file1.elecfans.com/web2/M00/90/5C/wKgaomTYhkiAM7kxAAOMxYtiSfg837.png)
- 這些瑕疵不會出現在預訓練的 MSE-SR 模型中。
- 這些瑕疵很明顯且面積較大,能夠很容易被人眼捕捉到。上圖展示了一些包含這些瑕疵的樣例。
- 局部紋理復雜性:局部區域 P 內像素強度的標準差 σ(i, j) 來表示局部紋理
![417d6f88-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYmABrvHAAAwMGONv0s724.png)
- 絕對紋理差異 d:兩個局部區域的標準差(x 表示 GAN-SR 區域,y 表示 MSE-SR 區域)
![418ec7b0-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYmAVrSUAAAiEKH1Djw788.png)
- 相對紋理差異 d’:
![4194ab8a-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYmAJhVgAAAyQgtZpyk007.png)
- 歸一化到 [0, 1]:
![41a7be82-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYmAHuHZAAA-FkJ0lec687.png)
- 引入一個常數 C:處理分母相對較小的情況
![41b42168-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYqACNjBAAAtUnRgQOE945.png)
![41c3b20e-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYqAdhNlAAAQNyNxkZo150.png)
![wKgaomTYhmGAcuSJAATt_ByCPT4869.png](https://file1.elecfans.com/web2/M00/90/5C/wKgaomTYhmGAcuSJAATt_ByCPT4869.png)
![42ad3d16-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYqAa5SdAAAhE-t8yes935.png)
![42c3fea2-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYqAHtEUAAACPmfuaD0350.png)
![42ce924a-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYqABUpeAAADxwYc6_8522.png)
![42d39a92-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYqALY3uAAADu0qeHBY978.png)
![42c3fea2-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYqAHtEUAAACPmfuaD0350.png)
![42f2ca0c-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYqAR9kyAARb_z76TYI332.png)
由于缺乏真實世界低分辨率數據的高清參考圖片,經典指標如 PSNR、SSIM 無法采用。因此,研究團隊考慮三個指標來評估檢測結果,包括 1) 檢測到的瑕疵區域與實際的(人工標注的)瑕疵區域之間的交并比(IoU),2) 檢測結果的精確度和 3) 檢測結果的召回率。當用 A 和 B 表示特定區域 z 的檢測到的瑕疵區域和實際的瑕疵區域時,IoU 定義為:
![430fc29c-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYuAQ6obAAAbp0ogLtE190.png)
計算每個圖像的 IoU,并使用驗證集上的平均 IoU 來評估檢測算法。較高的 IoU 意味著更好的檢測準確性。然后,我們將檢測到的瑕疵區域集合定義為 S,正確樣本集合 T 定義為:
![431552de-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYuABTZtAAAcRpQVX_M610.png)
精確度 =
![4325ccea-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYuASrwdAAAD6imIgDY189.png)
![4332f384-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYuAEOWRAAACeUkWCEo704.png)
![433e78a8-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYuAN2aAAAACyQbFeLw289.png)
研究團隊將實際的瑕疵區域定義為 G,并通過以下方式計算檢測到的 GT 瑕疵區域集合 R:
![4343793e-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYuAOBG8AAAbrdb1Wso238.png)
![4350934e-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYuABxsNAAAEBW5cx4Y977.png)
![435daec6-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYyACb4bAAACocQs7i4668.png)
![4367aed0-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYyAFJCcAAAC1dPRqPE270.png)
瑕疵檢測結果 如下表所示,針對 LDL 模型中的瑕疵檢測結果中,本文方法獲得了最好的 IoU 和 Precision,遠遠超過其他方案。需要注意的是,LDL 在 threshold=0.001 時獲得了最高的召回率。這是因為該方案將大部分區域視為瑕疵,因此這種檢測結果幾乎沒有意義。Real-ESRGAN 和 SwinIR 的結果可以參考原文。
![436df5d8-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYyAL-6AAAFU7rw8Roc253.png)
![43990bd8-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYyActi0AAD7fi-f_co149.png)
![43f44a16-3461-11ee-9e74-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9F/9E/wKgZomToPYyAGCfcAACn4jDcom0677.png)
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
物聯網
+關注
關注
2914文章
44939瀏覽量
377081
原文標題:檢測并消除瑕疵,DeSRA讓真實場景超分中的GAN更加完美
文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
低電平靈敏專用儀器的技術原理和應用場景
:低電平靈敏專用儀器還采用先進的信號處理技術,如濾波、校準和自動量程切換等,以進一步提高測量的準確性和可靠性。這些技術能夠消除噪聲干擾、校正測量誤差,并自動適應不同范圍的信號測量。
二、應用場景低電平靈敏
發表于 12-06 14:45
汽車雷達回波發生器的技術原理和應用場景
路場景、不同天氣條件下的目標回波信號,包括距離、速度、角度等參數的精確控制。它利用調頻發射機產生強大的電磁感應動能,并通過收發切換開關將這一動能傳輸給天線。天線隨后將電磁感應動能輻射至空氣中,形成特定方向
發表于 11-15 14:06
納芯微提供全場景GaN驅動IC解決方案
作為當下熱門的第三代半導體技術,GaN在數據中心、光伏、儲能、電動汽車等市場都有著廣闊的應用場景。和傳統的Si器件相比,GaN具有更高的開關頻率與更小的開關損耗,但對驅動IC與驅動電路設計也提出
![納芯微提供全<b class='flag-5'>場景</b><b class='flag-5'>GaN</b>驅動IC解決方案](https://file1.elecfans.com//web1/M00/F5/06/wKgaoWc1UMyALB9-AAEdexmukbU244.jpg)
優可測超景深數碼顯微鏡AH-3000系列 產品手冊
優可測超景深顯微鏡:可進行360°無死角高像素高清觀察;應用于各行各業的瑕疵檢測、材料分析、失效分析、三維檢測等;一臺機器同時替代體式、金相、工具顯微鏡等,達到成本于效率的最大化。
發表于 09-25 14:06
?0次下載
利用TI GaN中的集成電流檢測功能更大限度提高系統效率
電子發燒友網站提供《利用TI GaN中的集成電流檢測功能更大限度提高系統效率.pdf》資料免費下載
發表于 08-29 11:28
?0次下載
![利用TI <b class='flag-5'>GaN</b><b class='flag-5'>中</b>的集成電流<b class='flag-5'>檢測</b>功能更大限度提高系統效率](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
單北斗定位終端的優勢在哪些場景下更加凸顯
單北斗定位終端以其高精度、實時性、廣泛覆蓋及自主可控等優勢,在應急救援、特種行業作業、危險環境監控、物流追蹤及精準農業等場景下更加凸顯其價值。在這些復雜多變的應用環境中,單北斗定位終端不僅確保了定位
![單北斗定位終端的優勢在哪些<b class='flag-5'>場景</b>下<b class='flag-5'>更加</b>凸顯](https://file1.elecfans.com/web2/M00/03/9D/wKgZombFULiABJH6AADTbKPmFnw881.png)
GaN晶體管的應用場景有哪些
GaN(氮化鎵)晶體管,特別是GaN HEMT(高電子遷移率晶體管),近年來在多個領域展現出廣泛的應用場景。其出色的高頻性能、高功率密度、高溫穩定性以及低導通電阻等特性,使得GaN晶體
深圳恒興隆|制造業的新星:高光超精電主軸的崛起...
的多樣化,高光超精電主軸將更加注重定制化服務,滿足不同客戶的個性化需求。
綜上所述,高光超精電主軸作為精密制造領域的重要裝備之一,其高精度、高穩定性和高效率的特點使其成為制造業中不可
發表于 05-13 09:55
會議平板:讓遠程會議更真實、更生動
會議平板:讓遠程會議更真實、更生動 在數字化時代,遠程會議已經成為企業日常溝通的重要方式。然而,傳統的遠程會議方式往往因為溝通障礙、信息傳遞不全等問題,使得參會者難以獲得真實的交流體驗。如今,隨著
評論