Happy · 2021年04月13日

CVPR2021|将无监督对比学习与超分相结合

首发:AIWalker
作者:HappyAIWalker

image.png
标题&作者团队

paper:https://arxiv.org/abs/2104/00416

code:https://github.com/LongguangW...

本文是国防科大的王龙光等人关于盲图像超分的最新工作,已被CVPR2021接收。作者创新性的将对比学习机制引入到退化表达学习中,并用所得退化表达对后接超分网络中的特征进行调制。受益于对比学习的进展,本文所设计的退化表达学习模块可以从LR图像提取出关于退化信息的精确特征表达;受益于特征表达的数据自适应提取与超分网络的退化调制,所提超分方法在盲图像超分方面取得了SOTA结果。

Abstract

现有基于CNN的图像超分往往假设退化方式固定且已知(比如bicubic/blur-down),然而,当真实退化与之不同时模型性能就出现严重的下降。为处理真实场景中的各式未知退化,之前的方法往往依赖于退化估计进行超分图像重建。然而,退化估计过于耗时且存在一定的估计误差,这会导致超分效果的不理想。

本文提出一种无监督退化表达学习机制并用于盲图像超分,无需显示退化估计。具体来说,我们在表达空间中学习特征表达用于辨别不同的退化,而非像素空间的显示估计。更进一步,我们引入一种退化感知超分网络(DASR),它可以基于所学习表达进行灵活自适应超分。

实验表明:本文所提退化表达学习机制可以提取极具辨别性的表达以获得精确的退化信息。合成数据与真实图像上的实验表明:所提方法在盲超分任务上取得了SOTA性能。

Degradation Representation Learning

退化表达学习的目的:采用无监督方式从LR图像中提取一个极具辨别力的表达。下图给出了本文所提退化表达学习示意图,它是一种对比学习框架。该退化表达学习的一个先验假设:同一图像的退化是相同的,而不同图像的退化是不同的。

image.png
degradation

image.png

Degradation-Aware SR

image.png
dasr

上图给出了本文所提退化感知超分(DASR)架构示意图,该网络由退化感知模块DABlock作为核心模块,同时采用了RCAN中的核心模块架构。DASR包含5个残差组,每个残差组包含5个DABlock。

在每个DABlock内,两个DA卷积层结合退化表达对特征进行自适应调节。受启发于:不同复原等级的卷积核具有相似的模式但不同的统计信息。本文所设计的DA卷积在退化表达的基础上预测深度卷积的核参数。具体来说,退化表达R送入到两个FC层并reshap为卷积核;然后输入特征F采用该深度卷积及后接卷积处理得到。更进一步,受启发于CResMD,DA卷积同时还基于退化表达学习了调制系数。具体来说,R送入到另两个FC层以及Sigmoid激活生成通道级调制系数,然后对F的不同通道进行缩放调整得到。最后上述所得两个特征相加并送入到后续层生成输出特征。

Experiments

训练数据方面,我们基于DIV2K与Flickr2K,采用不同的高斯模糊进行退化(对于x2/3/4超分,模糊核宽度分辨为)并附加加性高斯噪声(通过两个随机特征值、旋转角度确定),噪声水平的范围为。测试数据则采用了常规的Set5、Set14、B100以及Urban00.

Noise-Free Degradation

image.png

noise-free

上表给出了无噪退化情形下的模型性能对比,可以看到:

  • 当移除退化表达学习后,模型无法处理多种退化问题,具有更低的PSNR;
  • 受益于动态卷积核与通道调制系数,所提方法对不同退化均生成了更好的结果;
  • 相比对退化估计极为敏感的SRMDNF,受益于退化表达学习,所提方法取得了更好的盲超分性能。

image.png

sota-noise-free

上表给出所提方法与RCAN、SRMD、MZSR、IKC等方法的性能对比。从中可以看到:

  • RCAN在bicubic退化方面取得了最佳PSNR,然而当退化与bicubic不同时模型出现了严重的性能下降问题;
  • 尽管SRMDNF与MZSR可以对估计的退化自适应调整,但这些方法对退化估计过于敏感,限制了其超分性能;
  • 所提DASR对不同退化取得了最佳性能,同时具有更少的推理时间。

image.png

noise-free-visual

上图还给出了不同方法的视觉效果对比,本文所提DASR取得了最佳视觉效果。

Anisotropic Gaussian Kernel and Noise

image.png

general-degradation

上表对了不同方法在广义退化方面的性能对比,可以看到:

  • 在复杂退化方面,DnCNN+RCAN取得了相对低的性能;
  • 由于SRMDNF对于退化估计的敏感性,DnCNN+SRMDNF+Predictor在复杂退化方面的性能极为有限;
  • 通过迭代校正估计的退化,IKC取得了优于SRMDNF的性能,然而IKC过于耗时;
  • 受益于退化表达学习,本文所提方法取得了最佳的超分性能,同时具有比IKC更快的推理速度。

image.png

general-visual

上图给出了所提方法与其他在复杂退化方面的可是话效果对比。很明显,所提方法具有更好的视觉质量;而其他方法则存在不同程度的伪影问题。

Real Degradation

image.png
real

最后,我们看一下在真实退化数据上的可视化效果,见上图。可以看到:DASR生成的结果具有更加的视觉效果,清晰的边缘,更少的模糊伪影。

推荐阅读

本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏深度学习从入门到精通
推荐阅读
关注数
6194
内容数
191
夯实深度学习知识基础, 涵盖动态滤波,超分辨,轻量级框架等
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息