为进一步提升调制图像复原视觉质量，先进院董超团队提出集成CResMD与GAN的CUGAN

首发：AIWalker
作者：HappyAIWalker

标题&作者团队

本文是中科院深圳先进技术研究院董超团队在调制图像复原方面的最新力作。该团队在调试图像复原方面的工作从CVPR2019的AdaFM与DNI，到ECCV2020的CResMD，再到本文CUGAN，延续了其一贯简单且实用的风格。本文所提CUGAN当属CResMD的扩展版：引入GAN训练提升纹理细节。

Abstract

调制图像复原水平旨在通过改变影响复原强度的因子生成复原图像。已有工作主要聚焦于优化均方误差，它会带来比较的重建精度，但缺乏细粒度的纹理细节。

本文提出一种CUGAN(Controllable Unet Generative Adversarial Network)用于在调制任务中生成高频纹理，CUGAN由BaseNet与ConditionNet构成。

BaseNet包含生成器与判别器，在生成器中，我们通过天界不同特征的尺度达到控制复原水平的目的。此外，我们对判别器按照退化的严重性自适应调制中间特征。
ConditionNet则接收条件向量(编码了退化信息)作为输入，为生成器与判别器生成调制参数。

在测试阶段，用户可以通过调节条件向量控制输出图像的效果。我们还通过一种简单的过渡方法提供了GAN和MSE效应之间的平滑过渡。实验结果表明：所提CUGAN可以在调制图像复原任务上取得非常优秀的性能。

本文贡献包含以下几点：

提出一种新颖的基于GAN的调制图像复原框架CUGAN；
提出一种带全局特征调制的判别器以缓解生成器在严重退化时的梯度消失问题；
合成数据与真实数据验证了所提CUGAN在调制图像复原方面的优异性能。

Method

本文目标在于设计一种基于GAN的图像复原模型，它以退化图像核期望的复原信息作为输入，输出视觉友好的复原图像。这里的复原信息等价于退化信息，可以通过滑动条方式让用户在测试阶段调节。

给定通过某些退化方式得到的退化图像，我们期望将其复原为并与真值图像尽可能相似。为使得模型可以处理不同退化程度图像，我们引入了一个条件向量。具体来说，的每一维表示特定的退化类型，其值表示退化程度。因此我们的任务是寻找这样一个函数：。此外，我们引入了条件判别器，用于判别复原图像与真值图像在条件下的差异性。下图给出了本文所提CUGAN的框架示意图。

Base Networks

BaseNet由生成器Ｇ与判别器Ｄ构成，生成器Ｇ以退化图像作为输入，输出复原结果；判别器Ｄ则旨在对生成结果与真值进行真假判别。

Generator 架构见上面的Figure3，它是一种集成残差模块的UNet架构。G包含三个尺度：。相比普通网络，这种多尺度架构有助于获得更好的GAN调制结果。对于每个尺度，在左右分别有两个残差模块；尺度间通过的卷积和反卷积衔接。此外，我们还添加了全局链接以环节轻微退化时的复原难度。

Discriminator 它以图像块作为输入，输出预测结果，其架构见Figure3。我们参考SRGAN设计将输入逐渐下采样为特征向量。判别器总结有10个卷积，采用LeakyReLU激活函数，最后采用GAP+两个全连接层输出最后的概率。