Happy · 2021年04月06日

CVPR2021|单个网络支持sRGB渲染与RAW数据重建,港科大陈启峰团队提出可逆ISP

首发:AIWalker
作者:HappyAIWalker

AIWalker

image.png

标题&作者团队

Paper:https://arxiv.org/abs/2103.15061

code:https://github.com/yzxing87/I...

本文是港科大陈启峰老师团队在ISP方面的工作,已中CVPR2021。针对传统ISP中的信息损失且难以从sRGB进行RAW数据重建的问题,我们设计了一种可逆图像信号处理方案(InvISP),它可以对RGB渲染与RAW重建进行联合优化。受益于所提方案的可逆性,我们可以直接从sRGB数据重建真实RAW数据且不会造成额外内存开销。所提方法对于raw数据压缩、retouch以及HDR等任务均有非常好的辅助作用。

Abstract

对于图像编辑与计算机视觉而言,未经处理的RAW数据是一种具有高度价值的图像格式。然而,由于RAW数据会导致保存的文件过大,用户往往只能获得处理并压缩后的sRGB图像。

为填补这一空缺,我们设计了一种可逆ISP(Invertible Image Signal Processing)方案,它可以进行sRGB图像的渲染,同时可以复原近乎完美的RAW数据。受益于所提框架的可逆性,我们可以从sRGB数据重建真实RAW数据,而非合成,且不会导致任何额外内存开销。与此同时,我们还集成了可微分JPEG压缩模拟器,这使得所提框架可以直接从JPEG图像重建RAW数据

在两个数码相机上的定量与定性实验表明:相比其他,本文所提方法可以得到具有更高质量的sRGB图像与重建RAW数据

image.png
demo

上图给出了本文所设计的可逆ISP流程示意图以及潜在应用场景。本文的主要贡献有这样几点:

  • 首个从可逆ISP角度出发进行RAW数据重建的方案;
  • 解决了ISP模块中的信息损失问题,且对JPEG压缩鲁棒;
  • 在两个数码相机数据上验证了所提方案的有效性,并在多个应用场景(比如retouch、HDR等)验证了其潜在应用价值。

Traditional ISP Analysis

在正式介绍本文方案之前,我们先来看一下传统ISP对于RAW数据重建存在的挑战。现代数码相机通过ISP(它由一系列操作构成,包含白平衡、去马赛克、降噪、颜色空间转换、色调映射等)将RAW数据渲染为人眼可感知的RGB图像。传统ISP中的每一步都需要针对特定相机进行微调,这使得逆转传统ISP极具挑战。

接下来,我们将对传统ISP中存在信息损失的模块进行分析,并针对对性的进行重设计ISP使其成为一种端到端可逆ISP。

image.png
quantization

  • Quantization & Tone Mapping。ISP的某些步骤(如去马赛克、gamma压缩)包含浮点操作,因此量化对于将数据转换到整数空间非常重要。比如,round操作理论上会带来的灰度误差。然而,tone mapping会进一步放大该灰度误差,上图给出了tonemapping曲线示意图。对于14-bit的raw数据,gamma压缩会使得范围的数据压缩到255灰度,该步骤会导致单像素0.004RMSE误差。因此,直接从8-bit的sRGB数据合成14-bit的RAW数据极具挑战;
  • Out-range Value Clipping。数值截断是一种常用的将raw数值规范化到合理范围的操作,常见于色彩空间转换、去马赛克、降噪、tone mapping等操作。传统ISP需要独立的进行手动调节,导致了误差累积,进一步加剧了信息损失。
  • JPEG Compression。现代数码相机往往将RGB图像保存为JPEG格式,这会进一步加剧RAW图像重建的难度。JPEG包含四个步骤:颜色空间转换、离散余弦变换、量化、熵编码。事实上,量化是JPEG仅有的存在损失且非可微分的步骤。由于JPEG信息损失难以逆转,我们采用了一种“妥协”方式:将JPEG压缩步骤集成到所提框架中以消除信息损失

Invertible Image Signal Processing

image.png

image.png

Differentiable JPEG Simulator

我们的目标是:训练一个鲁棒的可逆ISP,它可以容忍JPEG压缩导致的失真并重建精确的RAW数据。然而JPEG压缩算法是不可微分的,无法直接集成到前述所提端到端方案中。因此,我们提出一种可微分JPEG模拟器以使得所提方案与JPEG压缩鲁棒

由于JPEG中的熵编码是无损的且位于量化之后,因此我们直接跳过该步骤仅仅模拟色彩空间变换、DCT以及量化三个步骤。为模拟DCT过程,我们计算DCT系数并将输入拆分为块,每个块乘以DCT系数得到DCT特征图。在JPEG压缩中,所提DCT图由量化表拆分并round到整数类型。由于round函数不可微分,故而我们基于傅里叶变换设计了一种可微分版round函数,描述如下:
image.png

round

随着K的增大,上述模拟函数会逐渐逼近真实round函数,但运行时间也会同样提升。上图给出了K=10时的round过程示意图。

Experiments

数据集方面:我们从MIT-Adobe FiveK中收集Canon EOS5D(777对)与Nikon D700(590对)子集制作训练与测试数据。我们对每个相机的数据按照比例进行划分;采用LibRaw库处理Raw数据得到sRGB图像;JPEG压缩方面,质量设为90.
image.png

quantitative

上表从定量角度对比了所提方法与UPI、CycleISP等方法的性能对比。可以看到:

  • 相比UPI与CycleISP,所提方法可以重建更精确的RAW数据(PSNR甚至可以高出15dB)。这个结果并不惊讶:因为ISP中的信息损失是非常难以逆转的,这会导致比较差的合成Raw重加结果;而InvISP可以同时进行RGB与RAW重建优化。可以更好的处理量化、JPEG压缩以及数值截断等导致的信息损失。
  • 相比InvGrayScale与UNet基线模型,所提方法同样具有更好的结果,这意味InvISP提供了一个更强的RAW数据重建方案

image.png
qualitative

上图从定性角度对比了所提方法与UPI、CycleISP的可视化效果对比。可以看到:本文所提InvISP可以更好的重建RAW数据,甚至在高光区域都能很好重建

image.png
qualitative

上图从定性角度对比了所提方法与InvGrayscale、UNet的可视化效果。可以看到:InvGrayscale难以在RGB与RAW之间取得比较好的均衡;而Unet可以取得比较的RGB结果,但在RAW重建方面表现较差;本文所提方法可以重建高质量的RAW数据且不会牺牲RGB性能

image.png

compression

上表给出了所提方法在RAW数据压缩方面的性能对比。可以看到:相比有损DNG,所提方法可以进行更高比例的压缩

image.png
retouch&HDR

上图给出了本文所提方法在retouch与HDR方面的应用效果。从中可以看到:

  • 重建RAW数据与相机拍摄的RAW具有无法区分的视觉质量;
  • 所提方法可以消除HDR过程中的过曝区域&欠曝区域的信息损失问题,进而取得更好的HDR重建结果。

推荐阅读

本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏深度学习从入门到精通
推荐阅读
关注数
6197
内容数
191
夯实深度学习知识基础, 涵盖动态滤波,超分辨,轻量级框架等
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息