Happy · 2023年02月27日

南京大学&港中文提出首个支持超高分辨率(10000x10000)图像风格迁移方案

image.png

paper:https://arxiv.org/abs/2103.11784

code:https://github.com/czczup/URST

本文是南京大学&香港大学的路通&罗平等人在风格迁移领域的一次突破性探索,提出了首个支持超高分辨率(比如10000x10000大小)图像风格迁移的方案URST。针对现有风格迁移模型在图像块处理时存在的块间不一致问题,提出了一种新颖的“Thumbnail Instance Normalization”;与此同时,针对高分辨率图像风格迁移存在的“small stroke size”问题,提出了一种新颖的辅助损失。所提方案可以轻易与现有风格迁移网络组合并取得性能提升。

Abstract

本文提出一种非常简单的极限分辨率的风格迁移框架URST,首个可以处理任意高分辨率(比如)图像的进行风格迁移的方案。当处理超高分辨率图像时,受限于较大的内存占用与small stroke size问题,现有风格迁移方法往往难以真正应用。

URST通过以下两种策略避免了超高分辨率图像导致的内存问题:(1) 将图像划分成小的图像块进行处理;(2)提出一种新颖的Thumbnail Instance Normalization (TIN)进行块级风格迁移。具体来说,TIN可以提取缩略图的规范化统计信息并应用到小图像块上,确保了不同块之间的风格一致性。

总而言之,相比已有方案,本文所提URST具有这样几个优点:

  • 通过将图像拆分为小块并采用TIN成功的对任意高分辨图像进行风格迁移;
  • 受益于所提感知损失,所提方法在超高分辨率图像上取得了超过其他SOTA方案的效果;
  • 所提URST可以轻易的嵌入到现有风格迁移方案中,无需进行训练即可提升其性能。

Introduction

超高分辨率图像风格迁移存在两个关键性挑战:

  • 超高分辨图像需要非常大的内存占用,甚至超出现有GPU的最大显存;
  • 过小的笔画描边会导致不自然的纹理。

image.png

针对第一个问题,现有方法往往采用轻量型网络、模型剪枝、知识蒸馏等方法降低显存占用。然而这些方法仅仅能起到缓和的作用,以上图为例,随着分辨率的提升,显存的占用呈指数增长,很快超出了现有GPU的峰值。这就驱动我们设计一种更有效的策略用于超高分辨率图像的风格迁移

image.png

超高分辨率图像的笔画边缘过小会呈现出不自然的现象,可参考上图(b)。增大笔画边缘是一种广泛采用的解决上述问题的方法;此外扩大风格迁移网络的感受野是另一种解决方案。然而这些方法并不适用于超高分辨率风格迁移。

为解决上述问题,本文提出了URST用于对任意高分辨率图像在有限内存约束下进行风格迁移,效果可参考上图(d)。

Method

image.png

上图给出了本文所提URST的整体框架示意图。所提方案包含三个关键设计思想:

  • 一种灵活的块级风格迁移,它可以将高计算量的风格迁移任务拆分为多个地计算量的块级风格迁移;
  • 提出一种新颖的缩略图实例规范化TIN,它可以提取缩略图规范化统计信息并将其应用到小图像块上以确保不同块间的风格一致性;
  • 精心设计了一种笔画感知损失以聚焦于笔画边缘的感知差异,促使风格迁移网络生成大的笔画边缘。

image.png

由于该方案中的风格迁移网络可以是任意方法(比如AdaIN、LinearWCT),为方便起见,我们定义所选择方法原始损失为,在训练过程中,我们首先采用原始损失基于缩略图优化风格迁移网络。

image.png

Patch-wise Style Transfer

image.png

相比已有方法采用完整图像作为输入,所提框架可以灵活的处理任意高分辨率图像,同时也可以轻易嵌入到现有风格迁移方法(比如AdaIN、WCT、LinearWCT)中。正如前面所提到的,由于不同块的统计特性独立性,不同图像块的风格化可能存在不一致性问题。

Thumbnail Instance Normalization

image.png

然而,我们发现IN并不适用于块级风格迁移,会导致块间风格不一致问题,可参考下图。

image.png

在上图(a)中,我们对输入作为整体进行规范化;在上图(b)中我们将输入拆分为四块分贝进行规范化。这就导致最终的结果存在风格不一致问题。

image.png

通过这种方式,TIN可以确保不同块间的风格一致性间,上图(c)。

Stroke Perceptual Loss

所提方法驱动我们提出一种辅助损失增大笔画边缘,该损失定义如下:
image.png

Experiments

为验证所提方法的有效性,我们将其与AdaIN、WCT等方法进行了对比,见下图。

image.pngimage.png

从上图可以看到:(1) IN导致了明显的块间风格不一致问题;(2) 所提方法取得了与全图相似的效果且显存占用更低

image.png

与此同时,我们还对比了所提损失函数的影响分析,见上图。可以看到:基于所提损失引导,这些模型可以生成更粗的线条与更稀疏的纹理,这有助于改善超高分辨率风格迁移

image.png
此外,我们还提供了不同风格迁移方案在不同输入分辨率输入时的显存占用对比。可以看到:大多方法甚至不能处理的高分辨率图像;而本文所提方法甚至可以处理分辨率图像且显存占用不超过5GB。理论上,本文所提方法可以处理任意高分辨率图像。

最后,我们提供一个超高分辨率图像风格迁移效果图作为结尾。

image.png

来源:AIWalker
作者: Happy

推荐阅读

本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏AIWalker。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。
推荐阅读
关注数
6199
内容数
192
夯实深度学习知识基础, 涵盖动态滤波,超分辨,轻量级框架等
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息