Happy 头像

Happy

2305 声望
公众号:AIWalker 展开

公众号:AIWalker

收起
关注了
0
粉丝数
6149
最新动态
  • 发布了文章 ·
    SwinFIR | 超分领域的"ConvNeXt",值得一看

    看上图,有没有觉得好熟悉?好像是ConvNeXt?对,也不对。它就是超分领域的那个"X":依托SwinIR而衍生出来的SwinFIR。很明显,上图就给出了本文的研究脉络:

    摘要图
  • 发布了文章 ·
    全新范式 | 沈春华老师团队提出无需解码器的目标检测器DFFT

    ViT正在改变目标检测方法的格局。ViT在检测中的一个自然用途是用基于Transformer的主干替换基于CNN的主干,这直接且有效,但代价是为推理带来了相当大的计算负担。更巧妙的做法是DETR系列,它消除了在目标检测中对许多手工设计组件的需求,但引入了需要超长收敛时间的解码器。因此,基于Transformer的目标检测无法在大规...

    摘要图
  • 发布了文章 ·
    MobileOne: 移动端仅需1ms的高性能骨干,你值得拥有!

    MobileOne(≈MobileNetV1+RepVGG+训练Trick)是由Apple公司提出的一种基于iPhone12优化的超轻量型架构,在ImageNet数据集上以<1ms的速度取得了75.9%的Top1精度。

    摘要图
  • 发布了文章 ·
    近距离接触盲图像超分:退化模型、基线以及性能上限

    退化模型在盲图像超分中起着非常重要的作用,经典的退化模型近聚焦于模糊导致其在现实场景的应用能力有限。BSRGAN与Real-ESRGAN的实用性退化模型为盲图像超分的退化模型研究掀开了新的篇章,极大程度提升了图像超分在现实场景的应用。

    摘要图
  • 发布了文章 ·
    恺明团队新作:MAE"入局"视频表达学习

    前段时间,何恺明团队提出MAE在CV届引起极大轰动,自上传到arxiv之后,各种"YYDS", "Best Paper预定"等,关于MAE的介绍可参考以下两个介绍:

    摘要图
  • 发布了文章 ·
    NTIRE2022-ESR 冠军方案RLFN解析

    近年来,Efficient Super-Resolution(ESR)的研究主要聚焦于参数量与FLOPs的降低,这些方案往往通过复杂的层连接策略进行特征聚合(比如IMDN与RFDN中的特征蒸馏与聚合)。但是,这种复杂的结构不利于高推理速度需求,进而导致这些方案难以部署到资源有限的设备上。

    摘要图
  • 发布了文章 ·
    HAT | 探究SwinIR优于RCAN的背后机理,挖掘预训练策略潜能!

    尽管Transformer已在图像超分领域取得了令人惊讶的性能,但从感受野角度来看:Transformer的潜力仍为得到充分挖掘。

    摘要图
  • 发布了文章 ·
    RepSR让BN重回SR怀抱,加速训练效率,同时消除伪影问题

    本文对重参数设计理念进行了重审视,对重参数超分网络的关键成分进行了调查。我们发现:BN层有助于引入训练非线性能力并改善模型性能(这与OREPA一文的出发点相同)。但是,由于BN会恶化超分性能并引入伪影问题,所以超分模型往往会忽视BN层。

    摘要图
  • 发布了文章 ·
    FMEN | NTIRE2021-ESR最低内存占用超分方案

    今天介绍一篇NTIRE2022 Efficient Super Resolution竞赛方案,该方案取得了最低内存占用、第二快的推理速度。推理耗时与内存占用是EISR(Efficient Image Super Resolution)的两个重要考量因素。在该方向上比较知名的方案当属IMDN与RFDN,两者均采用split与concat对蒸馏与聚合的策略进行了探索。相反,序贯式(Sequential)...

    摘要图
  • 发布了文章 ·
    MIRNet重磅升级!MIRNetV2 更快、更强、更轻量

    在正式介绍MIRNetV2之前,我们先来看一下它与MIRNetV1的性能对比,见下表。真可谓,MIRNetV2把MIRNetV1放在地上使劲的“摩擦”!关于MIRNet的介绍,可参见:[链接] 。

    摘要图
  • 发布了文章 ·
    CVPR2022 [盲图像超分] LDL: 消除GAN伪影,打造更实用盲图像超分方案

    图像超分要想具有优异的纹理信息,那么GAN就是必经之路。但是,GAN存在训练不稳定问题与伪影问题。关于GAN的训练不稳定问题,目前已经有了一些trick缓解;但是关于GAN导致的伪影问题,暂无有效的方案。

    摘要图
  • 发布了文章 ·
    真实用!ETH团以合成数据+Swin-Conv构建新型实用盲图像降噪

    关于网络架构设计的动机在于:SwinIR与DRUNet采用两种不同的架构理念达成了非常优秀的性能,是否有可能对两者集成进一步提升PSNR性能呢? - 关于训练数据合成的动机在于:尽管有不少方案在强调退化模型的重要性,但主要聚焦于传感器噪声移除,如何通过改进训练数据达成更优秀的盲去噪性能呢?

    摘要图
  • 发布了文章 ·
    CVPR2022 无需人脸GAN先验,字节团队提出细节可控的人脸超分方案GCFSR

    人脸超分通常依赖人脸先验信息进行细节复原并保持身份信息。受益于GAN先验信息辅助,近来人脸超分取得了长足发展:或者采用复杂的模块对GAN先验进行调制,或者采用复杂训练策略对生成器进行微调。

    摘要图
  • 发布了文章 ·
    NAFNet :无需非线性激活,真“反直觉”!但复原性能也是真强!

    本文提出一种超简基线方案Baseline,它不仅计算高效同时性能优于之前SOTA方案;在所得Baseline基础上进一步简化得到了NAFNet:移除了非线性激活单元且性能进一步提升。所提方案在SIDD降噪与GoPro去模糊任务上均达到了新的SOTA性能,同时计算量大幅降低(可参考下图)。

    摘要图
  • 发布了文章 ·
    视频复原领域YYDS!BasicVSR++再次刷新视频降噪与视频去模糊

    自从BasicVSR提出以来,双向信息流传播已成为视频复原(尤其是视频超分)的标配,不仅取得了NTIRE2021视频增强相关竞赛的冠军,同时基于该思路的方案还取得了MobileAI2021视频超分竞赛的冠军。此外,前段时间刷榜的VRT同样采用了类似的机制。不得不说,对于视频超分而言,BasicVSR的双向信息流传播就是YYDS!不接受辩驳!

    摘要图
  • 发布了文章 ·
    HPUN | 特征下采样真的不适合超分吗?

    尽管通过特征下采样获取多尺度特征融合是一种有效改善视觉识别性能的方案,但是特征下采样对于图像超分一种是反直觉的行为,这是因为超分需要将低分辨率输入映射到高分辨率输出。因此,鲜少在图像超分中看到下采样操作,就算是有,下采样操作也是打“辅助”。前段时间,有一篇paper对此进行了探索并设计了一种新的架构HPUN...

    摘要图
  • 发布了文章 ·
    浙大&字节团队提出全参考IQA蒸馏无参考IQA的CVRKD-IQA方案,大幅提升无参考IQA性能

    本文由浙江大学、字节跳动、华中科技大学和新加坡国立大学合作完成,该工作讨论了如何使用与待评估图像内容无关的高清图作为参考,实现对单张图片质量的评估(IQA)。文中提出的从全参考到内容无关参考的知识蒸馏方案,能够缓解内容无关参考性能的不稳定问题,其评价结果能够与人的主观感受具有高度一致性。本工作已入选...

    摘要图
  • 发布了文章 ·
    273.6FPS!百度开源超轻量实时语义分割方案PP-LiteSeg,兼具高性能与高推理速度

    FLD(Flexible and Lightweight Decoder),它用于降低传统decoder模块的计算负载;

    摘要图
  • 发布了文章 ·
    恺明团队新作ViTDet:探索ViT骨干在检测中的应用

    本文对原生ViT(即non-hierarchical)骨干在目标检测中的应用进行了探索,使得原生ViT架构仅需针对目标检测进行微调而无需设计为分层版本预训练,所提方案能够取得极具竞争力的结果,比如,仅需ImageNet-1K预训练,所提ViTDet即可达到61.3指标(COCO)。令人惊讶的是,我们发现:

    摘要图
  • 发布了文章 ·
    ABPN | 移动端实时超分详解

    今天要介绍的MobileAI2021的图像超分竞赛的最佳方案,无论是PSNR指标还是推理速度均显著优于其他方案,推理速度达到了手机端实时(<40ms@1080P)。

    摘要图
认证与成就
认证信息
AIWalker微信公众号号主
获得 149 次点赞
2020年01月15日 加入
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息