计算机视觉在不同领域解决已成为解决实际问题的常用方法,如智慧农牧管理。这类场景并不需要每秒处理许多帧,此时树莓派这类单板主机就派上了用场。
尽管已有诸多针对"Mobile/Edge"等设备的轻量化网络,但这些设备往往面向智能手机切具有高性能处理,而树莓派这类主机的CPU非常低端。
有鉴于此,本文提出了一种CNN-ViT混合网络SBCFormer在低端CPU上取得了最优精度-速度均衡。SBCFormer首次在树莓派4B上以1fps处理取得80.0%精度。
在网络结构方面,不同于已有4阶段设计方法,考虑到树莓派的低端CPU特性,在stem部分直接将分辨率降低到1/8。在Module设计方面,它设计了一种兼顾全局与局部信息建模的SBCFormer Block,其Attention部分与PVT有些类似,看下图还是挺容易看懂的。
作者构建了四个不同大小的SBCFormer,分别为XS、S、B以及L,相关超参配置见下表。
作者所设计SBCFormer与其他轻量型网络在GPU、CPU以及ARM-CPU上的性能精度对比见下表,可以看到:SBCFormer首次以1fps在ARM-CPU上取得了80.0%精度!同等速度下精度大幅优于其他方案!
作者:AIWalker
来源:AIWalker
推荐阅读
- HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法
- GhostSR|针对图像超分的特征冗余,华为诺亚&北大联合提出GhostSR
- ICCV 2023 | 利用双重聚合的Transformer进行图像超分辨率
- ICCV2023 | 将隐式神经表征用于低光增强,北大张健团队提出NeRCo
- NTIRE2023-RTSR-Track2 冠军方案详解
本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏AIWalker。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。