【20201211期AI简报】目标检测可达40fps! 标称2.0TOPS的RV1126性能评估实测

导读：本期为 AI 简报 20201211 期，将为您带来 8 条相关新闻，有趣有料~
本文一共 2500 字，通篇阅读结束需要 4~7 分钟

1. 目标检测可达40fps! 标称2.0TOPS的RV1126性能评估实测

知乎者也：
https://zhuanlan.zhihu.com/p/...

应朋友的委托，希望我来帮忙评估一下RV1126（RV1109）的AI性能。这两款芯片是pin2pin的，RV1109的算力为1.2Tops，RV1126的算力为2.0Tops。参与评估的网络为典型的Resnet50。rv11xx的sdk是淘宝上花25 RMB买的（2020-11-24release的版本），评估板也是淘宝上淘的一块人脸识别面板机，里面用的是rv1126的soc。

还是老样子，我们将porting部署进行一下流程拆分：
1、推理图优化
2、int8模型量化
3、native层性能评估业务代码。

交叉编译后push到板子上进行了性能评估，resnet50的网络，输入为224x224，100次推理的平均耗时为25ms左右，基本跟rk提供的profile的性能文档可以对上。

2. AI消除马赛克，GitHub开源项目上线三天收获近7000星

Github:
https://github.com/beurtschip...

最近，一个名为 Depix 的 GitHub 项目爆火，上线三天 star 量已经高达 6.9k。项目作者 Sipke Mellema 是一名信息安全顾问。

Depix 能够从像素化图像截图中恢复原图中包含的文字密码。该项目适用于使用线性方框滤波器（linear box filter）创建的像素化图像。如上图所示，项目作者给出了像素化图像、恢复之后的效果和原图的对比结果。

马赛克打得够严实了，不过 Depix 还是基本解读出了被隐藏的信息。

使用 Depix 从像素化图像截图中恢复文字密码，操作也比较简单：

从截图中分割出矩形像素化 block；
在具有相同字体设置（包括文本大小、字体、颜色、hsl）的编辑器中，粘贴待处理字符的德布鲁因（De Bruijn sequence）。
给该序列截图，尽可能使用和像素化图像相同的截图工具。
执行命令：

1python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.png

3. 爆火上热搜！AI『复活』八代帝王众生相

视频链接：
https://www.bilibili.com/vide...

坐拥“后宫佳丽三千”的皇帝到底长啥样？

最近，凭借修复老北京影像火爆全网的硬核Up主大谷@Spitzer，再次借助人工智能技术修复了历代皇帝的人物画像。不仅让八位皇帝的相貌活灵活现地展现在我们面前，而且还加入人脸识别用能，用AI匹配了最佳扮相的明星脸…….

昨晚这条视频一发布便冲上了微博热搜，目前全网转发浏览量已近千万，那么#人工智能还原的明清皇帝#到底长啥样？

乾隆最帅，老朱家的都很富态。

4. 53年来国内唯三，MindSpore加速昇腾芯片论文获国际顶会MICRO最佳论文提名

“研究芯片光砸钱不行，要砸数学家、物理学家。”

任正非今年5月在接受《科技日报》专访时如是说。据任正非透露，华为已拥有700多名数学家。
最近，来自郑州数学工程与先进计算国家重点实验室的赵捷老师与华为MindSpore团队合作，凭借着在基础数学上的能力，解决了一个AI芯片优化的重要问题，获得了顶级学术会议MICRO 2020的最佳论文提名，MICRO是计算机体系结构领域的国际顶级会议，这也是中国团队53年第3次入围该大会的最佳论文提名。
这篇论文主要研究了如何优化在AI芯片上的程序编译，尽可能的“榨干”AI芯片的性能，不仅支持对华为自研的昇腾910芯片，也支持现在主流的NVIDIA A100/V100 GPU，今后还会支持更多硬件。
在CPU上，其方法相较PolyMage和Halide分别平均性能提升了20%和33%。在GPU上，其方法比Halide提供了17%的平均性能改进。在AI芯片华为昇腾910上，该论文提出的方法可将ResNet-50模型整个执行时间提升16%。

5. 这三篇目标检测论文刚刚开源了！

2020年即将结束，回望这一年，有哪些亮眼的目标检测论文给你带来启发或者帮助呢？

上半年的DETR掀起了基于Transformer的CV论文浪潮，不少人调侃留给Transformer攻克的CV方向不多了，比如检测、分割、深度估计、车道线检测等领域均被"染指"。同在上半年，还有YOLOv4、YOLOv5等不错的工作。**

下半年的好工作也不少，比如本文介绍的刚开源的Deformable-DETR，还有近期发布的Sparse R-CNN和DeFCN等工作。

这三篇目标检测论文刚刚开源了

AutoAssign
Deformable DETR
DeFCN

6. 全面超越BN/GN/LN/IN！归一化新方法BGN，解决因Batch Size大小带来的训练不稳定问题

Paper:
https://arxiv.org/abs/2012.02782

深度卷积神经网络(DCNNs)训练起来既困难又耗时。规范化是一种有效的解决方案。在以往的归一化方法中，批处理归一化(BN)在大、中批量处理中表现良好，对多个视觉任务具有很好的通用性，但在小批量处理中，其性能下降明显。
作者实验发现在超大Batch下BN会出现饱和（比如，Batch为128），并提出在小/超大Batch下BN的退化/饱和是由噪声/混淆的统计计算引起的。因此，在不增加新训练参数和引入额外计算的情况下，通过引入通道、高度和宽度维度来补偿，解决了批量标准化(BGN)在小/超大Batch下BN的噪声/混淆统计计算问题。
利用GN中的组方法和超参数G来控制统计计算所使用的特征实例的数量，从而对不同批量提供既无噪声也不混淆的统计量。实验结果证明BGN优于BN、IN、LN、GN以及PN；
该方法在图像分类、神经结构搜索(NAS)，对抗的学习,小样本学习以及无监督学习领域适应(UDA)都有很好的性能、鲁棒性。例如，在ImageNet上训练设置Batch=2进行训练ResNet-50，BN的Top1准确率为66.512%，BGN的Top1准确率为76.096%，精度有显著的提高。

7. 狂揽2500星，开源十六进制编辑器登顶GitHub热榜

Github：
https://github.com/WerWolv/ImHex
者也：
https://zhuanlan.zhihu.com/p/...

常用的十六进制编辑器有 Bless Hex Editor、GNOME Hex Editor、Okteta 等。和大多数编辑器一样，人们对于十六进制编辑器的要求包括功能强大、可定制性、界面美观。
近日，GitHub 上开源了一款名为 ImHex 的十六进制编辑器，对视力极其友好，上线 5 天，狂揽 2500 star。
截至到12月11日，Star 已经涨至 5.3k
项目作者在 readme 文件中首先介绍了 ImHex 编辑器实现的功能特性。

8. Github黑暗模式正式发布，Reddit直接飙至4k高赞

Dark mode 设置地址：
https://github.com/settings/a...

在 GitHub Universe 2020上，其中发布的新特性中最大的改变就是正式推出了黑暗模式，同时还宣布了针对公司的 GitHub 赞助功能，允许公司对关心的开源项目进行投资等。

你是否有过打开电脑被晃「瞎」的感觉？

最近，在GitHub Universe上，一款「暗黑」模式被推了出来。

官方自称：「2020年宇宙新功能」。

今年GitHub大会新功能主要有：

Dark mode
GitHub Sponsors for Companies
Auto-merge pull requests
Discussions
Actions

RT-Thread

让物联网终端的开发变得简单、快速，芯片的价值得到最大化发挥。Apache2.0协议，可免费在商业产品中使用，不需要公布源码，无潜在商业风险。

原文链接：https://mp.weixin.qq.com/s/4-1lElU9xeFFGe_OdaRH8A
转载已获授权，禁止二转

推荐阅读

目录