导读:本期为 AI 简报 20201211 期,将为您带来 8 条相关新闻,有趣有料~本文一共 2500 字,通篇阅读结束需要 4~7 分钟
1. 目标检测可达40fps! 标称2.0TOPS的RV1126性能评估实测
知乎者也:
应朋友的委托,希望我来帮忙评估一下RV1126(RV1109)的AI性能。这两款芯片是pin2pin的,RV1109的算力为1.2Tops,RV1126的算力为2.0Tops。参与评估的网络为典型的Resnet50。rv11xx的sdk是淘宝上花25 RMB买的(2020-11-24release的版本),评估板也是淘宝上淘的一块人脸识别面板机,里面用的是rv1126的soc。
还是老样子,我们将porting部署进行一下流程拆分:
1、推理图优化
2、int8模型量化
3、native层性能评估业务代码。
交叉编译后push到板子上进行了性能评估,resnet50的网络,输入为224x224,100次推理的平均耗时为25ms左右,基本跟rk提供的profile的性能文档可以对上。
2. AI消除马赛克,GitHub开源项目上线三天收获近7000星
Github:
最近,一个名为 Depix 的 GitHub 项目爆火,上线三天 star 量已经高达 6.9k。项目作者 Sipke Mellema 是一名信息安全顾问。
Depix 能够从像素化图像截图中恢复原图中包含的文字密码。该项目适用于使用线性方框滤波器(linear box filter)创建的像素化图像。如上图所示,项目作者给出了像素化图像、恢复之后的效果和原图的对比结果。
马赛克打得够严实了,不过 Depix 还是基本解读出了被隐藏的信息。
使用 Depix 从像素化图像截图中恢复文字密码,操作也比较简单:
- 从截图中分割出矩形像素化 block;
- 在具有相同字体设置(包括文本大小、字体、颜色、hsl)的编辑器中,粘贴待处理字符的德布鲁因(De Bruijn sequence)。
- 给该序列截图,尽可能使用和像素化图像相同的截图工具。
- 执行命令:
1python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.png
视频链接:
坐拥“后宫佳丽三千”的皇帝到底长啥样?
最近,凭借修复老北京影像火爆全网的硬核Up主大谷@Spitzer,再次借助人工智能技术修复了历代皇帝的人物画像。不仅让八位皇帝的相貌活灵活现地展现在我们面前,而且还加入人脸识别用能,用AI匹配了最佳扮相的明星脸…….
昨晚这条视频一发布便冲上了微博热搜,目前全网转发浏览量已近千万,那么#人工智能还原的明清皇帝#到底长啥样?
乾隆最帅,老朱家的都很富态。
4. 53年来国内唯三,MindSpore加速昇腾芯片论文获国际顶会MICRO最佳论文提名
“研究芯片光砸钱不行,要砸数学家、物理学家。”
任正非今年5月在接受《科技日报》专访时如是说。据任正非透露,华为已拥有700多名数学家。
最近,来自郑州数学工程与先进计算国家重点实验室的赵捷老师与华为MindSpore团队合作,凭借着在基础数学上的能力,解决了一个AI芯片优化的重要问题,获得了顶级学术会议MICRO 2020的最佳论文提名,MICRO是计算机体系结构领域的国际顶级会议,这也是中国团队53年第3次入围该大会的最佳论文提名。
这篇论文主要研究了如何优化在AI芯片上的程序编译,尽可能的“榨干”AI芯片的性能,不仅支持对华为自研的昇腾910芯片,也支持现在主流的NVIDIA A100/V100 GPU,今后还会支持更多硬件。
在CPU上,其方法相较PolyMage和Halide分别平均性能提升了20%和33%。在GPU上,其方法比Halide提供了17%的平均性能改进。在AI芯片华为昇腾910上,该论文提出的方法可将ResNet-50模型整个执行时间提升16%。
2020年即将结束,回望这一年,有哪些亮眼的目标检测论文给你带来启发或者帮助呢?
上半年的DETR掀起了基于Transformer的CV论文浪潮,不少人调侃留给Transformer攻克的CV方向不多了,比如检测、分割、深度估计、车道线检测等领域均被"染指"。同在上半年,还有YOLOv4、YOLOv5等不错的工作。**
下半年的好工作也不少,比如本文介绍的刚开源的Deformable-DETR,还有近期发布的Sparse R-CNN和DeFCN等工作。
这三篇目标检测论文刚刚开源了
- AutoAssign
- Deformable DETR
- DeFCN
6. 全面超越BN/GN/LN/IN!归一化新方法BGN,解决因Batch Size大小带来的训练不稳定问题
Paper:
深度卷积神经网络(DCNNs)训练起来既困难又耗时。规范化是一种有效的解决方案。在以往的归一化方法中,批处理归一化(BN)在大、中批量处理中表现良好,对多个视觉任务具有很好的通用性,但在小批量处理中,其性能下降明显。
作者实验发现在超大Batch下BN会出现饱和(比如,Batch为128),并提出在小/超大Batch下BN的退化/饱和是由噪声/混淆的统计计算引起的。因此,在不增加新训练参数和引入额外计算的情况下,通过引入通道、高度和宽度维度来补偿,解决了批量标准化(BGN)在小/超大Batch下BN的噪声/混淆统计计算问题。
利用GN中的组方法和超参数G来控制统计计算所使用的特征实例的数量,从而对不同批量提供既无噪声也不混淆的统计量。实验结果证明BGN优于BN、IN、LN、GN以及PN;
该方法在图像分类、神经结构搜索(NAS),对抗的学习,小样本学习以及无监督学习领域适应(UDA)都有很好的性能、鲁棒性。例如,在ImageNet上训练设置Batch=2进行训练ResNet-50,BN的Top1准确率为66.512%,BGN的Top1准确率为76.096%,精度有显著的提高。
7. 狂揽2500星,开源十六进制编辑器登顶GitHub热榜
Github:https://github.com/WerWolv/ImHex
者也:
常用的十六进制编辑器有 Bless Hex Editor、GNOME Hex Editor、Okteta 等。和大多数编辑器一样,人们对于十六进制编辑器的要求包括功能强大、可定制性、界面美观。
近日,GitHub 上开源了一款名为 ImHex 的十六进制编辑器,对视力极其友好,上线 5 天,狂揽 2500 star。
截至到12月11日,Star 已经涨至 5.3k
项目作者在 readme 文件中首先介绍了 ImHex 编辑器实现的功能特性。
8. Github黑暗模式正式发布,Reddit直接飙至4k高赞
Dark mode 设置地址:
在 GitHub Universe 2020上,其中发布的新特性中最大的改变就是正式推出了黑暗模式,同时还宣布了针对公司的 GitHub 赞助功能,允许公司对关心的开源项目进行投资等。
你是否有过打开电脑被晃「瞎」的感觉?
最近,在GitHub Universe上,一款「暗黑」模式被推了出来。
官方自称:「2020年宇宙新功能」。
今年GitHub大会新功能主要有:
- Dark mode
- GitHub Sponsors for Companies
- Auto-merge pull requests
- Discussions
- Actions
RT-Thread
让物联网终端的开发变得简单、快速,芯片的价值得到最大化发挥。Apache2.0协议,可免费在商业产品中使用,不需要公布源码,无潜在商业风险。
推荐阅读
华为“鸿蒙”所涉及的微内核到底是什么?一文带你认识微内核
【20201204期嵌入式AI周报】深度学习框架Bolt v1.0发布
如何用最小的消耗来实现RT-Thread IPC点灯呢?
原文链接:https://mp.weixin.qq.com/s/4-1lElU9xeFFGe_OdaRH8A
转载已获授权,禁止二转