导读：本期为 AI 简报 20210416 期，将为您带来 7 条相关新闻~
本文一共 2300 字，通篇阅读结束需要 5~8 分钟

1. 训练AI来玩CS反恐精英！清华朱军与剑桥博士后的这项研究太燃了 | 童年回忆 | AI科技评论

Image

论文链接：https://arxiv.org/pdf/2104.04...

Fire in the hole !

在计算机内卷的时代当不了CS人才难道还当不了一名CS人才吗? 不知道你是不是这样想，我是这样想的

继 AI 在游戏界的一系列出色表现之后，如今 AI 终于对射击类游戏下手了！

近日，博士毕业于剑桥大学的Tim pearce与他的清华大学博士后导师朱军教授联合为《反恐精英：全球攻势》开发了一个AI 游戏智能体 —— CSGO 。

据了解，与其他游戏AI不同，CSGO没有使用API，而是采用了一种行为克隆(Behavioural Cloning)的新型解决方案，即从在线服务器上抓取大量人类游戏视频进行对战训练。

目前相关论文《基于大规模行为克隆的反恐精英死亡竞赛》已提交至arXiv上面。论文中指出，CSGO所使用的数据集约有400万帧，与ImageNet大小相当，这一规模比之前在FPS游戏中的模仿学习大了一个数量级。

开发一个 AI 智能体来进行CSGO完全竞争模式的挑战——研究人员认为这篇论文是迈向AI里程碑的一步。

遗憾的是，该项目暂未开源。

2. AI一键去纹身，几秒钟让你看见明星「真面目」 | 机器之心

Github:
https://github.com/vijishmadh...

有些时候，我们需要把一些人身上的纹身覆盖掉，以避免引人效仿。有的时候人们只是单纯地好奇，想知道一些大明星如果没有纹身会是什么样子。来自印度的机器学习研究者 Vijish Madhavan 最近开源的一个机器学习工具 SkinDeep 满足了我们的需求。

有人会问，为什么不把纹身直接 PS 掉？Photoshop 可以产生非常好的效果，但问题是使用 Photoshop 需要专业知识，如果用 PS 处理纹身的话，你可能需要花费几个小时的时间去修饰整个图像。

这一项目是由 Fast.AI 库构建的，你需要安装 fastai 1.0.61 版（及其依赖库），以及 PyTorch 1.6.0，不支持更高的版本。

尝试这一项目的最快方法就是在 Colab 上：

https://colab.research.google...

它的输出限制为 500 像素。

3. DIY一只“眼睛”摄像头看自己工作，能眨眼睛皱眉头，还能“撸” | 大数据文摘

官网：
https://marcteyssier.com/proj...
开源链接：
https://marcteys.github.io/ey...

最近，一位名叫Marc Teyssier的研究员就和他的团队在德国萨尔大学的人机交互实验室里，开发了这样一种不可思议的摄像头——Eyecam。一只肉嘟嘟、可以眨巴眼睛、还能皱眉头的“眼睛”。

不仅有眉毛、睫毛，连眼睛周围的细纹都清晰可见，个头儿也跟真实的眼睛差不多，整体大概是一个人的拳头大小。

除了看起来逼真，在放出的一段视频中，还看到它的“运动”状态-眨眼、扫视

甚至还可以情绪激动的“皱起眉头”。

项目已开源，想做一只属于自己的眼睛吗？

目前，这一项目的全部内容也已经在github上开源，主要使用到了以下几款软硬件的设计：

固件：Arduino程序，用于控制用于移动眼球，眼睑和眉毛的6个伺服电机。它经过优化，可以在Arduino Leonardo Pro Micro上运行。
Raspberry Pi作为相机：如何将Raspberry Pi Zero + Pi Cam转换为标准USB相机
Unity Control界面：附加界面，以视觉方式控制电机并运行计算机视觉处理

4. EfficientNetV2：更小，更快，更好的EfficientNet | AI公园

论文：https://arxiv.org/pdf/2104.00...
代码：
https://github.com/google/aut...

EfficientNets已经成为高质量和快速图像分类的重要手段。它们是两年前发布的，非常受欢迎，因为它们的规模让它们的训练速度比其他网络快得多。

几天前谷歌发布了EfficientNetV2，在训练速度和准确性方面都有了很大的提高。

通过渐进学习，我们的EfficientNetV2在ImageNet和CIFAR/Cars/Flowers数据集上显著优于之前的模型。

通过在相同的ImageNet21k上进行预训练，我们的EfficientNetV2在ImageNet ILSVRC2012上实现了87.3%的top1精度，在使用相同的计算资源进行5到11倍的训练时，比最近的ViT的准确率高出2.0%。

5. 霸榜多个CV任务，开源仅两天，微软分层ViT模型收获近2k star | 机器之心

论文链接：
https://arxiv.org/pdf/2103.14...
项目地址：
https://github.com/microsoft/...

屠榜各大 CV 任务的微软 Swin Transformer，近日开源了代码和预训练模型。

不久前，微软亚研的研究者提出了一种通过移动窗口（shifted windows）计算的分层视觉 Transformer，他们称之为 Swin Transformer。相比之前的 ViT 模型，Swin Transformer 做出了以下两点改进：

其一，引入 CNN 中常用的层次化构建方式构建分层 Transformer；

其二，引入局部性（locality）思想，对无重合的窗口区域内进行自注意力计算。

Swin Transformer 论文公开没多久之后，微软官方于近日在 GitHub 上开源了代码和预训练模型，涵盖图像分类、目标检测以及语义分割任务。上线仅仅两天，该项目已收获 1900

6. Kaggle竞赛中使用YoloV5将物体检测的性能翻倍的心路历程 | 强烈推荐 | AI公园

英文原文：
https://towardsdatascience.co...
Github:
https://github.com/mostafaibr...

作者在kaggle比赛中从建立基线到一步一步的优化过程，最终将performance提升了一倍，非常好的竞赛经验总结文章。

我花了三个月的时间深入研究物体检测。我尝试了很多方法，从实现最先进的模型，如YoloV5、VFNets、DETR，到将目标检测模型与图像分类模型融合以提高性能。在比赛的早期阶段，我努力提高基准模型的分数，但我找不到有用的在线资源，这就是我写这篇文章的原因。我想带你们踏上一段从头到尾的旅程，简要地向你们展示我所走的每一步，我的成绩几乎翻了一倍。

官方的竞赛指标是(mean) Average Precision，这是最常用的目标检测指标之一。为了向你展示每一步的进步，我将在旁边加上它的分数。