导读:本期为 AI 简报 20210312 期,将为您带来 8 条相关新闻,今日植树节,考研国家线已出,祝大家顺利上岸~本文一共 2300 字,通篇阅读结束需要 6~10 分钟
1. 二次元妹子五官画风都能改,周博磊团队用无监督方法控制GAN | CVPR 2021 | 量子位
图片
论文地址:
https://arxiv.org/abs/2007.06600
现在,GAN不仅能画出二次元妹子,还能精准调节五官、表情、姿势和绘画风格。
而且在调控某个因素的时候,其他条件能尽量保持不变。
这就是香港中文大学周博磊团队提出的SeFa(语义分解,Semantics Factorization),该论文最近入选了CVPR 2021(Oral)。
SeFa适用于PGGAN、StyleGAN、BigGAN和StyleGAN2等常见GAN模型。
通过这种方法分离出映射矩阵的各个本征值,即可实现对不同图像元素的精准调控
更重要的是,SeFa无需对GAN生成的数据进行标注,它能自己找到这些元素变化对应的编码。也就说SeFa是一种无监督方法。
目前,SeFa相关代码已经开源。
2. 游戏“捏脸”需要高手教程?用这个AI模型,一张肖像照就能快速生成 | 学术头条
论文地址:https://arxiv.org/abs/2102.02371
代码地址:
在游戏中,亲手创造一个与众不同的角色,乐趣不言而喻。但有时往往是“游戏五分钟,捏脸两小时”。
来自网易伏羲 AI 实验室和密歇根大学的研究人员最近发明了一种深度学习的方法,名为 MeInGame,它可以通过分析一个人脸的单个肖像而自动生成游戏人物脸,这项技术在 arXiv 上预先发表的一篇论文中提出。
不少捏脸高手为了在游戏中捏出一个指定人物的脸可谓煞费苦心,甚至总结了一套复杂的教程和参数包,而今后,可能只需要输入一张人脸照片就能轻松搞定了。
MeInGame 的贡献在于:
1、提出了一种低成本的三维人脸数据集生成方法。所创建的数据集在种族和性别上是平衡的,面部形状和纹理都是从原始图像中创建;
2、提出了一种将重建的三维人脸形状转化为游戏网格的方法,可以直接在游戏环境中使用,该方法不依赖于网格连通性,计算效率高;
3、为了消除光照和遮挡的影响,他们训练了一个神经网络,在一个通用的训练范式下,从 “野生” 人脸图像中预测一个完整的漫反射贴图。
3.《30天吃掉那只 TensorFlow2.0 》
代码地址:https://github.com/lyhue1991/eat\_tensorflow2\_in\_30\_days#30%E5%A4%A9%E5%90%83%E6%8E%89%E9%82%A3%E5%8F%AA-tensorflow2
本书是一本对人类用户极其友善的TensorFlow2.0入门工具书,不刻意恶心读者是本书的底限要求,Don t let me think是本书的最高追求。
本书主要是在参考TensorFlow官方文档和函数doc文档基础上整理写成的。
但本书在篇章结构和范例选取上做了大量的优化。
不同于官方文档混乱的篇章结构,既有教程又有指南,缺少整体的编排逻辑。
本书按照内容难易程度、读者检索习惯和TensorFlow自身的层次结构设计内容,循序渐进,层次清晰,方便按照功能查找相应范例。
如果说通过学习TensorFlow官方文档掌握TensorFlow2.0的难度大概是9的话,那么通过学习本书掌握TensorFlow2.0的难度应该大概是3。
本书是作者利用工作之余和疫情放假期间大概2个月写成的,大部分读者应该在30天可以完全学会。
预计每天花费的学习时间在30分钟到2个小时之间。
4. 为了杀蚊子,这位博士用树莓派DIY了一把激光枪,网友:伤到人怎么办? | 学术头条
世人苦蚊子久矣。
尤其在夏夜,耳边嗡嗡作响,甚至还得与其“挑灯夜战”个三百回合。
为此,一个国外博士便DIY了一种高端的杀蚊方式:
计算机视觉精准定位,激光瞬间射杀。
还是用树莓派打造的那种。
如此高端的杀蚊方式,都需要些什么装备?
主要包括四大组件:
- 200多块的树莓派3 Model B+:它采用的是1.4GHz四核处理器,具体型号为Broadcom BCM2837B0。
- 树莓派摄像头:具体型号是索尼IMX219,像素为800万。
- 电流表 (Galvanometer):约20 kPPS。
- 激光器:功率在1W左右,波长为450nm
5. 超越最新视频压缩标准H.266,字节跳动编码新技术让视频缩小13% | 机器之心
今年初,字节跳动先进视频团队(AVG)向联合视频专家组 JVET 发起了一项 JVET-U0068 技术提案,可以为视频压缩的三个颜色分量(Y, U, V)分别实现约 10%、28%、28% 的性能增益,这是业界公开的单个智能编码工具的最佳性能增益。
在优化压缩质量的同时,视频体积相比 H.266 最新标准至少还可以缩小 13%。就其实际效果而言,如果新技术得以应用,与现在主流的 H.264 标准相比,我们看同样质量的视频,大约只需要 22% 的带宽和存储空间。
这项技术名为 DAM(Deep-filtering with Adaptive Model-selection),它是通过深度学习技术构建减少视频压缩失真的滤波器,主干是基于残差单元堆叠的深度卷积神经网络,辅以自适应模型选择以最大程度适应特性复杂的自然视频。
可以从上面得图片看到,相同压缩比条件下,H.266+DAM 编码压缩质量远远优于 H.264。
除了视频压缩质量提升之外,应用 DAM 技术可以比H.266再缩小 13% 的数据体积。
6. 全球三大芯片架构之一MIPS倒下!转身投入RISC-V阵营 | 量子位
图片
全球三大芯片架构之一MIPS,已经成为历史。
据外媒报道,所属公司宣布将放弃继续设计MIPS架构,全身心投入RISC-V阵营。
MIPS一度被业内认为可以比肩Arm、x86,成为全球三大主流架构之一。
如今本应四十不惑的MIPS,却突然耐不住寂寞,意外转投大火的RISC-V阵营。
于是,就有网友感叹:这真是又一个遇上了安卓的黑莓啊。
7. 原生支持苹果M1 Mac的VS Code稳定版来了,运行速度提升 | 机器之心
下载地址:
VS Code 对多种操作系统的支持一直是其优势,苹果 macOS 系统也不例外。2020 年 11 月,苹果发布了三款搭载自研芯片 M1 的 Mac。一个月后,微软就发布了原生支持苹果 M1 Mac 的 VS Code 预览版。
近日,微软发布了 VS Code 1.54.1 稳定版,正式支持苹果 M1 Mac。使用 M1 Mac 的用户不用通过 Rosetta 仿真来运行 VS Code 了,并且运行时将体验到更好的性能和更长的电池续航。
现在,苹果用户既可以下载通用版(Universal),也可以下载 Apple Silicon 版本来使用 M1 Mac 原生的 VS Code,软件将自动检测用户的处理器并进行适配。
8. 12种Numpy&Pandas高效技巧 | 夕小瑶的卖萌屋
图片
代码地址:
https://github.com/kunaldhari...
本文分享给大家 12 种 Numpy 和 Pandas 函数,这些高效的函数会令数据分析更为容易、便捷。最后,读者也可以在 GitHub 项目中找到本文所用代码的 Jupyter Notebook。
推荐阅读
RT-Thread针对不同架构芯片移植的方法
RT-Thread隐藏的宝藏之completion
【20210305期AI简报】基于TensorRT完成NanoDet模型部署
原文链接:RTThread物联网操作系统
作者: RT-Thread