RTThreadIoTOS · 2021年03月08日

【20210305期AI简报】基于TensorRT完成NanoDet模型部署

导读:本期为 AI 简报 20210305 期,将为您带来 9 条相关新闻,新春过后第一弹,今日惊蛰,一侯桃始华~

本文一共 2900 字,通篇阅读结束需要 6~10 分钟

1. 每帧只需9ms,手机实时「三维动作识别」 | 机器之心

image.png

Model 与 codes 链接:

https://github.com/CoCoPIE-Pr...

本文提出了一种用于三维卷积神经网络(3D CNN)的模型压缩和移动加速框架 RT3D,通过结合神经网络权重剪枝和编译器代码优化技术,使模型的端到端运行时间与目前支持 3D CNN 的移动框架相比速度提升高达 29.1 倍,准确性损失仅为 1%~1.5%。

当在手机上采用 C3D 或 R(2+1)D 模型时,可以在 150ms 内完成 16 帧视频的计算。

该工作由 CoCoPIE 团队:美国东北大学(Northeastern University)的王言治研究组、威廉与玛丽学院(William & Mary)的任彬研究组以及北卡罗来纳州立大学(North Carolina State University)的慎熙鹏研究组共同完成,发表于第 35 届美国人工智能协会年会(AAAI 2021)。

2. 前沿|这竟然不是阿汤哥?这个「真的吓人」视频火爆全网 |机器人大讲堂

640 (8).gif

项目地址:

https://github.com/iperov/Dee...

近年来,人们对深度造假(deepfaking)既着迷又担忧。这项技术可以替换视频中的人脸,并利用机器学习使最终生成效果看起来非常逼真。

有些人用此创建了一些有趣的视频。

近日,一段有关好莱坞影星汤姆 · 克鲁斯打高尔夫球的深度造假视频在网络上迅速传播,第一眼看过去,很多人都认为是汤姆 · 克鲁斯本人。

这段视频的创建者为 TikTok 用户「deeptomcruise」。视频中的「阿汤哥」不仅长得极像,声音也几乎与本尊无异。这不是汤姆 · 克鲁斯第一次成为 deepfake 视频的主角,但这次依然让人惊艳。

火爆全网的「阿汤哥」视频使用的技术依然是我们熟悉的 DeepFaceLab。

DeepFaceLab 是制作 deepfake 视频时非常常用的软件,该 GitHub 项目目前已获得近 2.4 万颗星。DeepFaceLab 的特点是灵活、简单、扩展性强,并且具备 Windows、Colab、Linux 等多个版本。

3. 基于TensorRT完成NanoDet模型部署 | PandaCV

image.png

本文为大家介绍了一个TensorRT int8 量化部署 NanoDet 模型的教程,并开源了全部代码。主要是教你如何搭建tensorrt环境,对pytorch模型做onnx格式转换,onnx模型做tensorrt int8量化,及对量化后的模型做推理,实测在1070显卡做到了2ms一帧!

NanoDet (https://github.com/RangiLyu/n...)是一个速度超快和轻量级的Anchor-free 目标检测模型;和yolov4 tiny作比较(如下图),精度相当,但速度却快了1倍;对于速度优先的场景,nanodet无疑是一个好的选择。

主要过程:

  1. NanoDet 模型转换onnx
  2. onnx模型转换为 int8 tensorrt引擎
  3. tensorrt模型推理

4. 基于Caffe格式部署YOLOV5模型 | PandaCV

image.png
如果说目标检测落地最广的是哪个算法,yolo系列肯定有一席之地,本文为大家介绍yolov5s 4.0模型如何转换为caffe模型并推理,据我所知,华为海思NNIE只支持caffe模型的转换,所以yolov5模型要想在海思芯片上部署,转换为caffe模型是有必要的(在我的1070显卡上,yolov5s 4.0 的模型inference做到了11ms一帧!)

主要过程:

  1. yolov5s模型转换onnx模型
  2. onnx模型转换caffe模型
  3. caffe模型推理
  4. 拓展:关于华为海思移植建议

5. 斯坦福连续发了四年的AI报告,今年讲了什么? |机器之心

image.png

报告下载地址:

https://aiindex.stanford.edu/...

由斯坦福大学发起的人工智能指数(AI Index)是一个追踪 AI 动态和进展的非营利性项目,旨在全面研究 AI 行业状况,旨在促进基于数据的 AI 广泛交流和有效对话。

刚刚,AI Index 正式发布了 2021 年度报告。

2021 AI Index 报告极大地扩展了可用数据量,并与大量外部组织合作校准数据、深化该报告与 Stanford HAI 的联系。该报告还从多个方面展示了 COVID-19 对 AI 发展的影响。例如「技术表现」章节探讨了 AI 初创公司如何利用机器学习技术加速 COVID 相关药物研发;「经济」章节表明 AI 招聘和私人投资并未受到新冠大流行的严重影响,仍处于增长态势。

该报告共包括「研发」、「技术表现」、「经济」、「AI 教育」、「AI 应用的伦理挑战」、「AI 多样性」、「AI 政策与国家战略」七个部分。每个章节的核心内容请看原文。

6. PyTorch 1.8来了!正式支持AMD GPU,炼丹不必NVIDIA | 量子位

image.png

原文链接:

https://pytorch.org/blog/pyto...

1.8版本中,官方终于加入了对AMD ROCm的支持,可以方便的在原生环境下运行,不用去配置Docker了。

1.8版本集合了自2020年10月1.7发布以来的超过3000次GitHub提交。

此外,本次更新还有诸多亮点:

  • 优化代码,更新编译器
  • Python内函数转换
  • 增强分布式训练
  • 新的移动端教程与演示
  • 新的性能检测工具

相关的库TorchCSPRNG, TorchVision, TorchText和TorchAudio也会随之更新。

要注意的是,自1.6起,Pytorch新特性将分为Stable、Beta、Prototype三种版本。其中Prototype不会包含到稳定发行版中,需要从Nightly版本自行编译。

本次更新发布有图像分割模型DeepLabV3在安卓和IOS上的详细教程。

以及图像分割、目标检测、神经机器翻译等在安卓和IOS上的演示程序,方便大家更快上手。

7. 提速20倍!谷歌AI发布TensorFlow 3D,智能汽车场景亲测好用 | 新智元

image.png

Google AI发布了TensorFlow 3D,将3D深度学习能力引入TensorFlow,加入3D稀疏卷积网络,在Waymo Open数据集上的实验表明,这种实现比预先设计好的TensorFlow操作提速「20倍」。

近期,包括目标检测、透明目标检测等模型的3D场景理解方面取得了很大进展,但是由于3D数据可用的工具和资源有限,这个领域仍面临挑战。

为了进一步提高对3D场景的建模,简化研究人员的工作,Google AI发布了TensorFlow 3D (TF 3D) ,一个高度模块化、高效的库,旨在将3D深度学习能力引入TensorFlow.

TF 3D包含用于最先进的3D语义分割3D目标检测3D实例分割的培训和评估任务,还支持分布式训练。

另外,TF 3D还支持其他潜在的应用,如三维物体形状预测、点云配准和点云增密。此外,它提供了一个统一的数据集规范和训练、评价标准三维场景理解数据集的配置。

目前,TF 3D支持Waymo Open、 ScanNet和Rio数据集。

8. Transformer系列 | 更深、更强、更轻巧的Transformer,DeLighT |  AI人工智能初学者

image.png

论文:DELIGHT: DEEP AND LIGHT-WEIGHT TRANSFORMER
github: https://github.com/sacmehta/d...

本文提出了一个更深更轻量的Transformer,DeLighT,DeLighT更有效地在每个Transformer Block中分配参数:

  • 1)、使用DeLighT转换进行深度和轻量级的转换;
  • 2)、使用Block-wise Scaling进行跨Block,允许在输入附近有较浅和较窄的DeLighT Block,以及在输出附近有较宽和较深的DeLighT Block。

总的来说,DeLighT网络的深度是标准Transformer的2.5到4倍,但参数和操作更少。在机器翻译和语言建模任务上的实验表明,DeLighT在提高了基准Transformer性能的基础上,平均减少了2到3倍的参数量。

9. 在家上名校——哈佛MIT等全套CS本科课程,为你备齐了! | 新智元

image.png

官方链接🔗:

https://github.com/ossu/compu...

参考链接:

https://github.com/ossu/compu...

推荐阅读
【20210219期AI简报】嵌入式机器学习(TinyML)实战教程、谷歌开源计算框架JAX...
【20210205期AI简报】联发科发布二代5G基带芯片发布
【20210129期AI简报】 25元、264KB内存的微处理器上市、GPT-3自动生成SQL语句!

文章转载于微信公众号:RTThread物联网操作系统
作者: lebhoryi
推荐阅读
关注数
8071
内容数
181
小而美的物联网操作系统,经过14年的累积发展,RT-Thread 已经拥有一个国内最大的嵌入式开源社区,同时被广泛应用于能源、车载、医疗、消费电子等多个行业,累积装机量超过4亿台,成为国人自主开发、国内最成熟稳定和装机量最大的开源 RTOS。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息