论文出处:《Integer Quantization for Deep Learning Inference Principles and Empirical Evaluation》 时间:2020.April 单位:NVIDIA
75 年前宝丽来拍摄第一张即时照片的时候,以逼真的 2D 图像捕捉 3D 世界是开创性的,如今人工智能研究人员正做着相反的事情,即几秒内将...
本文旨在利用神经结构搜索(NAS)来优化模型的推理延迟。为了实现这一目标,建立了一个分布式NAS系统来在一个新的搜索空间上进行搜索,将N...
之前看我司的 如何实现一个高效的Softmax CUDA kernel?多少还是有些细节没有理解,恰好最近要做一个类似的 Reduce+Scale Kernel,原理...
前面的系列文章里提过,TAO 工具将模型训练的绝大部分技术难题都进行抽象化处理,大幅度减轻开发人员的负担,唯独数据集的收集与整理仍...
在TAO提供的数据类范例中,每个脚本的第一个步骤都是环境配置(0. Set up env variables and map drives),包括要求用户提供在 NGC 所...
本文是对 [链接] 这篇论文进行解读,学习一下如何基于MLIR编译器基础设施生成高效的GPU代码。本文的阅读的先后顺序分别为:
【GiantPandaCV导语】忙完手头工作,就赶紧来过了一遍 H100 白皮书。下面我就以框架开发和炼丹师的角度谈谈 H100 的一些新特性,如有说...
前天刚跟大家分享过支持PCIe Gen5的主机平台(以“小”见大:从Precision 3660看工作站技术发展趋势),适逢NVIDIA GTC大会,又有更多新品...
在开始使用 TAO 模型训练工具之前,我们必须先对其操作原理有个基础的理解,因为这套工具能支持 30 多种神经网络的深度学习,并且横跨视...
NVIDIA 将大部分应用透过 Dcoker 容器技术进行封装,并且为了协助开发人员更加轻松地使用这些软件,NVIDIA 特别开发了一个 nvidia-pyind...
全名为 NVIDIA GPU Cloud 的 NGC 中心,是近年来 NVIDIA 用来统筹应用资源的云中心,本身并不具备任何计算功能,主要就是“应用资源分类...
上周末,英伟达被南美黑客组织 LAPSU$ 盯上了,LAPSU$ 通过入侵英伟达内部服务器,导致超过 1TB 的数据泄露,并公开叫卖 RTX 30 系列显...
特征模型(features model)是人工智能深度学习的灵魂,其优劣程度决定了前端推理结果的成败,包括计算性能与精确度的综合考量,是整个人...
前一篇从 Jetson Projects 所挑选的“TRANSFER LEARNING WITH JETBOT & TRAFFIC CONES”项目,是延续避撞应用使用深度学习的图像分类技术...
避撞功能是智能车的最基本保护能力,Jetbot 使用深度学习的图像分类技术来模拟人眼习惯实现这个功能,但这只是智能车所展现的最入门应用...
这原本应该是任何深度学习应用的第一个步骤,包括采集所需要的图像数据以及用框架工具进行模型训练,但这个过程比较枯燥乏味,因此在上...
避撞功能是 Jetbot 一开始最令人瞩目的功能,因为这是所有小车都必须具备的最基本“自我保护”的能力,而 Jetbot 没有任何距离传感,只凭...
如果已经将 Jetbot 智能小车组装好的话,现在就可以开始执行 Jetbot 智能小车实验,接下来的操作都在以下环境中执行:
要破解这道难题,不能仅靠NVIDIA单打独斗,还需要“朋友们”众人拾柴。在2021年6月,为了有效的与广大中国开发者进行互动, NVIDIA 发布DO...