前面文章介绍微软 Teams 会议系统、微信软件与腾讯 PCG 服务三个 Triton 推理服务器的成功案例,让大家对 Triton 有初步的认知,但别误...
推理识别是人工智能最重要的落地应用,其他与深度学习相关的数据收集、标注、模型训练等工作,都是为了得到更好的最终推理性能与效果。
在H100发布之际,英伟达还带来一个“重磅产品”——Transformer Engine。在Transformer大火之际推出这么一个产品,无疑是炼丹师福音。
超级计算机用于建模和模拟科学计算中最复杂的过程,通常是为了洞察新发现,否则这些新发现在物理上是不切实际的或不可能演示的。
NVIDIA® TensorRT™ 是一个促进高性能机器学习推理的 SDK。它旨在与 TensorFlow、PyTorch 和 MXNet 等训练框架以互补的方式工作。它特别...
NVIDIA JetPack SDK 是构建 AI 应用的全面解决方案,支持所有 Jetson 模块和开发者套件。
借助 NVIDIA Texture Tools Exporter,用户可以使用 NVIDIA 的 CUDA 加速 Texture Tools 3.0 压缩器技术,直接从图像源创建高度压缩的纹...
在本次 GTC 大会上,NVIDIA 发布了 Jetson Orin Nano 系列的系统级模组(SoM)。其 AI 性能是 NVIDIA Jetson Nano 的 80 倍,成为入门级...
在通常的 CUDA 编程中,用户主要通过 CUDA C/C++ 或 python 语言实现 CUDA 功能的调用。在 NVIDIA 对 CUDA C 的官方支持工具链中,CUDA ...
NVIDIA HPC SDK 包含经过验证的编译器、库和软件工具,对于更大程度提高开发者的工作效率以及 HPC 应用的性能和可移植性至关重要。
随着 Jetson Orin Nano 在本次 GTC 大会的发布,整个 Jetson Orin 模块阵容现已揭晓。凭借高达 40 TOPS 的 AI 性能,Orin Nano 模块为入...
北京时间,9月21凌晨,NVIDIA GTC 2022秋季发布会上,CEO黄仁勋发布了其2024年将推出的自动驾驶芯片。因为其2000TFLOPS的性能过于强大,...
和电池里面中国企业唱主角不一样,在汽车芯片和高算力芯片里面,目前还是美国企业在潮头带领着整个行业的发展。这个周,高通和英伟达分...
当我们现在使用的汽车算力TOPS还在个位数的时候,几十TOPS的算力汽车都算智能汽车顶峰了,几百算力的汽车刚完成研发,各项功能还在等待O...
超大型的深度神经网络(DNN),无论是用于自然语言处理(如 GPT-3)、计算机视觉(如规模巨大的视觉 Transformer),还是语音 AI(如 Wa...
YOLO(You Only Look Once)算法是近些年非常知名的深度神经网络结构,由于创始人在 v3 版本之后便宣布退出领域,于是从 v4 版之后便出...
API 综合套装,包含高性能工具、样本和文档,适用于 Windows 和 Linux 的硬件加速型视频编码和解码。
前一篇文章已经对 Jetson-container 的容器创建脚本进行较为深入的说明,主要是为了更广泛地适用于不同 JetPack 版本的环境,因此使用嵌...
现在,GPU 几乎已渗透到所有影像诊断方式中(包括 CT、MRI、X 光和超声波),这为边缘设备提供了 IT 数据中心和云端所具备的计算能力。...
9 月 2 日,第二届 SmartNIC & DPU 技术创新峰会在北京成功举办。大会以“智领创芯,芯火未来”为主题,聚焦智能网卡与 DPU 相关的网络芯...