去年 11 月,腾讯推出 Hunyuan3D 生成模型,是业界首个同时支持文字和图像生成 3D 的开源大模型。紧接着不到一个月,微软便发布了全新框...
2024 年尾,国际人工智能顶会「第 39 届人工智能年会」(The 39th Annual AAAI Conference on Artificial Intelligence, AAAI 2025) 公布...
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →[链接]
超参数优化是深度学习模型开发过程中的一个核心技术难点。合适的超参数组合能够显著提升模型性能,但优化过程往往需要消耗大量计算资源...
触觉感知是智能机器人和人机交互的重要能力之一,但如何实现高精度、快速响应的触觉传感仍然面临诸多挑战。传统触觉传感器在力的测量中...
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
本文将详细解读 NeurIPS 2024 最佳论文:"Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction(视...
2012 年,在传说中的「末日之年」,移动互联网迎来了爆发期。随着 3G 网络的普及、智能手机价格下探,加之微信、米聊为代表的类通信应用...
在深度学习模型部署和优化领域,计算效率与资源消耗的平衡一直是一个核心挑战。PyTorch 团队针对这一问题推出了创新性的技术方案——在其...
12 月 28 日,上海已经进入初冬,寒冷的天气也抵挡不住大家的热情,现场座无虚席,交流氛围浓烈,从行业挑战到技术创新,从应用场景到落...
循环状态空间模型(Recurrent State Space Models, RSSM)最初由 Danijar Hafer 等人在论文《Learning Latent Dynamics for Planning fr...
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU ...
在刚刚结束的 CES 2025 主题演讲中,黄仁勋身着新皮衣揭开了 RTX 5090 的面纱,闲言少叙,直接来看性能与售价:
{代码...} 最后从日志文件中检查最佳配置,检查正确性并测试运行时间。 {代码...} 输出结果: {代码...} 下载 Python 源代码:tune_conv...
{代码...}
Apache TVM 是一个端到端的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →[链接]
在麻省理工学院 4 号楼的地下室,有一个被学生们称为「创新的摇篮」的实验室——4-061 实验室。在这里,Donald Sadoway 教授自 1990 年代...
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
以 AlphaFold 为代表的 AI 系统,能够以前所未有的精度预测蛋白质三维结构,为理解蛋白质功能和开发靶向药物提供了革命性工具。在药物研...
「我以为我只有 10% 的机会获得诺贝尔化学奖」,得知获奖消息后,John Jumper 在电话采访中笑着说道。他的语气中带着谦逊与感慨,而这份...