循环状态空间模型(Recurrent State Space Models, RSSM)最初由 Danijar Hafer 等人在论文《Learning Latent Dynamics for Planning fr...
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU ...
在刚刚结束的 CES 2025 主题演讲中,黄仁勋身着新皮衣揭开了 RTX 5090 的面纱,闲言少叙,直接来看性能与售价:
{代码...} 最后从日志文件中检查最佳配置,检查正确性并测试运行时间。 {代码...} 输出结果: {代码...} 下载 Python 源代码:tune_conv...
{代码...}
Apache TVM 是一个端到端的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →[链接]
在麻省理工学院 4 号楼的地下室,有一个被学生们称为「创新的摇篮」的实验室——4-061 实验室。在这里,Donald Sadoway 教授自 1990 年代...
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
以 AlphaFold 为代表的 AI 系统,能够以前所未有的精度预测蛋白质三维结构,为理解蛋白质功能和开发靶向药物提供了革命性工具。在药物研...
「我以为我只有 10% 的机会获得诺贝尔化学奖」,得知获奖消息后,John Jumper 在电话采访中笑着说道。他的语气中带着谦逊与感慨,而这份...
深度强化学习是人工智能领域最具挑战性的研究方向之一,其设计理念源于生物学习系统从经验中优化决策的机制。在众多深度强化学习算法中...
「CASP14 赛前,很多课题组看到 DeepMind 来参赛,觉得他们带来的成果可能和上次 (CASP13) 差不多,大家都没太当回事」,南开大学郑伟教...
在 2024 年的 NeurIPS 会议上,Ilya Sutskever 提出了一系列关于人工智能发展的挑战性观点,尤其集中于 Scaling Law 的观点:「现有的预...
扩散模型在生成高质量图像领域具有显著优势,但其迭代去噪过程导致计算开销较大。分布匹配蒸馏(Distribution Matching Distillation,D...
就在本月,Meta 发布了 Llama 3.3 唯一开源模型 Llama-3.3-70B-Instruct,虽然参数规模只有 70B,但堪比 405B 模型性能。这是 Llama 3 ...
在机器人自主学习的旅程中,触觉是不可或缺的一环,它赋予机器感知物理世界细节的能力。然而,传统触觉感知系统的训练往往依赖于海量数...
大型语言模型在各个领域都展现出了卓越的性能,但其核心组件之一——softmax 注意力机制在计算资源消耗方面存在显著局限性。本文将深入探...
近年来,在全球持续变暖等大背景下,我们见证了一系列罕见的极端气候事件,它们似乎在无声地宣告着我们所处时代面临的严峻挑战。2024 年...
多维偏好分析(Multidimensional Preference Analysis, MPA)是一种在市场营销、心理学和公共政策等领域广泛应用的分析工具,用于研究多...
在已知宇宙中,人类大脑是最复杂的结构之一。它由大约 1 千亿个神经元组成,每个神经元通过数千个突触与其他神经元相连,形成了一个难以...