细小物体由于其有限的空间分辨率,往往呈现出点状分布的特点。因此,使用点级监督进行边界框预测自然且成本效益高,成为传统框级监督的...
蛋白质作为生命的「工作分子」,其结构与功能研究需要耗费大量时间与资源,但 AI 技术的引入彻底改变了这一局面。通过深度学习模型,研...
深度学习模型因其复杂的网络结构与强烈的“黑箱”特性,使得AI开发者在处理海量非结构化数据时如同穿越一片汹涌澎湃的未知海洋。
一句话总结2024年大模型的商业化进展,或许是冰火两重天。一方面,我们看到了许多成功的AI付费用例,小到9.9一套的AIGC宠物写真,200美...
Coconut(连续思维链)提出了一种新的大语言模型推理范式,该范式在潜在空间中进行运算,利用模型隐藏层生成的连续思维状态取代传统的基...
在中国,自古就有“食在广东”的说法,而在广东深圳坪山,如果你问本地男女老少,哪里的筵席最好,大概率会听到一个名字:骏群。
博客来源:[链接] 这里做了个翻译。这篇 PyTorch 的 blog 简要介绍了 CUTLASS 中的 Ping-Pong GEMM kernel 设计,它是专门为 Hopper GPU...
当今,医疗资源紧张是困扰全球医疗系统的长期性问题,「医生荒」在基础保健和全科医学领域尤为突出。世界卫生组织预计,到 2030 年,全...
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU ...
在现代数据分析领域,时间序列数据的处理和预测一直是一个具有挑战性的问题。随着物联网设备、金融交易系统和工业传感器的普及,我们面...
Transformer 模型,自 2017 年由 Vaswani 等人提出以来,在自然语言处理(NLP)领域引发了革命性的变革。这一模型的核心在于其独特的自...
「Meet AI4S」系列直播第 6 期将于 1 月 15 日 19:00 准时开播,HyperAI超神经有幸邀请到了南开大学统计与数据科学学院教授郑伟,他本次...
自 2004 年开源发布以来,LAMMPS 在材料建模领域得到了广泛应用,其全称为 Large-scale Atomic/Molecular Massively Parallel Simulator...
Aeon 是一个专注于时间序列处理的开源 Python 库,其设计理念遵循 scikit-learn 的 API 风格,为数据科学家和研究人员提供了一套完整的...
清华大学智能产业研究院(AIR)联合地瓜机器人和求之科技,将在机器人领域旗舰会议ICRA 2025上主办第四届Sim2Real挑战赛(以下简称 "S2R...
在计算机视觉领域,目标检测技术一直是研究的热点与难点。随着应用场景的不断拓展,传统的闭集检测逐渐显露出其局限性,开放词汇检测(O...
去年 11 月,腾讯推出 Hunyuan3D 生成模型,是业界首个同时支持文字和图像生成 3D 的开源大模型。紧接着不到一个月,微软便发布了全新框...
2024 年尾,国际人工智能顶会「第 39 届人工智能年会」(The 39th Annual AAAI Conference on Artificial Intelligence, AAAI 2025) 公布...
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →[链接]
超参数优化是深度学习模型开发过程中的一个核心技术难点。合适的超参数组合能够显著提升模型性能,但优化过程往往需要消耗大量计算资源...
最近在 SGlang 仓库下做了一段时间的开发和学习,对 SGLang 的一些比较新的 Feature 也开始有一些了解。这篇文章就是尝试来梳理一下 SGL...
触觉感知是智能机器人和人机交互的重要能力之一,但如何实现高精度、快速响应的触觉传感仍然面临诸多挑战。传统触觉传感器在力的测量中...
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
本文将详细解读 NeurIPS 2024 最佳论文:"Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction(视...
老者摸着胡须,目光炯炯望着我:刚刚我看路边有人弄丢了几把铲子,想必是你弄丢的,那让我来考考你,你丢的是这把金铲子,还是这把银铲...
繁重多样的内容创作,一直以来都让职场人“年会不消停”。好消息是,在大模型改变一切的今天,讯飞星火准备杜绝职场人的年终季内耗现象。
2012 年,在传说中的「末日之年」,移动互联网迎来了爆发期。随着 3G 网络的普及、智能手机价格下探,加之微信、米聊为代表的类通信应用...
NVIDIA 新发布的 Jetson Orin Nano Super 可将生成式 AI 性能提升至1.7 倍,支持科技爱好者、开发者和学生使用的主流模型。
在深度学习模型部署和优化领域,计算效率与资源消耗的平衡一直是一个核心挑战。PyTorch 团队针对这一问题推出了创新性的技术方案——在其...
博客来源:[链接] 。by IBM and Meta 。这里主要是汇总一下 FSDP2 和 FP8 训练相关的内容,目前的实践主要集中在 TorchTitan(DTensor,...