GPU 下最新的文章 - 极术社区 - 连接开发者与智能计算生态

GPU

图形处理器（英语：Graphics Processing Unit，缩写：GPU；又称显示核心、视觉处理器、显示芯片或绘图芯片）是一种专门在个人计算机、工作站、游戏机和一些移动设备（如平板电脑、智能手机等）上运行绘图运算工作的微处理器。

关注标签

关注数

8

内容数

280

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

Waterman · 11月2日

【“星睿O6”AI PC开发套件评测】基于Qwen-VL的AI烹饪助手

随着大语言模型（LLM）的迅速发展，AI 不再只是“会聊天”的工具，而是能够理解、推理并生成多模态内容的智能体。本文将基于Orion O6平台...

0 阅读 1.5k
Datenlord · 10月30日

达坦科技GPU性能优化大赛：挑战极限，释放GPU终极算力！

在大模型与高性能计算深度融合的当下，充分释放GPU硬件算力已成为推动技术进步的关键环节。为探索GPU性能优化的前沿技术，培养高水平计...

1 阅读 3.7k
Waterman · 10月19日

【“星睿O6”AI PC开发套件评测】基于MNN的LLM与VLM部署

首先非常感谢极术社区和arm china提供的这次试用机会！目前，端侧 AI 部署已成为行业发展的重要趋势。随着大语言模型（LLM）和多模态模...

0 阅读 787
天罡智算杨旭颖 · 10月10日

智能算力的绿色跃迁：ESG下平台化运营的机遇与挑战

在数字化转型与“双碳”目标交织的时代洪流中，智能算力已成为驱动千行百业创新的核心引擎。然而，算力产业在迅猛发展的同时，也面临着高...

1 阅读 4.4k
Nathan_Li_Arm · 7月14日

Arm ASR 精锐超分最佳实践

引言：在移动设备上，维护画质与性能之间的精妙平衡，长期以来都是困扰开发者的技术挑战。Arm 精锐超分（Arm Accuracy Super Resolution...

2 阅读 13.7k
棋子 · 6月27日

算力兵器谱——从一体机，超节点再到万卡集群

1. 一体机 (All-in-One Machine)2025年上半年最火的AI产品是什么？绝对是DeepSeek一体机。没有之一。一体机，顾名思义，就是将计算、存...

0 阅读 3.5k
爱笑的小姐姐 · 6月20日

HeteroLLM：利用移动端 SoC 实现 NPU-GPU 并行异构 LLM 推理！

随着 ChatGPT、AI 代理和视频生成等人工智能技术的快速发展，现代移动系统已开始在本地设备上集成这些 AI 能力，以增强隐私保护并减少响...

1 阅读 2.4k
John_b5QwAU · 6月17日

在部署模型方面，5090和4090的区别到底在哪里？

在2025年1月7日的CES 2025大会，英伟达正式发布了备受瞩目的新一代GeForce RTX 5090 GPU卡。与上一代旗舰4090相比，5090到底强了多少？...

0 阅读 1.3k
爱笑的小姐姐 · 6月3日

减少 55% 代码行数、 CPU 和 GPU 峰值内存，加速训练推理！

软件膨胀（Software bloat）是指软件在运行时未被使用的代码和功能。对于机器学习（ML）系统而言，软件膨胀是造成其技术债务的主要因素...

4 阅读 1.4k
爱笑的小姐姐 · 5月21日

混合CPU-GPU调度+Cache管理：MoE推理Prefill1.3倍、Decode1.7倍加速！

关键词：MoE、CPU-GPU Scheduling、Inference、Cache Management

0 阅读 2.8k
天罡智算杨旭颖 · 5月20日

政策驱动下中国智能算力产业崛起的机遇与挑战

国家战略的强力推动下，中国智能算力产业正迎来爆发式增长。自2021年以来，国家发改委、工信部等部委密集发布《算力基础设施高质量发展...

1 阅读 1.5k
爱笑的小姐姐 · 5月19日

CMU与Meta提出LithOS：节省 GPU51% 容量、26%能耗，迈向高效机器学习操作系统

机器学习（ML）工作负载在数据中心对 GPU 的需求激增，使得高效利用 GPU 变得至关重要。然而，在满足各个 ML 模型的多样化需求的同时优...

1 阅读 2.9k
棋子 · 5月15日

解密Arm CPU与GPU命名规则：一份详尽的总结报告

Arm Holdings 的商业模式独树一帜：它专注于设计和授权知识产权（IP），而非亲自制造芯片 1。这一模式是理解市场上为何存在如此多样化...

3 阅读 2.5k
爱笑的小姐姐 · 5月12日

Tilus 虚拟机：超越 Triton 开启低精度任意比特 GPGPU 的 LLM 高效计算

❝为大型语言模型（LLM）提供服务对于人工智能驱动的应用程序至关重要，但这需要大量的计算资源，特别是在内存带宽和计算吞吐量方面。

1 阅读 1.2k
爱笑的小姐姐 · 5月9日

FlashInfer：面向 LLM 服务的可定制且高效的 GPU 注意力引擎

驱动大型语言模型（LLM）的 Transformer 架构因其注意力机制而成为基础。随着这些模型的规模不断扩大，导致计算资源需求激增、实时性要...

2 阅读 8.2k
企业存储技术 · 5月7日

从 Qwen3 MoE & 稠密模型性能测试-看 CPU/GPU 算力需求

自从通义千问推出 Qwen3 系列大模型，人们的注意力一下子从 DeepSeek 上转移出不少。有一点遗憾是 235B 的参数量，不见得能达到或者超过...

1 阅读 8.9k
爱笑的小姐姐 · 4月25日

ML-Triton：Intel 在 Triton GPU 编程的多级编译与语言扩展的工作

❝ 大型语言模型（LLMs）时代，密集运算（如通用矩阵乘法 GEMM 和多头注意力 MHA）至关重要，且适合用基于 tile 的方法在 GPU 上并行执行...

1 阅读 2.8k
棋子 · 4月16日

从 GPU 芯片到智算集群，英伟达不给中间商赚差价

GTC25 上，老黄拿出了最新也是最强的 BLackWell Ultra GPU（B300），不过这个不是重点，毕竟去年就发布了 B100 和 B200，这个就是小升级。

1 阅读 1.5k
nihui · 4月15日

【“星睿O6”评测】RVM人像分割torch➡️ncnn-CPU/GPU和o6-NPU部署全过程

标题精简了，原标题是【“星睿O6”AI PC开发套件评测】RVM人像分割torch➡️pnnx➡️cix量化➡️o6-NPU和ncnn-CPU/GPU部署全过程

21 阅读 1.6k
极术直播小助手 · 4月15日

极术干货| 基于“星睿O6”的图形及AI应用部署实战（视频+PPT)

本期直播为极术社区2025年推出的此芯AI PC开发套件瑞莎“星睿O6”系列第三场公开课。本期我们邀请了此芯两位技术专家分别给大家介绍基于“...

11 阅读 1.3k

上一页
1
2
3
4
5
…
下一页

本月贡献榜

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息