作为 Arm 目前性能最强大的 CPU 设计之一,基于 Armv9.2 架构的 Arm Cortex-X925 在 Geekbench 6.2 基准测试中创下新高,实现了 15% 的每时钟周期指令数 (IPC) 提升。那么,IPC 提升对于我们日常使用移动设备而言意味着什么?在不同的应用中又会为我们带来哪些实际的性能提升呢?
IPC 表现出众,为实际需求提供强劲性能
一开始,我们先来了解什么是 IPC。要想用户能在各种应用中获得理想体验,高性能的 CPU 必不可缺。而 IPC 是评估 CPU 性能的一大关键指标,可用于衡量 CPU 在每个时钟周期内可执行的指令数。
简单来说,这就好比在一座工厂里,有多台机器人负责组装复杂产品。机器人为完成如新的人工智能 (AI) 算法等复杂计算而执行的任务就类似于 CPU 执行的指令数,组装过程中单个步骤所花费的时间代表时钟周期。IPC 可想象成,工厂中先进的机器人能在每个流水线步骤中执行多个任务,因而工厂能够在规定时间内制造出更多产品。单个机器人的能力越强,实现预期产量所需的机器人数量就越少,工厂的能效也就会更高。
能效对智能手机、笔记本电脑等消费电子设备至关重要。能效的提高可以使用户获得更长的电池续航时间,并保持更低的运行温度。使用时间更长,还不烫手,体验感 UP UP!
具体的体验感受包括,在我们使用移动设备时,AI 应用的响应速度更快,AI 聊天机器人的回复更准确和快速;在玩 AAA 游戏时,我们能获得更流畅、更沉浸式的游戏体验,以及更高的画质;而应用操作速度的提升,能让我们体验到更快的应用启动速度,和更为流畅的使用体验;我们可以同时听音乐、浏览网站和聊天,多任务顺畅无缝使用,不会感觉到卡顿感;在视频播放方面,更流畅的视频流传输,能减少缓冲时间,播放更流畅;在浏览网页时,更快的网页加载速度使我们在滚动或切换页面时能得到更快的反馈。同时得益于能效的提升,智能手机续航增强,并可保持稳定且持久的供电性能。作为用户,我们能在实际使用中的方方面面体会到更为卓越的性能表现!
Arm 迄今性能最强大的 CPU: Cortex-X925
如此大幅的 IPC 提升,Arm 是如何实现的呢?
基于 Armv9 架构的 Cortex-X925 专注于提高 IPC 表现,其中 CPU 设计包括对私有 L2 缓存的升级,从 2MB 增加到 3MB,增强了 CPU 的整体性能和能效,尤其是结合 Cortex-X925 在更快速、更高效预取数据和复杂指令的能力后,成效尤为显著。与此同时,Cortex-X925 充分利用三纳米工艺的优势,为游戏等持续的计算负载提供更出色的能效,并且可在需要时以更高的频率运行 CPU,从而提高响应速度、应用启动速度和浏览器性能。Cortex-X925 中的矢量管线还实现了 50% 的 Integer8 TOPS 提升,可加快智能手机上的 AI 应用响应速度。总体而言,在消费者日常使用智能手机时,Cortex-X925 可使性能和能效平均提升 30%。
图:Arm Cortex-X925 的性能和能效平均提高了 30%,
在各个方面提升了用户体验
Arm 的这一创新成果之所以有如此令人瞩目的性能表现,源自于架构层面的多项提升。从消费者的实际使用场景出发来考量架构,在设计时着重关注了三个层次:
- 前端:采用出色的微架构,适合具有复杂分支行为和指令占用空间大的实际应用。分支预测和指令获取能力提高两倍。
- 核心:采用业内最高吞吐率的微架构,提升工作负载的性能。最大指令窗口容量增加两倍,以实现广泛的微架构深度并避免延迟。
- 后端:负载管线从三个增至四个,使后端工作负载得以增长 25% 至 40%,从而实现更出色的性能和能效。
Cortex-X925 旨在满足当今消费电子设备不断演变的需求,让消费者在广泛多样的应用中,获得无与伦比的性能、能效和用户体验。想要了解更多关于 Cortex-X925 的信息,欢迎阅读《新的 Armv9 CPU 加速 AI 在移动设备等领域的发展》。
END
文章来源:Arm社区
推荐阅读
- Arm 革新驾驶体验,加速 ADAS 应用
- 一文解谜 SMT 系统上 CPU 使用率的盲点
- Armv9 技术讲堂 | 利用 Armv9 CPU 和 SVE2 加速视频解码和图像处理
- Armv9新特性:虚拟内存系统架构 (VMSA) 的增强功能
欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区Arm技术专栏欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。