云服务用户和开发者持续寻求高效、可持续且可扩展的计算解决方案,以满足包括人工智能 (AI) 在内的现代云原生应用的需求。作为云服务领域的前沿企业,微软一直通过在其 Azure 产品系列中进行系统到软件的优化来满足此类需求。近期,微软宣布基于 Azure Cobalt 100 处理器的新 Azure 虚拟机 (VM) 全面上线,其中 Azure Co...
作为 Arm 目前性能最强大的 CPU 设计之一,基于 Armv9.2 架构的 Arm Cortex-X925 在 Geekbench 6.2 基准测试中创下新高,实现了 15% 的每时钟周期指令数 (IPC) 提升。那么,IPC 提升对于我们日常使用移动设备而言意味着什么?在不同的应用中又会为我们带来哪些实际的性能提升呢?
本博文由 Arm 公司的 Gian Marco Iodice 和 Meta 公司的 Digant Desai 合著。
本博文由 Rob Elliott、Fredrik Knutsson 和 Mark Quartermain 合著。
驾驶辅助功能正日益成为驾驶员感官的延伸。这些功能利用摄像头、雷达和其他传感器检测潜在危险,向驾驶员发出警告,采取纠正措施,在必要时还可代替驾驶员进行持续控制。这些创新的汽车技术被称为先进驾驶辅助系统 (ADAS),不仅可以提升驾驶体验,还能为道路使用者带来更高的整体安全性。
"有了新一代 Arm CPU,我们发现有机会大幅缩短处理时间,提高稀疏解法的效率,并为利用以前未开发的并行化潜力做好准备。因此,我们决定让求解器 Pardiso 与 Arm 兼容"。(瑞士卢加诺 Panua 技术公司总监 Olaf Schenk 教授)。
亚马逊网络服务(AWS)推出了最新一代基于 Arm 的定制设计 CPU,即 AWS Graviton4 处理器,并于 2024 年 7 月 9 日全面上市。这些先进的处理器采用基于 64 位 Arm 指令集架构的 Arm Neoverse V2 内核开发。该架构将 Graviton4 定位为高效、强大的解决方案,适用于各种基于云的应用[1]。
Arm Neoverse N 系列和 V 系列处理器并未采用同步多线程 (SMT) 技术。在 Arm Neoverse 处理器上运行时,每个线程始终能够访问处理器的全部资源。这有助于提高在云环境中执行的可预测性,确保每个线程都能完全访问处理器资源,并提供更强大的保护,防止线程之间发生意外数据泄露。
作为一款高性能的推理引擎框架,MNN*高度关注Transformer模型在移动端的部署并持续探索优化大模型在端侧的推理方案。本文介绍权重量化的模型在MNN CPU后端的推理方案:动态量化。动态量化指在运行时对浮点型feature map数据进行8bit量化,然后与8bit/4bit的权重数据做矩阵乘法并将结果反量化为浮点类型输出。
以人工智能为代表的新一代信息技术加速演进,驱动智能终端产业进入泛在智联、协同智慧新时代。在技术升级及市场需求的双轮驱动下,终端智能发展迅速,但终端智能化研究仍存在一定不足。终端智能化是指基于先进的信息技术,对各类终端设备进行深度赋能,使其具备数据处理能力、意图分析能力、决策执行能力和学习进化能力...
随着每一代新产品的推出,Arm CPU 都会实现代际性能提升,并引入架构改进,以满足不断演进的计算工作负载的需求。本文将重点介绍三个用例,以展示 Armv9 CPU 的架构特性在实际场景中产生的影响,特别是在 HDR 视频解码(加速 10%)、图像处理(加速 20%)、主要移动端应用中的功能 LibYUV(加速 26%)。
2022 Arm引入了一种新的控制内存权限方法。不再是直接在转换表条目 (TTE) 中编码权限,而是使用 TTE 中的字段来索引寄存器中指定的权限数组。这种间接提供了更大的灵活性、编码密度并支持更多新权限。
为了在保持系统稳定性的同时实现最高性能,SoC 越来越依赖于监控器和传感器来提供实时可操作数据。专用传感器可提供可在本地分析的数据,以便立即采取行动,或提供远程监控和分析。在过去的系统中,这些数据由系统控制处理器(SCP)管理,该处理器可查看整个 SoC 监视器和传感器。
汽车技术领域正处于关键的转折点,其未来依托于动态且适应性强的系统,并可通过软件不断提升驾驶体验。如今,相较于一架仅包含1,500 万行代码的波音 737,现在一辆汽车的代码行数已多达 6.5 亿。这个数字还将进一步增长,这项转型也将革新驾驶者与汽车的交互方式,并重新定义车厂与车主间的关系。
2022 年,首个云端文生图的生成式人工智能 (AI) 用例诞生。通过“一张宇航员骑马的照片”文字提示,生成了一张 AI 图像,虽然图像还存在瑕疵,但展示了生成式 AI 令人惊叹的能力和潜力。
Arm 的中央处理器(CPU)对于当今的人工智能软件至关重要,它可以解释、处理和执行指令。Arm 的指令集架构(ISA)是硬件与软件之间的接口,它规定了处理器可以做什么以及如何做。Arm 的 ISA 正在不断发展,以满足现代计算需求,包括人工智能(AI)、机器学习(ML)的兴起、芯片组的采用以及不断加剧的安全威胁。不断的创...
我们非常高兴地宣布最新的 “帧顾问 ”增强功能,它为移动开发人员提供了一种新的方法来识别场景中使用的低效着色器程序。我们还对 Arm Performance Studio 套件进行了其他一些改进,让我们看看都有哪些新功能。
LLVM 19.1.0 于 2024 年 9 月 17 日发布。自上一版本发布以来,Arm 共提交了近 1000 次版本更新,以实现新功能和性能改进,现总结如下。
ANSYS 公司是工程仿真软件领域最重要的领导者之一,其 Ansys Fluent 和 Ansys LS-DYNA 应用程序现已在 Arm 上全面推出。这些工具被用于工业领域的产品开发,大到整机和汽车,小到涡轮叶片和电池等零部件。
ANSYS 公司是工程仿真软件领域最重要的领导者之一,其 Ansys Fluent 和 Ansys LS-DYNA 应用程序现已在 Arm 上全面推出。这些工具广泛应用于工业领域的产品开发,大到整机和汽车,小到涡轮叶片和电池等零部件。