修志龙_ZenonXiu 头像

修志龙_ZenonXiu

4370 声望
mindshare_zenon 展开

mindshare_zenon

收起
关注了
2
粉丝数
8700
IP 属地上海
最新动态
  • 发布了文章 ·
    如何使用Arm 向量指令加速矩阵乘 (2) – SVE2 Matrix Multiply

    这条指令将第一个SVE2源向量中每128-bit看作2x8有符号8位整数矩阵, 第二个SVE2源向量中每128-bit的8x2有符号8位整数矩阵,然后将第一个SVE2源向量中的2x8矩阵与第二个SVE2源向量中的对应的8x2矩阵进行矩阵乘,生成的2x2 32位整数矩阵乘积累加到目标向量中的32位整数矩阵累加器中。使用SVE2 Int8 Matrix Multiply进行矩阵...

    摘要图
  • 发布了文章 ·
    如何使用Arm 向量指令加速矩阵乘 (1)– SVE2 Dot Product

    前文讲了Arm用于加速AI, ML应用的向量和SME指令,本文介绍如何使用这些指令来实现矩阵乘。A(M x K)矩阵和B (K x N)矩阵的矩阵乘(得到C矩阵 M x N)可以表达为:

    摘要图
  • 发布了文章 ·
    Arm构架如何让AI应用高效运行于CPU (2)

    为了进一步利用向量寄存器,在向量运算中执行更多的乘加(MAC)操作。Armv8.6-a引入了矩阵乘(Matrix Multiply)指令。这些指令相当于取A矩阵的两行放在向量Vec_A中,取B矩阵的两列放在向量Vec_B中,矩阵乘指令执行:

    摘要图
  • 发布了文章 ·
    Arm构架如何让AI应用高效运行于CPU (1)

    Arm为在各类技术领域运行无处不在的人工智能 (AI) 奠定了坚实的技术基础。Arm 始终专注于快速地进行架构演进,确保arm生态系统能够适应未来的技术趋势和不断变化的计算需求。过去二十多年来,Arm 一直致力于为 AI 创新奠定基础,先是在 Armv7 架构中引入了高级单指令多数据 (SIMD) 扩展,初探机器学习 (ML) 工作负载,再...

    摘要图
  • 发布了文章 ·
    第二部分: Arm Scalable Matrix Extension (SME)指令

    内存与ZA tile行或列之间的存取操作指令,以及SVE Z 寄存器和ZA tile 行或列之间的移动指令

    摘要图
  • 发布了文章 ·
    Arm Scalable Matrix Extension介绍

    最近本人写了一篇介绍Arm Scalable Matrix Extension (可伸缩矩阵扩展,SME)的文章,[链接]。此为中文版,也加入了部分Introducing Armv9 Scalable Matrix Extension for AI Innovation on the Arm CPU [链接]内容。

    摘要图
  • 发布了文章 ·
    一个分支预测问题的分析

    现代CPU须在指令预取pipeline stage具备性能良好的分支预测器,以给pipeline后端供应充足有效的指令。大多数CPU会使用 BTB(Branch Target Buffer)或BTAC(Branch Target Address Cache),Global History Buffer 和 RAS(Return Address Stack) 等部件来分别预测程序中分支语句和函数返回的跳转地址,较新的CPU还可能采...

    摘要图
  • 发布了文章 ·
    无虚拟化方式在同一SoC上运行多系统(AMP)的考虑

    汽车SoC芯片上一般采用虚拟化技术来隔离多个虚拟机,在同一硬件平台上运行多个系统,例如一个虚拟机运行IVI Linux/Android系统,另一个虚拟运行Cockpit系统。通过虚拟化技术可以实现在同一SoC硬件平台上的资源隔离分区,如CPU核的分配,物理内存的分配和隔离,外设的分配等。汽车产品上一般是采用Type 1的hypervisor虚拟...

    摘要图
  • 发布了文章 ·
    Arm A-Profile构架2023扩展

    随着人工智能(AI)的崛起和安全威胁加剧,计算的需求持续加强。因此,世界上各种设备核心的基础计算架构的持续演进显得尤为重要。这就是为什么我们的工程团队向Arm架构中添加新的功能和技术,然后软件团队确保软件尽可能无缝地利用这些未来的功能和技术。

    摘要图
  • 关注了用户 ·
  • 发布了文章 ·
    Arm CCA支持的Linux KVM

    之前介绍了CCA设计的一个目的是让non secure hypervisor可以创建和调度RME虚拟机和vCPU,并且给它分配内存等资源,但一旦这些资源分配给RME虚拟机之后,hypervisor就失去了访问这些内存内容的权限。这是通过EL3 monitor软件修改GPT表项实现的。从而实现虚拟机的机密计算。

    摘要图
  • 发布了文章 ·
    Confidential Compute Architecture - Arm构架的TEE新模式

    本文翻译自:ARM Confidential Compute ArchitectureA New Model of Trusted Execution Environment On The ARM Architecture [链接], 并稍作扩展

    摘要图
  • 发布了文章 ·
    Power Control System Architecture文档开放访问了!

    早期的Power Control System Architecture v1.0(文档号 DEN0050)是可以公开访问的,后面到了Power Control System Architecture v2.0 (文档号 DEN0050C), arm选择了将此文档不能公开下载,而是需要申请访问。好消息来了,这个文档现在开放公开访问了,文档号为DEN0050D。

    摘要图
  • 发布了文章 ·
    Arm应用处理器电源管理的变迁-硬件设计

    Arm应用处理器从Arm926(应用于手机和嵌入式系统)开始,历经Arm11,单核Cortex-A8,第一个真正的多核系统Cortex-A9和后面的Cortex-A5,第一个大小核系统A15+A7到后面的A17+A7,A57/A72/A73+A53新的大小核DynamIQ系统A75, A76, A77, A78 + A55最新的Armv9 CPU A710/A720+A510系统Arm应用处理器始终以极佳的能效,低功耗应...

    摘要图
  • 发布了文章 ·
    Neoverse N2和CMN-700系统的PoC点在哪里?

    DC IVAC/ DC CIVAC指令用于将一个虚拟地址对应的cache line从data cache或是unified cache失效或清除失效到PoC点。N2 core硬件默认会将DC IVAC升级为DC CIVAC操作。

    摘要图
  • 发布了文章 ·
    AMBA向多芯片和CHI C2C进发

    Arm的Advanced Microcontroller Bus Architecture(AMBA)在与生态系统合作解决复杂的行业性问题方面有着悠久的历史。现在,随着行业接纳芯粒(chiplets)技术,是时候将AMBA从片上扩展到多芯片了。

    摘要图
  • 发布了文章 ·
    软件使用SMMUv3的stage1还是stage2地址转换

    分享一篇我写的知识文章: [链接]问题SMMUv3硬件可以设计为:只有stage1地址转换支持只用stage2地址转换支持既支持stage1又支持stage2那软件怎么使用stage1和stage2的呢?回答这取决于软件的使用场景。Linux Kernel如果SMMUv3硬件只支持stage1或只支持stage2,那么支持的stage可以用于Linux的DMA-IOMMU和VFIO的场景。在Sh...

    摘要图
  • 发布了文章 ·
    Arm Neoverse N1 核性能分析方法 - 使用硬件PMU事件进行性能分析

    本文翻译自:Arm Neoverse N1 Core: Performance Analysis Methodology Performance Analysis on Neoverse N1 Core Using Hardware PMU Events [链接] 原作者: Jumana Mundichipparakkal, Krishnendra Nathella, Tanvir Ahmed Khan 翻译并稍做扩展:Zenon Xiu

    摘要图
  • 发布了文章 ·
    Armv8-R Cortex-R52+软件集成最佳实践

    本文翻译自 Best Practices for Armv8-R Cortex-R52+ Software Consolidation [链接] 原作者:

    摘要图
  • 发布了文章 ·
    SPE profiling及其使用

    Arm Statical Profiling Extension (SPE)是从armv8.2开始引入的,它提供了硬件上的统计采样的支持。我们已经有了PMU为什么还要SPE呢?

    摘要图
认证与成就
获得 874 次点赞
2019年08月08日 加入
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息