ARM体系架构基础知识
1. 什么是ARM架构?它有哪些特点和优势?
参考答案
ARM架构(Advanced RISC Machine)是一种处理器架构,广泛应用于移动设备、嵌入式系统和低功耗应用中。以下是ARM架构的一些特点和优势:
参考资料:
- ARM architecture[1]
a.简化指令集
:ARM采用精简指令集(RISC, Reduced Instruction Set Computer),指令集简单且易于解码和执行,使得处理器设计更加高效。
b.低功耗设计
:ARM架构在设计上注重低功耗特性,使得ARM处理器能够在电池供电的移动设备上实现较长的续航时间。
c.高性能
:尽管ARM架构着重于低功耗设计,但它也能提供出色的性能。ARM处理器通过多核设计、高频率运行和高级优化技术,实现了高效的计算能力。
d.可扩展性
:ARM架构具有良好的可扩展性,可以应用于不同的设备和应用领域。从低端的嵌入式系统到高端的服务器,ARM处理器都能够满足各种需求。
e.软件生态系统
:ARM架构享有广泛的软件生态系统支持。许多操作系统(如Android、iOS)和应用程序已经针对ARM架构进行了优化,使得ARM处理器成为移动设备的首选。
f.设计定制性
:ARM架构提供了灵活的设计定制选项,使得芯片制造商能够根据特定应用的需求进行定制和优化,从而实现更好的性能和功耗平衡。
2. ARM体系结构的版本有哪些?它们之间有什么区别?
参考答案
ARM体系结构有多个版本,其中一些主要版本包括:
这些不同版本的ARM体系结构之间的区别主要体现在指令集、功能和架构特性方面。每个版本都对之前的版本进行了改进和扩展,以提供更高的性能、更丰富的功能和更好的能效。
参考资料:
- ARM architecture family[2]
a. ARMv1:最早的ARM体系结构版本,于1985年发布。它使用了32位的精简指令集。
b. ARMv2:于1986年发布,增加了一些新的指令和功能。
c. ARMv3:于1992年发布,引入了Thumb指令集,该指令集使用16位指令,用于提高代码密度。
d. ARMv4:于1994年发布,增加了更多指令和功能,如支持Java虚拟机(Jazelle)和分页内存管理。
e. ARMv5:于1997年发布,引入了更多指令和功能,包括协处理器支持、增强的分页内存管理和增强的Thumb指令集。
f. ARMv6:于2002年发布,引入了Thumb-2指令集,该指令集能够同时支持16位和32位指令。
g. ARMv7:于2005年发布,包括多个变体,如ARMv7-A(应用程序处理器)、ARMv7-R(实时处理器)和ARMv7-M(微控制器)。ARMv7架构增加了更多指令和功能,如NEON(SIMD指令集扩展)和虚拟化支持。
h. ARMv8:于2011年发布,引入了AArch64(64位执行状态),与之前的ARMv7架构兼容。ARMv8还包括一些新的特性,如更高的性能、更大的虚拟地址空间和更丰富的加密支持。
i. ARMv9:于2021年发布,引入了许多新的功能,如Confidential Compute Architecture(机密计算架构)、Realms(安全执行环境)和SVE2(可扩展向量扩展2)等。
3. 请解释一下ARM处理器的体系结构,包括处理器模式、寄存器和指令集等。
参考资料:
- ARM processor modes[3]
- ARM processor modes[4]
- ARM Developer Suite Assembler Guide - Registers[5]
- ARM指令集包含32位的指令,提供了丰富的功能和灵活性。
- Thumb指令集支持16位的指令,用于提高代码密度和节省存储空间。
- 最新的ARM处理器还支持AArch64执行状态,提供了64位的指令集,称为AArch64指令集。
- 通用寄存器(General-Purpose Registers):用于存储临时数据和计算结果。
- 程序计数器(Program Counter,PC):存储当前正在执行的指令的地址。
- 程序状态寄存器(Current Program Status Register, CPSR):存储处理器的状态信息,如处理器模式、中断使能等。
- 程序状态保存寄存器(Saved Program Status Registers, SPSR):当异常发生时,用于存储CPSR信息。
- 用户模式(User Mode):用户模式是一种常规模式,用于执行应用程序。在用户模式下,处理器的权限较低,无法直接执行特权指令或访问受保护的系统资源。它是最受限制的模式。
- 系统模式(System Mode):运行具有特权的操作系统任务。
- 管理模式(Supervisor mode):操作系统使用的保护模式。在系统复位或执行软件中断指令SWI时进入。
- 中止模式(Abort mode):当数据或指令预取终止时进入该模式,可用于虚拟存储及存储保护。
- 未定义模式(Undefined mode):当未定义的指令执行时进入该模式,可用于支持硬件协处理器的软件仿真。
- 快速中断模式(FIQ mode):用于高速数据传输或通道处理。
- 外部中断模式(IRQ mode):用于通用的中断处理。
- 模式(Hyp mode):用于虚拟化环境中的虚拟化监管。
a. 处理器模式:ARM处理器有多个处理器模式,每个模式用于执行不同类型的任务。常见的处理器模式包括:
b. 寄存器:ARM处理器有多个寄存器,用于存储和处理数据。常见的寄存器包括:
c. 指令集:ARM处理器使用ARM指令集和Thumb指令集。
4. 什么是Thumb指令集?与ARM指令集有什么区别?
参考答案
Thumb指令集是ARM架构中的一种16位指令集,旨在提高代码密度和降低存储器需求。下面是Thumb指令集与ARM指令集的区别:
参考资料:
- ARM instruction set overview[6]
- The Thumb instruction set[7]
a.指令长度
:ARM指令集的指令长度为32位,而Thumb指令集的指令长度为16位。由于指令长度减少了一半,Thumb指令集可以在同样的存储空间下存储更多的指令,从而提高了代码密度。
b.寄存器数量
:ARM指令集有16个通用寄存器,每个寄存器都是32位的。而Thumb指令集有8个通用寄存器,每个寄存器都是16位的。这意味着在Thumb指令集中,可以同时使用的寄存器数量更少,因此需要更频繁地进行数据的加载和存储。
c.指令集功能
:ARM指令集提供了更多的功能和灵活性,支持更多的数据处理操作和复杂的指令流控制。相比之下,Thumb指令集在设计上更加简化,提供了基本的数据操作和简单的控制流指令,牺牲了一些高级功能和复杂的指令。
d.性能
:由于Thumb指令集的指令长度较短,指令的执行时间通常也较短。因此,在某些情况下,Thumb指令集可以提供更高的执行速度和更低的功耗。
5. 请介绍一下ARM的异常处理机制,包括中断和异常的区别以及处理过程。
参考资料:
- Exception handling process[8]
中断(Interrupt)
是由外部设备或事件引发的中断请求,用于打断正在执行的指令流,让处理器转移到中断服务程序(Interrupt Service Routine,ISR)来处理该事件。中断通常由外部设备的信号触发,例如定时器溢出、外部设备的输入等。异常(Exception)
是由程序运行过程中的异常情况引发的事件,如无效的指令、访问越界、除以零等。异常会导致处理器从当前模式切换到异常模式,并执行异常处理程序(Exception Handler)来处理异常情况。
a. 当发生异常时,处理器会保存当前的上下文信息(如寄存器状态、程序计数器等),以便稍后恢复执行。
b. 处理器会根据异常类型和优先级判断是否响应该异常,如果需要响应,则会切换到异常模式,并跳转到相应的异常处理程序。
c. 异常处理程序会执行相关的异常处理逻辑,如错误处理、状态恢复、错误日志记录等。
d. 在处理完异常后,处理器会从保存的上下文信息中恢复状态,并回到原来的模式和指令流中,继续执行。
e. 中断和异常的区别:
f. 异常处理过程:
6. 什么是ARM的Cache和MMU?它们在系统中的作用是什么?
参考答案
a. Cache
:Cache是一种位于处理器和主存之间的高速存储器,用于存储最近使用的数据和指令。它的作用是通过预先将数据和指令复制到快速的缓存中,加快对数据的访问速度,减少对主存的访问次数。Cache的工作原理是基于局部性原理,即程序和数据的访问往往呈现出一定的空间局部性和时间局部性。Cache通过存储最近使用的数据块,以便在后续的访问中快速提供数据,减少了对主存的延迟。
b. MMU
:MMU是负责管理虚拟内存和物理内存之间映射关系的组件。它允许操作系统和应用程序使用虚拟内存地址,而不必关心物理内存的实际分配情况。MMU的主要功能包括地址转换和内存保护。它通过将虚拟地址转换为物理地址,实现了对虚拟内存的透明访问。MMU还负责内存保护,通过访问控制和权限设置,确保不同应用程序之间的内存隔离和安全性。MMU还支持内存映射技术,例如页面映射(Page Mapping)和段映射(Segment Mapping),以及虚拟内存的分页和分段机制,实现了灵活的内存管理和资源分配。
7. 什么是ARM的大端和小端字节序?它们在ARM体系结构中的应用是什么?
参考答案
字节序(Byte Order)指的是多字节数据在内存中存储的顺序。
在ARM体系结构中,字节序对于处理器和操作系统的开发者来说是重要的。不同的字节序可能会影响数据的读取和存储,特别是在跨平台和数据交换的情况下。
参考资料:
- Endianness[9]
a.大端字节序
:在大端字节序中,多字节数据的高位字节存储在低地址处,而低位字节存储在高地址处。这意味着多字节数据的字节顺序与其在内存中的存储顺序相同。
b.小端字节序
:在小端字节序中,多字节数据的低位字节存储在低地址处,而高位字节存储在高地址处。这意味着多字节数据的字节顺序与其在内存中的存储顺序相反。
8. 请介绍一下ARM的协处理器(Coprocessor)和向量处理器(NEON)
参考资料:
- Coprocessor support[10]
- Arm Neon[11]
a.协处理器(Coprocessor)
:协处理器是ARM处理器的一个可选扩展,用于执行特定的处理任务。它是与主处理器并行工作的一个辅助处理器。协处理器可以执行一些特定的指令和操作,例如浮点运算、加密算法、信号处理等。通过将特定任务分配给协处理器,ARM处理器可以提高处理性能和效率。
b.向量处理器(NEON)
:NEON是ARM处理器中的一个向量处理器扩展,用于高效执行并行的多媒体和信号处理操作。NEON提供了一组特定的指令和寄存器,用于同时处理多个数据元素,例如矢量、矩阵和像素数据。这使得ARM处理器能够高效地执行诸如图像处理、音频处理、视频编解码等计算密集型任务。
9. 解释一下ARM的体系结构中的模式和模式切换
参考答案
ARM体系中的8种模式可见问题3,关于模式切换的解释如下:
模式切换是指从当前模式切换到另一个模式。ARM体系结构提供了一些特定的指令和方式来实现模式切换。例如,使用SVC(Supervisor Call)指令可以从用户模式切换到管理模式,而使用SWI(Software Interrupt)指令可以从用户模式切换到中断模式。
在模式切换时,当前模式的寄存器状态将保存在相应的模式特定的寄存器集中,然后加载目标模式的寄存器状态。这样可以确保在不同的模式之间切换时,不会丢失关键的状态信息。模式切换还会改变处理器的特权级别,从而决定哪些指令和资源可以被访问和执行。
10. 请解释一下ARM处理器的管道流水线和流水线相关的概念
参考答案
ARM处理器的管道流水线是一种用于提高指令执行效率的技术。它将指令执行过程划分为多个阶段,并在每个阶段引入寄存器,使得多条指令可以同时在不同的阶段执行。这样可以提高处理器的吞吐量,使得指令能够更快地完成执行。
流水线中的不同阶段包括:
每个阶段负责不同的任务,并且通过寄存器传递结果到下一个阶段。
通过流水线技术,当一条指令执行进入流水线后,后续的指令可以继续进入流水线的不同阶段,从而实现指令级并行(Instruction-Level Parallelism)。这可以提高处理器的效率,使得多条指令可以在同一时间段内重叠执行。
参考资料:
- Execution pipeline stages[12]
- Pipelining in ARM[13]
a. 取指令(Instruction Fetch)
b. 译码(Instruction Decode)
c. 执行(Execute)
d. 访存(Memory Access)
e. 写回(Write Back)
11. 什么是ARM中断控制器(Interrupt Controller)?举例说明如何处理中断。
参考答案
ARM中断控制器(Interrupt Controller)是ARM处理器中的一个重要组件,用于管理和处理中断信号。它负责接收来自外部设备或内部事件的中断请求,并根据优先级和配置信息将中断信号传递给处理器核心。
下面是一个简单的示例,说明ARM中断控制器如何处理中断:
a. 外部设备发出中断请求信号,例如一个键盘按键被按下。
b. 中断控制器接收到中断请求信号,并根据预先配置的中断优先级判断该中断的优先级。
c. 如果该中断的优先级高于当前正在处理的中断,中断控制器将中断请求传递给处理器核心。
d. 处理器核心响应中断,暂停当前的指令执行,并跳转到中断处理程序的入口地址。
e. 中断处理程序执行相应的处理操作,例如读取键盘输入数据。
f. 处理完成后,中断处理程序返回到中断发生前的指令位置,恢复之前的执行状态。
g. 中断控制器通知处理器中断处理结束,并可以选择响应下一个优先级较高的中断请求。
12. ARM体系结构中的Thumb-2技术是什么?它如何提高代码密度和性能?
参考答案
Thumb-2是ARM体系结构中的一种指令集技术,旨在提高代码密度和性能。它结合了Thumb指令集(16位指令)和ARM指令集(32位指令),使得处理器能够同时执行16位和32位指令,以适应不同的应用场景。Thumb-2技术提供了以下优势:
a. 代码密度改善
:Thumb-2指令集中的16位指令相比于32位指令更加紧凑,占用更少的存储空间。通过使用Thumb-2指令集,可以显著减少程序的代码大小。这对于存储有限的设备(如嵌入式系统)和带宽受限的环境非常有益。
b. 性能提升
:Thumb-2技术不仅仅是为了减少代码大小,还针对性能进行了优化。Thumb-2指令集中的某些16位指令具有与对应的32位指令相似的执行效率。这意味着通过使用Thumb-2指令集,可以在减少代码大小的同时保持较高的执行效率。
c. 兼容性和灵活性
:Thumb-2技术兼容先前的Thumb指令集,因此可以无缝地与使用Thumb指令集编写的现有代码进行交互。此外,处理器可以在Thumb状态和ARM状态之间进行快速切换,使得开发人员可以根据需要选择最适合的指令集。
13. ARM处理器的访存模型是什么?它与虚拟内存有什么关系?
参考资料:
- 哈佛架构[14]
- 冯·诺伊曼结构[15]
a. ARM的访存模型:ARM处理器采用了一种称为“Harvard结构”的访存模型,其中指令和数据分别存储在不同的内存空间中。中央处理器首先到程序指令储存器中读取程序指令内容,解码后得到数据地址,再到相应的数据储存器中读取数据,并进行下一步的操作(通常是执行)。程序指令储存和数据储存分开,数据和指令的储存可以同时进行,可以使指令和数据有不同的数据宽度,
b. 与虚拟内存的关系:ARM处理器与虚拟内存之间的关系是通过内存管理单元(MMU)来实现的。MMU负责将程序中的虚拟地址转换为物理地址。在访问内存时,ARM处理器使用虚拟地址进行操作,然后MMU根据映射表(Page Table)将虚拟地址转换为物理地址。这种地址转换的过程是透明的,程序无需关心物理内存的实际布局。
14. ARM处理器的浮点运算支持是如何实现的?有哪些浮点运算指令?
参考答案
ARM处理器的浮点运算支持是通过浮点单元(Floating-Point Unit,FPU)
来实现的。FPU是一个硬件模块,专门用于执行浮点运算,包括浮点加减、乘除、取整等操作。
ARM处理器中的浮点运算指令集被称为VFP(Vector Floating-Point)指令集
。VFP指令集提供了一系列的浮点运算指令,包括:
参考资料:
- FPU instruction set[16]
a. 浮点加减指令:用于执行浮点数的加法和减法操作。例如,VADD(浮点加法)和VSUB(浮点减法)指令。
b. 浮点乘法指令:用于执行浮点数的乘法操作。例如,VMUL(浮点乘法)指令。
c. 浮点除法指令:用于执行浮点数的除法操作。例如,VDIV(浮点除法)指令。
d. 浮点取整指令:用于执行浮点数的取整操作,包括向下取整、向上取整、截断等。例如,VCVT(浮点取整)指令。
e. 浮点比较指令:用于比较两个浮点数的大小。例如,VCMPE(浮点比较)指令。
f. 浮点转换指令:用于执行不同浮点数格式之间的转换。例如,VCVT(浮点转换)指令。
g. 浮点数据加载和存储指令:用于将浮点数据加载到寄存器或存储到内存。例如,VLDR(浮点加载)和VSTR(浮点存储)指令。
15. ARM处理器的功耗管理机制是如何工作的?有哪些方法可以降低功耗?
参考答案
ARM处理器采用了多种功耗管理机制来降低功耗并提高能效。这些机制旨在根据处理器的工作负载和需求动态调整处理器的性能和功耗。以下是一些常见的ARM处理器功耗管理机制和方法:
参考资料:
- Dynamic Voltage and Frequency Scaling[17]
a.动态电压频率调节(Dynamic Voltage and Frequency Scaling,DVFS)
:DVFS允许处理器根据负载需求动态调整工作频率和电压。当处理器需要更高的性能时,可以增加工作频率和电压;当处理器处于轻负载或空闲状态时,可以降低工作频率和电压以降低功耗。
b.休眠状态和低功耗模式
:处理器可以进入休眠状态或低功耗模式,在这些状态下,处理器的工作频率和电压会被降低到最低限度,以节省功耗。当处理器再次需要被唤醒时,会恢复到正常工作状态。
c.智能缓存和预取机制
:处理器的缓存和预取机制可以提高数据访问效率,减少对主存的访问次数,从而降低功耗。智能缓存能够预测和缓存可能的数据访问模式,以提供更高的数据命中率和更低的功耗。
d.功耗优化的指令调度和执行
:处理器在指令调度和执行时可以采取一些技术来降低功耗。例如,乱序执行(Out-of-order Execution)可以在不影响程序正确性的前提下重排指令的执行顺序,以优化资源利用和降低功耗。
e.硬件加速器和专用引擎
:一些ARM处理器集成了硬件加速器和专用引擎,用于执行特定的计算任务(如加密、解压缩等),这些加速器和引擎通常比通用处理器更高效,可以降低功耗。
f.功耗分析和优化工具
:ARM提供了各种功耗分析和优化工具,开发人员可以使用这些工具来评估和优化处理器的功耗。这些工具可以帮助开发人员识别功耗热点、优化算法和代码,从而降低功耗。
16. 什么是ARM的片上总线(AMBA)?它有哪些常见的版本?
参考答案
AMBA(Advanced Microcontroller Bus Architecture)
是由ARM公司提出的一种片上总线协议和架构。它定义了一组标准接口和通信协议,用于连接和协调处理器内部的不同模块和外设。AMBA提供了一种灵活、可扩展和可重用的总线架构,使得不同模块和外设能够有效地进行数据传输和通信。它通过规范化接口和传输协议,简化了系统设计和集成的复杂性。
常见的AMBA版本包括:
- AHB是一种高性能、低延迟的总线,用于连接高带宽和关键性能的模块,如处理器和高速存储器。- APB是一种低带宽、低功耗的总线,用于连接较简单的外设,如GPIO(通用输入输出)和串口控制器。
- AXI是一种高性能、高带宽的总线,用于连接处理器、内存和高性能外设。它支持多主机、多从机配置,并具有更高的并行性和流水线能力。
- ACE是AMBA 4协议的扩展版本,用于支持多核处理器系统中的一致性和高性能通信
参考资料:
- AMBA 規格[18]
c.AMBA 4(Advanced Microcontroller Bus Architecture 4th Generation)
:AMBA 4版本引入了ACE(AMBA 4 Coherency Extensions)总线规范。
d.AMBA 3(Advanced Microcontroller Bus Architecture 3rd Generation)
:AMBA 3版本引入了新的总线规范:AXI(Advanced eXtensible Interface)。
e.AMBA 2(Advanced Microcontroller Bus Architecture 2nd Generation)
:AMBA 2版本是AMBA总线的第二代,引入了两个主要的总线规范:AHB(Advanced High-performance Bus)和APB(Advanced Peripheral Bus):
推荐阅读
参考资料
[1] ARM architecture
[2] ARM architecture family
[3] ARM processor modes
[4] ARM processor modes
[5] ARM Developer Suite Assembler Guide - Registers
[6] ARM instruction set overview
[7] The Thumb instruction set
[8] Exception handling process
[9] Endianness
[10]Coprocessor support
[11] Arm Neon
[12] Execution pipeline stages
[13] Pipelining in ARM
[14] 哈佛结构
[15] 冯·诺伊曼结构
[16] FPU instruction set
[17] Dynamic Voltage and Frequency Scaling
[18] AMBA 規格
作者:yangyubin1993
文章来源:TrustZone
推荐阅读
- 搞DDR必懂的关键技术笔记:DDR RAS—内存中的纠错码 (ECC)
- 牛掰!这老哥用显微镜摄取芯片ROM,还原了芯片的二进制固件。
- 搞DDR必懂的关键技术笔记:深入探究DDR物理结构
- 搞DDR,你是可以看看我的这篇笔记(三)
更多物联网安全,PSA等技术干货请关注平台安全架构(PSA)专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入PSA技术交流群,请备注研究方向。