17

baron · 2023年08月22日 · 江苏

简述cache的基本概念和使用场景

1、为什么要用cache?

ARM 架构刚开始开发时,处理器的时钟速度和内存的访问速度大致相似。今天的处理器内核要复杂得多,并且时钟频率可以快几个数量级。然而,外部总线和存储设备的频率并没有达到同样的程度。可以实现可以与内核以相同速度运行的小片上 SRAM块,但与标准 DRAM 块相比,这种 RAM 非常昂贵,标准 DRAM 块的容量可能高出数千倍。在许多基于 ARM 处理器的系统中,访问外部存储器需要数十甚至数百个内核周期。

高速缓存是位于核心和主内存之间的小而快速的内存块。它在主内存中保存项目的副本。对高速缓冲存储器的访问比对主存储器的访问快得多。每当内核读取或写入特定地址时,它首先会在缓存中查找。如果它在高速缓存中找到地址,它就使用高速缓存中的数据,而不是执行对主存储器的访问。通过减少缓慢的外部存储器访问时间的影响,这显着提高了系统的潜在性能。通过避免驱动外部信号的需要,它还降低了系统的功耗

image.png

2、为什么要学习cache呢?

cache和我们软件工程师有啥关系?其实在很多时候,硬件都会自动去维护cache和内存直接的一致性,这和我们软件工程师都没有太大的关系,所以很多时候我们也无需去理解cache的原理。但是实就是事实,不管你有没有理解,你都是一直在使用的。做为一名底层的软件开发者,有些时候,你也不得不去主动刷新cache,即软件中维护内存一致性 。

那么一般什么时候需要主动刷cache呢(软件中维护内存一致性) ? 以下便举了几个最常见的示例。

2.1、 不同的Master硬件共享数据时

例如一个core和一个crypto engine硬件,在共享数据的时候。需要软件主动去invalid或flush cache的操作。

2.1.1、软件中维护内存一致性 – flush cache

image.png

2.1.2、软件中维护内存一致性 – invalid cache

image.png

2.2、 不同的缓存策略的系统共享数据时

例如在一个TEE + linux的系统中,且两个系统有着不同的缓存策略。如linux kernel中是outer cacheable,TEE中是non-cacheable

2.2.1、软件中维护内存一致性 – flush cache

image.png

2.2.2、软件中维护内存一致性 – invalid cache

image.png

3、怎么去刷cache呢?(软件维护cache的一致性)

ARM提供了操作cache的指令, 软件维护操作cache的指令有三类:

  • Invalidation:其实就是修改valid bit,让cache无效
  • Cleaning:清除cache中的data和TAG,这其实就是我们所说的flush cache,这里会将cache数据回写到内存,并清除dirty标志
  • Zero:将cache中的数据清0

那么一般什么时候需要软件维护cache一致性呢?:

(1)、当有其它的Master改变的external memory,如DMA操作
(2)、MMU的enable或disable的整个区间的内存访问
(3)、当不同缓存策略的系统使用同一块内存通信时,如REE enable了mmu,TEE disable了mmu

针对第(2)点,cache怎么和mmu扯上关系了呢?那是因为: mmu的开启和关闭,影响了内存的permissions, cache policies

3.1、cache一致性指令介绍

查阅armv8/armv9的aarch64体系中,定义了如下的缓存一致性操作指令

image.png

指令太多,不太好记,然后我们总结如下:

image.png

按照指令,分为:

  • IC : 操作instruction cache
  • DC : 操作data cache

按照操作,分为以下三类:

  • Invalidation:其实就是修改valid bit,让cache无效。
  • Cleaning:清除cache中的data和TAG,这其实就是我们所说的flush cache,这里会将cache数据回写到内存,并清除dirty标志
  • Zero:将cache中的数据清0

Points的定义:

其描述的是操作cache的范围

  • Point of Unification (PoU) :instruction、data、TLB访问一致性的点
  • Point of Coherency (PoC):agents访问内存一致性的点
  • Point of Persistence (PoP) :和FEAT_DPB、FEAT_DPB2 feature相关
  • Point of Deep Persistence (PoDP):访问memory一致性的点!!!

image.png

3.2、cache一致性指令的使用示例

image.png

3.3、 操作系统中软件维护cache一致性的API

在操作系统中,我们只需要调用相关的API即可,也无需牢记以上的维护cache一致性的命令。

比如在Linux Kernel 操作Cache的API如下所示:

linux/arch/arm64/mm/cache.Slinux/arch/arm64/include/asm/cacheflush.hvoid __flush_icache_range(unsigned long start, unsigned long end);int  invalidate_icache_range(unsigned long start, unsigned long end);void __flush_dcache_area(void *addr, size_t len);void __inval_dcache_area(void *addr, size_t len);void __clean_dcache_area_poc(void *addr, size_t len);void __clean_dcache_area_pop(void *addr, size_t len);void __clean_dcache_area_pou(void *addr, size_t len);long __flush_cache_user_range(unsigned long start, unsigned long end);void sync_icache_aliases(void *kaddr, unsigned long len);void flush_icache_range(unsigned long start, unsigned long end)void __flush_icache_all(void)
作者:baron
文章来源:Arm精选

推荐阅读

image.png

欢迎关注ARM精选专栏, 欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。
推荐阅读
关注数
9441
内容数
191
以易懂、渐进、有序的方式,深入探讨ARMv8/ARMv9架构的核心概念。我们将从基础知识开始,逐步深入,覆盖最新的架构,不再纠缠于过时技术。本系列内容包含但不限于ARM基础、SOC芯片基础、Trustzone、gic、异常和中断、AMBA、Cache、MMU等内容,并将持续更新。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息