story · 2022年07月13日

多级cache的包含策略(Cache inclusion policy

设计多级cache可以有很多种方式,可以根据一个cache的内容是否同时存在于其他级cache来分类,即Cache inclusion policy

  • 如果较低级别cache中的所有cacheline也存在于较高级别cache中,则称较高级别cache包含inclusive 较低级别cache。
  • 如果较高级别的cache仅包含较低级别的cache中不存在的cacheline,则称较高级别的cache包含(exclusive )较低级别的cache。
  • 如果较高级cache的内容既不严格包含也不排除较低级cache,则称为非包含非排他(non-inclusive non-exclusive NINEcache。

Inclusive Policy cache

考虑一个两级cache 结构的示例,其中 L2 和 L1 是inclusive关系。假设有一个处理器对cacheline X 的读请求:

1、如果cacheline 在 L1 cache中找到,则从 L1 cache中读取数据并返回给处理器。

2、如果该cacheline 未在 L1 cache中找到,但存在于 L2 cache中,则从 L2 cache中提取该cacheline 并将其linefill到 L1 中。

3、如果该请求导致一个cacheline 从 L1 中被逐出,则 L2 不会发生任何动作。如果在 L1 或 L2 中均未找到该cacheline ,则从主存中取出该cacheline 并将其linefill到L1和 L2 中。

4、如果有来自 L2 的evict,L2 cache会向 L1 cache发送invalidation ,以便不违反“Inclusive Policy”。

b4a3f449e43171c527efcca838d86ffa.png

如上图所示,最初 L1 和 L2 cache一开始都是空的(a)。

1、处理器发送一个读 X 请求。一开始L1 和 L2 都是miss的,因此cacheline 从主存被linefill到L1 和 L2,如(b)所示。

2、然后,处理器发出读取 Y 请求,该请求在 L1 和 L2 中均miss 。因此,cacheline Y 被linefill到 L1 和 L2 中,如(c)所示。

3、如果cacheline X 必须从 L1 中evict,那么它只会从 L1 中移除,如(d)所示。

4、如果块 Y 必须从 L2 中evict,它会向 L1 发送invalidation ,因此cacheline Y 从 L1 中移除,如(e)所示。

为了保持inclusion ,需要满足:

1、无论set的数量,L2 way的数量都必须大于或等于 L1 way的数量。
2、无论 L2 way的数量,L2 set的数量必须大于或等于 L1 set的数量。

Exclusive Policy cache

考虑一个 L2 cache 不包含 L1 cache的示例。假设有一个处理器对cacheline X 发起读请求。

1、如果cacheline 在 L1 cache中找到,则从 L1 cache中读取数据并返回给处理器。

2、如果该块未在 L1 cache中找到,但存在于 L2 cache中,则将该cacheline 从 L2 cache移动到 L1 cache。

2、如果一个cacheline 从 L1 中被evict,则被逐出的cacheline 将被放置到 L2 中。这是 L2 linefill的唯一方式。

3、如果在 L1 或 L2 中均未找到该cacheline ,则将其从主存中取出并linefill到 L1 中而不是 L2 中。

ac07b63b5f4c3619bb857ad2a27e4d51.png

如上图所示,最初 L1 和 L2 cache都是空的 (a)。

1、处理器发送一个读 X 请求。它将在 L1 和 L2 中都miss,因此cacheline 从主存被linefill到 L1,如 (b) 所示。

2、处理器再次发出读取 Y 请求,该请求在 L1 和 L2 中均miss。因此,cacheline Y 被linefill到 L1 中,如(c)所示。

3、如果cacheline X 必须从 L1 中逐出,那么它会从 L1 中移除到 L2 中,如(d)所示。

NINE(non-inclusive non-exclusive) Policy

考虑一个 non-inclusive non-exclusive cache的示例。有一个处理器对cacheline X 的读请求:

1、如果cacheline 在 L1 cache中找到,则从 L1 cache中读取数据并返回给处理器。

2、如果该cacheline 未在 L1 cache中找到,但存在于 L2 cache中,则从 L2 cache中提取该cacheline并将其放置到L1 中。

3、如果一个cacheline 从L1逐出,则 L2 没有任何行为,这与Inclusive Policy相同。

4、如果在 L1 和 L2 中都没有找到该cacheline ,则从主存中取出该cacheline 并将其linefill到 L1 和 L2 中。

5、如果从 L2 逐出,与Inclusive Policy不同,没有invalidation 。

1eed94d27eb130973a428d473f8f34bf.png

如上图所示,最初 L1 和 L2 cache都是空的 (a)。假设处理器发送一个读 X 请求。

1、 L1 和 L2 都是miss,因此cacheline 从主存被linefill到L1 和 L2,如(b)所示。

2、 处理器再次发出读取 Y 请求,该请求在 L1 和 L2 中均miss。因此,cacheline Y 被放置在 L1 和 L2 中,如(c)所示。

3、 如果cacheline X 必须从 L1 中逐出,那么它只会从 L1 中移除,如(d)所示。

4、如果cacheline Y 必须从 L2 中逐出,则它仅从 L2 中驱逐,如(e)所示。

3种策略的比较

inclusive policy的优点在于:在每个处理器都具有私有cache 的并行系统中,如果存在cache miss,则检查其他私有cache以查找该cacheline。如果L2 cache包含L1 cache并且在L1 cache中miss,则不需要再搜索L1 cache。这意味着与inclusive cache和 NINE cache相比,inclusive cache的miss 延迟更短。

inclusive policy的一个缺点是:cache的内存容量由L2 cache决定的。exclusive cache的容量是层次结构中所有cache的总容量。如果L2 cache较小,则在inclusive cache中浪费的cache容量更多。

尽管exclusive cache具有更多的内存容量,但相比NINE cache,它需要占用更多的带宽,因为L1 cache evict时需要linefill数据到L2 cache。

因此,需要基于成本和收益评估,然后进行选择_。_

上面仅仅是介绍了cache的包含问题,没有说明不同level cache中的数据一致性问题。可能存在L2 cache和L1 cache同时包含一个cacheline tag,但是其内容是不同的。这取决于write policy:

write back policy在写L1 cache时不会通知L2 cache;
write-through policy在写L1 cache时会通知L2 cache。

787407ad939bdab03fd5bb6be5e20096.png

作者:xpuu
原文:处理器芯片设计

推荐阅读

更多数字IC设计技术干货等请关注数字芯片实验室专栏。添加极术小姐姐(微信:aijishu20)微信可申请加入IC设计交流群。
推荐阅读
关注数
12321
内容数
224
前瞻性的眼光,和持之以恒的学习~
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息