多级cache的包含策略（Cache inclusion policy

设计多级cache可以有很多种方式，可以根据一个cache的内容是否同时存在于其他级cache来分类，即Cache inclusion policy。

如果较低级别cache中的所有cacheline也存在于较高级别cache中，则称较高级别cache包含（inclusive ）较低级别cache。
如果较高级别的cache仅包含较低级别的cache中不存在的cacheline，则称较高级别的cache不包含（exclusive ）较低级别的cache。
如果较高级cache的内容既不严格包含也不排除较低级cache，则称为非包含非排他（non-inclusive non-exclusive ，NINE）cache。

Inclusive Policy cache

考虑一个两级cache 结构的示例，其中 L2 和 L1 是inclusive关系。假设有一个处理器对cacheline X 的读请求：

1、如果cacheline 在 L1 cache中找到，则从 L1 cache中读取数据并返回给处理器。

2、如果该cacheline 未在 L1 cache中找到，但存在于 L2 cache中，则从 L2 cache中提取该cacheline 并将其linefill到 L1 中。

3、如果该请求导致一个cacheline 从 L1 中被逐出，则 L2 不会发生任何动作。如果在 L1 或 L2 中均未找到该cacheline ，则从主存中取出该cacheline 并将其linefill到L1和 L2 中。

4、如果有来自 L2 的evict，L2 cache会向 L1 cache发送invalidation ，以便不违反“Inclusive Policy”。

如上图所示，最初 L1 和 L2 cache一开始都是空的(a)。

1、处理器发送一个读 X 请求。一开始L1 和 L2 都是miss的，因此cacheline 从主存被linefill到L1 和 L2，如（b）所示。

2、然后，处理器发出读取 Y 请求，该请求在 L1 和 L2 中均miss 。因此，cacheline Y 被linefill到 L1 和 L2 中，如（c）所示。

3、如果cacheline X 必须从 L1 中evict，那么它只会从 L1 中移除，如（d）所示。

4、如果块 Y 必须从 L2 中evict，它会向 L1 发送invalidation ，因此cacheline Y 从 L1 中移除，如（e）所示。

为了保持inclusion ，需要满足：

1、无论set的数量，L2 way的数量都必须大于或等于 L1 way的数量。
2、无论 L2 way的数量，L2 set的数量必须大于或等于 L1 set的数量。

Exclusive Policy cache

考虑一个 L2 cache 不包含 L1 cache的示例。假设有一个处理器对cacheline X 发起读请求。

1、如果cacheline 在 L1 cache中找到，则从 L1 cache中读取数据并返回给处理器。

2、如果该块未在 L1 cache中找到，但存在于 L2 cache中，则将该cacheline 从 L2 cache移动到 L1 cache。

2、如果一个cacheline 从 L1 中被evict，则被逐出的cacheline 将被放置到 L2 中。这是 L2 linefill的唯一方式。

3、如果在 L1 或 L2 中均未找到该cacheline ，则将其从主存中取出并linefill到 L1 中而不是 L2 中。

如上图所示，最初 L1 和 L2 cache都是空的 (a)。

1、处理器发送一个读 X 请求。它将在 L1 和 L2 中都miss，因此cacheline 从主存被linefill到 L1，如 (b) 所示。

2、处理器再次发出读取 Y 请求，该请求在 L1 和 L2 中均miss。因此，cacheline Y 被linefill到 L1 中，如（c）所示。

3、如果cacheline X 必须从 L1 中逐出，那么它会从 L1 中移除到 L2 中，如（d）所示。

NINE（non-inclusive non-exclusive） Policy

考虑一个 non-inclusive non-exclusive cache的示例。有一个处理器对cacheline X 的读请求:

1、如果cacheline 在 L1 cache中找到，则从 L1 cache中读取数据并返回给处理器。

2、如果该cacheline 未在 L1 cache中找到，但存在于 L2 cache中，则从 L2 cache中提取该cacheline并将其放置到L1 中。

3、如果一个cacheline 从L1逐出，则 L2 没有任何行为，这与Inclusive Policy相同。

4、如果在 L1 和 L2 中都没有找到该cacheline ，则从主存中取出该cacheline 并将其linefill到 L1 和 L2 中。

5、如果从 L2 逐出，与Inclusive Policy不同，没有invalidation 。

如上图所示，最初 L1 和 L2 cache都是空的 (a)。假设处理器发送一个读 X 请求。

1、 L1 和 L2 都是miss，因此cacheline 从主存被linefill到L1 和 L2，如（b）所示。

2、处理器再次发出读取 Y 请求，该请求在 L1 和 L2 中均miss。因此，cacheline Y 被放置在 L1 和 L2 中，如（c）所示。

3、如果cacheline X 必须从 L1 中逐出，那么它只会从 L1 中移除，如（d）所示。

4、如果cacheline Y 必须从 L2 中逐出，则它仅从 L2 中驱逐，如（e）所示。

3种策略的比较

inclusive policy的优点在于：在每个处理器都具有私有cache 的并行系统中，如果存在cache miss，则检查其他私有cache以查找该cacheline。如果L2 cache包含L1 cache并且在L1 cache中miss，则不需要再搜索L1 cache。这意味着与inclusive cache和 NINE cache相比，inclusive cache的miss 延迟更短。

inclusive policy的一个缺点是：cache的内存容量由L2 cache决定的。exclusive cache的容量是层次结构中所有cache的总容量。如果L2 cache较小，则在inclusive cache中浪费的cache容量更多。

尽管exclusive cache具有更多的内存容量，但相比NINE cache，它需要占用更多的带宽，因为L1 cache evict时需要linefill数据到L2 cache。

因此，需要基于成本和收益评估，然后进行选择_。_

上面仅仅是介绍了cache的包含问题，没有说明不同level cache中的数据一致性问题。可能存在L2 cache和L1 cache同时包含一个cacheline tag，但是其内容是不同的。这取决于write policy：

write back policy在写L1 cache时不会通知L2 cache；
write-through policy在写L1 cache时会通知L2 cache。

作者：xpuu
原文：处理器芯片设计

推荐阅读

更多数字IC设计技术干货等请关注数字芯片实验室专栏。添加极术小姐姐（微信：aijishu20)微信可申请加入IC设计交流群。

Inclusive Policy cache

Exclusive Policy cache

NINE（non-inclusive non-exclusive） Policy

3种策略的比较

推荐阅读

目录