实现时序收敛的关键要素之一是确保我们编写出能够充分利用设备架构特性和实现工具功能的优质代码。
让我们来看看可以帮助我们提供更好质量代码的几个方面。
架构
从项目开始规划架构,并尽可能利用 IP 核来减少所需的开发量(并不特指官方 IP)。在层次结构方面,有几点注意事项:
- 将输入和输出结构保持在顶层。使我们能够轻松进行更改,并轻松地将设计移植到新架构,例如从 7 系列 FPGA 移植到 UltraScale。
- 将时钟结构保持在顶层,并在独立模块中实现它们。
- 所有模块的输入和输出采用寄存器架构。解决模块内的时序问题比跨模块的路径问题更容易。寄存器型 I/O 的另一个好处是,它可以防止逻辑在优化期间在模块之间移动,这可以极大地帮助调试。
- 确保接口尽可能利用标准接口,例如 AXI、AXI Lite 和 AXI Stream。
复位
在 AMD 生态系统中,是否使用复位的问题很重要。只要有可能,我们就应该利用全局复位,它在配置结束时应用。这意味着每个寄存器在启动结束时都处于已知状态。如果我们在设计中使用复位,我们可能会限制综合引擎映射到某些结构的能力,从而影响我们设计的时序性能。是否需要复位取决于每个设计;通常,控制路径逻辑可能需要复位,而数据路径逻辑则不需要。
如果需要复位,请勿使用异步复位;这会对设计的时序性能和利用率产生重大影响(后续我们再讨论)。
时钟使能
时钟使能在我们的设计中非常有用;可以使用它们来降低整个设计的功耗或作为我们功能的一部分,例如,生成较低时钟速率运行的 I2C 或 SPI 输出。
然而,大量的时钟使能可以显著增加设计中的控制集数量。如果不熟悉控制集,控制集的定义是置位/复位、时钟使能和驱动 SRL、LUTRAM 或寄存器的时钟。
有助于实现这一点的一种方法是控制集优化,当综合工具识别出同步复位/置位启用时,它会检查已识别逻辑上的负载。
如果逻辑低于-control_set_opt_threshold 中标识的阈值,则综合引擎使用数据路径上的逻辑门而不是使用寄存器输入来实现复位/置位。
对于 7 系列设备,此阈值的默认设置为 4;对于 UltraScale 设备,此阈值的默认设置为 2。
如果我们想要控制信号的 direct / extract,我们可以使用下面的属性。
- Direct Enable / Direct Reset 强制综合工具使用寄存器引脚。
- Extract Enable / Extract Reset 强制综合工具使用数据路径进行控制和复位。
流水线
流水线使我们能够重构具有多层逻辑的数据路径。其理念是,我们可以在逻辑层之间引入寄存器,从而以增加延迟为代价实现更快的时钟频率。如果我们从设计项目开始就考虑流水线,我们可以利用综合工具的功能来帮助我们实现流水线,这称为重定时。
解决此问题的方法之一是,在模块中,在我们认为需要重定时的逻辑之前或之后添加几个额外的寄存器。然后,综合引擎可以根据需要实现重定时。如果我们想要更直接的控制,如果寄存器放在前面,我们可以使用前向重定时属性;如果寄存器放在最后,我们可以使用后向重定时属性。这样就不必自己分解逻辑层,并使综合工具在放置寄存器的位置方面具有最大的灵活性。
如果需要,可以使用自动流水线属性自动执行流水线操作,并由综合工具自行决定。
Block RAM
BRAM 在我们的设计中至关重要;只要有可能,我更喜欢 EDA 自己推断 BRAM,而不是实例化它们。对于寄存器,BRAM 输出应至少两级输出寄存器。这使综合工具能够在 BRAM 中实现一个寄存器,在结构中实现另一个寄存器,同时将总延迟增加到三个时钟周期。这具有提供比 BRAM 寄存器更快的时钟输出时序的优势。对于输入寄存器,使用寄存器级驱动 BRAM 输入可能会很有帮助,特别是如果使用多个 BRAM 资源在芯片上创建更大的 BRAM 结构时;额外的寄存器对于时序收敛非常有益。
后续我们再举例详细说明上面的方方面面~
END
作者:碎碎思
来源:OpenFPGA
相关文章推荐
- 基于 FPGA 实时时钟的设计(附源工程)
- 基于 FPGA 的 IIC 设计(附源工程)
- 使用 IP 核和开源库减少 FPGA 设计周期
- 基于 FPGA 的任意波形发生器(DDS)设计(附源工程)
- 基于 FPGA 的中值滤波器设计(附源码)
更多 FPGA 干货请关注 FPGA 的逻辑技术专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。