IC设计中通常基于设计时间线/业务线分为前端设计和后端实现,这个也是大家通常所能理解和接受的。类似下图
可以看到这里的FE/BE有一个明显的桥接地带,就是逻辑综合(synthesis),所以在实际的公司业务部门分布上,会有下列三种情形存在:
- 将综合部分会划归为前端
- 将综合划归为后端
- 将综合单独出来,变为中端(ME:middle-end)
这里的三种方式笔者都有接触,相对于不同业务各有优缺点,但是从芯片的整体规模日益增大的趋势下,第三种的情形未来应该会越来越多
这个话题放到前几年,可能还不是很敏感,从2020年开始,国内的初创公司多了很多,大部分都是BEless的模式。从保护自身核心利益出发,RTL代码是不便于公开的,所以采用网表交付就成为最优解,上述基本流程变成了
公司的中端部门基本就是公司的对外数据交付部门了,所有的数据出口都是这里,后端外包团队的结果会直接去到FAB进行TO。这里的中端组的权责就是:给外包团队提供数据和业务支撑,确保最终流片。
这种模式主要是服务于初创公司第一版的业务模式,快并且时间可控,费用自然会高。当然,简单的用一把资金能解决的问题一定只是部分解决。这种模式里的伤与痛,也只有真正经历过的同学可以体会的到吧。这个流程也是一种中间产物,从业务收敛上讲,最后还是会回归本文的开票所述的三种模式之一。
从结构图上看,中端犹如项目的腰(类核心力量),承上而启下,这个部位的带宽一定要足,确保前后端无缝衔接,犹如连接两个马达之间的传动轴,一定是需要细心呵护和用心经营的。
随着芯片规模和复杂的不断地增大,前两种模式通过类似一种刷前端/后端机时的方式已经很难在高速的发展中继续跟进了,专业的人做专业的事,独立的中端部门可以很好的解决下面的问题场景
- SDC质量:不是不好,是不够好
- 时钟有,但是不全
- gen-clock都有,但是和master的关系不清楚
- clock的定义点不太合适
- CGU的写法对于后端实现的友好性
- DFT对SDC的影响考量
- clock 结构优化
- 使用MCP替换Falsepath
- IO约束的合理性
- 时钟树的重聚和细节(launch vs capture)
- 等等
- UPF的各种小issue
- load_upf可以,但是check_mv有error
- isolation/LS插入的质量细节商榷
- power-domain/power-state的合并和优化
- 对层次化设计的支持
- 全芯片rail的logic和physical的布局
- 等等
以上种种,看起来都什么大问题,但是对于大芯片而言,哪个细节出问题都是会导致大问题。芯片设计是一个很难收敛的硬设计,要保证系统的稳定性(stability),就必须降低/剪除系统的冗余性(Redundancy)/多义性(ambiguity)。这个特点对于静态的时序分析和低功耗分析的挑战尤甚,如果还是对此不太理解的话,可以想象一下RTL在跑linting的时候的信息量,就可以感知到静态分析的威力了。
类似的,对于综合(DC/Genus),静态时序分析(PT/Tempus),低功耗分析(vclp/LEC\_low-power)的各种信息分类:info,warning和error(严格上讲,error是需要全部消灭的),也是需要中端团队查验的,
中端的任务是平抑前后端的差异,最终的服务对象还是后端团队,这里有一些简单的案例可以分享给大家,可能一点点的工作,就可以让后端的实施变得平滑通过是提高项目静态质量。
时钟的定义点必须是leaf cell的output pin:有时候为了方便,前端会把时钟的点位定义点放到CGU的一个hierarchy的输出pin,这样很容易下约束,但是会面临port punch的挑战,最惨代价就是在BE侧,导致这个时钟丢失。
综合view
APR cts view
这个情形,clock_out依然是一个clock point,但是由于APR 工具的push port,这个点依然是有clock 属性,但是却没法真实的驱动后面的逻辑了,也就相当于把这个clock弄丢了。
时钟的定义点需要尊重原著:有时候,clock是从外部的PAD进来的,但是由于PAD都是双向口,那么进来的那一支一定是固定的pin,可能会有同学用这个点定义clock, 譬如这里的C pin
这个从原理上讲,没有问题,但是却没有精确反应实际情形,有实际的风险,真实且正确的定义是这样的:
这样做是有它的道理的,不仅仅是点位的问题,一起看一下下图
可以看到,从PAD进到C的timing arc在rise和falling的线性度不是非常一致,这里在核算min-pulse width之类问题的时候,结果会比之前定义到C点上要悲观很多;如果定义到C点,会导致sign-off乐观,往往芯片最怕乐观,这种木桶效应的伤害,都是每个经历者的终身遗憾啊!所以这里的clock的定义点需要修正到PAD上。
常言道:精品必出于细品,只有好好品味把玩自己的数据库,才能做出真正的精品项目,只要比对手强一丢丢,那么你的出货可能就不止这么一丢丢了。各位同学,关注中端就从今天开始吧。
作者:艾思后端设计
文章来源:艾思后端实现
推荐阅读
- 多线程编程基础知识总结!
- 编译器优化那些事儿(10):区域分析
- CVPR2023 Highlight | SDM-UniPS:任意光照、任意模型的通用光度立体测量
- DIAL-Filters: 显著提升模糊夜视场景下的检测和分割性能!
更多嵌入式AI干货请关注嵌入式AI专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。