CTS <五> Flexible H-tree

字善 2024-03-21 发布于上海

展开全文

之前所讲的CTS，或者说一般我们的CTS流程，都是完全由工具自动建tree（图左）: 从sink点开始cluster，然后逐渐做到root点。还有一种的做tree的方式：首先是从root做到多个固定点(TAP点)，然后再从sink点做到最近的TAP点。这种方式一般又可以分为两种：flexible-Htree（图中）和Mesh（图右）的方式。

下面简单的列举了三种方式的优缺点

由于Mesh的方式功耗很大，很少用到，所以一般都用Flexible-Htree，有的可能把这种结构称为fishbone，有时候也被叫做Multi-Tap CTS。

下面先简单介绍一下Flexible-Htree的基本流程，再对每一步进行详细的分析：

选clock，哪个clock要用到htree的方式
选点，要在哪些位置插入TAP点
从clock root建立buffer-tree到tap点
修改spec，clock由一个fanout，变成多个平行fanout，所以需要修改。
重新连接，将sink平均分配给离他最近的TAP
每个TAP点到相应的sink点之间做CTS tree

插入TAP点

有下面三种方式：

手工插入TAP点或netlist中本身就存在了TAP 点，如图左所示，所有sink都挂载一个TAP下就可以了

2. insert_ccopt_source_group_roots 代替手工的方式，其结果和图左一样

3. 上面的方式，在root和TAP之前没有没有其他buffer，这样会有tran的问题，或者后期需要手工加入buffer-tree，另一种更常用的方式就是采用

create_ccopt_flexible_htree

synthesize_ccopt_flexible_htree

其结果如图右，和图左区别就是多了root到tap之间的buffer

create_htree命令用于定义htree，只是定义，不会对插入任何buffer和TAP

synthesize_htree命令则用于实现刚才定义的htree，会加入buffer和TAP

如果采用了前两种方式创建的TAP，那么从root到TAP之间的net设置为dont-touch和ideal，否则这些net会被ccopt加入buffer。

这里需要注意的是,synthesize_htree命令，他是严格的按照target_max_trans的要求来插入buffer的。如果你synthesize_htree失败了，很可能是因为它没法在合适的距离插入buffer，可以试试将这个trans值设大点

修改spec

如果采用了create+synthesize的方式，会自动吐出一个spec(内容如下)。直接source就可以了。
如果是前两种方式插入的TAP，那么上面的spec就需要自己写。
如果是前两种方式插入的TAP，又不想自己写spec，那就得写SDC，并设置相关的变量，再用create_spec命令将该SDC转化成相应的spec

assign(分配) sink

上面做完之后，所有的sink都是挂在一个TAP上的，这当然不是我们想要的，我们想要的是sink挂到最近的TAP上，如下图左所示。

运行ccopt_design命令会自动分配。如果你想快速的看到分配的结果，那么可以采用assign_clock_tree_source_groups命令。

理想情况下，从TAP到sink只有buffer，结果会像上图左一样。但是实际情况下，有各种ICG，AND，MUX的各种逻辑。最极端的例子，如上图右，所有的sink点都从一个ICG来。如果不对ICG进行clone，即使分配完之后还是全部sink都连接到一个TAP上，其他TAP都是floating。所以htree一定要用到clone。

如何clone或者如何控制clone? 按照之前做法，我们需要设置下面的参数：

但后两种控制clone的办法在分配sink这一步并不起作用，这两个变量只在真正做tree的时候才起作用。控制分配sink是由变量clustering_source_group*来控制的。我们运行一下下面的命令：

发现什么没有任何相关的变量存在，不要急，我们有办法让他们显形，再运行下面的命令：

再打开my_ccopt_config/prop_store_2.tcl.gz，我们就可以看到相关的变量了。这里就对这三个变量进行分析。

或者可以通过下面命令查看这个变量的解释:

假设在Design中已经存在了40个CG（包括ICG，MUX，AND等各种逻辑cell），如果这个值设置为0.2（默认0.2），表示在分配sink的阶段，最多只允许加入4个CG，如果设置为10，表示最后允许加入400个CG。设置越大，那么允许加入的CG越多，可能几何上看到分配的结果越好，但是功耗会越大。这是最重要的一个控制参数。
sink可能不平均，规定最大的sink数目是最小sink数目的倍数

每个TAP可以驱动的sink的数目

除上面的方法外，我们还可以强制让某个sink点挂到某个TAP上：

例如下面的命令强制让$pinname挂到TAP_cell_1上面

查看 log

好了一切都做好了，下面我们就看看做出来的质量怎么样，我们就来分析分析log。在ccopt_design中，分配sink的操作是在clustering阶段一开始就做的，（不清楚clustering步骤的翻翻前面CTS的介绍）。下图的数字不一定准确，已经经过作者的修改。所以不要去计算为什么数据不一致。