Closed fann9876543210 closed 2 years ago
把array分part設定不同的bitwidth並更改部分寫法 Latency: 2673->1599 FF: 17103->2683 LUT:33322->5452
之前的performance
現在的
輸出out 的那個port也改成2bit會不會比較好? 但是和python 在相接的時候好像python沒有2bit int可以用,還是說output也換成8bit
合成完有測試計算的結果是對的嗎?
有做simulation/cosimulation都pass了,我會試試看換output,但out的port應該對utilization影響不大,因為他就只是用在最後的output,沒有參與中間的計算。
後來想到可能output的速度上會有差,我再試試看
修改多餘的乘法,把output減少到只輸出最後結果並且改成3-bit,修改多餘的輸入 latency: 1598->922 utilization: FF:2683減少至2099 LUT:5452減少至4456 BRAM: 6減少到4 DSP:23增加到25
在main_v2.cpp我把第二層的陣列都捨去直接輸出結果,latency和utilization都有好一點,但不確定會不會反而讓for loop太複雜
把int的type改掉了