yukarinoki / reseach

0 stars 0 forks source link

Modeling GPU Dynamic Parallelism for self similar density workloads #6

Open yukarinoki opened 1 year ago

yukarinoki commented 1 year ago

https://arxiv.org/abs/2206.02255 フラクタル的な?

yukarinoki commented 1 year ago

2014年、WangとYalamanchili [19]は、DPにおけるオーバーヘッドの主な原因を分析し、子カーネルへの再帰的な呼び出しと動的に割り当てられたメモリのキャッシュヒット率の低さを見つけました。 著者らは、BFS、グラフ彩色、正規表現マッチ、関係結合などのアルゴリズムに対して平均的な低下が1.21倍であり、実行オーバーヘッドが存在しなければ、DPは最大2.73倍の高速化を提供できた可能性があると特定しました。