Closed Prokuma closed 11 months ago
現状のカーネルは、ユニットを使い切ってSIMDまで駆使してSpMMの演算を行っているため、スパーシティーの低い行列にはあまり向いていない。そのため、スパーシティーの高い行列に最適化されたカーネルの作成を行う。
具体案としては
まだやってないがユニット数削減によりある程度目的達成したのでクローズ
現状のカーネルは、ユニットを使い切ってSIMDまで駆使してSpMMの演算を行っているため、スパーシティーの低い行列にはあまり向いていない。そのため、スパーシティーの高い行列に最適化されたカーネルの作成を行う。
具体案としては