Open Prokuma opened 8 months ago
現状のSpMMカーネルは、一般的な疎行列の場合は効率的に処理できるが、極めて疎な行列においては効率低下が顕著になる。 しかし、圧縮効率の高いCSR/CSCを直接利用することは、ハードウェア動作の効率性を低下する恐れがあることから検討対象から除外されていた。 確かに、動作原理としてはそうだが、グラフの場合、極めて疎な行列の場合が多く、現状の実装の方が効率が悪い可能性も出てきたので、CSR/CSCを直接利用するカーネルを試す価値はある。
linalg.h
sparse.h
gcn.c
test_sparse.c
test_dense.c
研究の引き継ぎにより担当者変更 現状の実装方針
概要
現状のSpMMカーネルは、一般的な疎行列の場合は効率的に処理できるが、極めて疎な行列においては効率低下が顕著になる。 しかし、圧縮効率の高いCSR/CSCを直接利用することは、ハードウェア動作の効率性を低下する恐れがあることから検討対象から除外されていた。 確かに、動作原理としてはそうだが、グラフの場合、極めて疎な行列の場合が多く、現状の実装の方が効率が悪い可能性も出てきたので、CSR/CSCを直接利用するカーネルを試す価値はある。
実装方針
linalg.h
、sparse.h
に新たな関数及び構造体を追加gcn.c
及びtest_sparse.c
、test_dense.c
においてテスト