Equality SatuationでGPUの最適化コードを提供しようとしている。


yukarinoki commented 1 year ago

9 関連研究 並列アーキテクチャにコードを適応させるための多数のプログラミングモデルと最先端の技術、特にGPUに対するものが紹介されています[13, 33, 37, 38, 42]。 ディレクティブベースのプログラミングモデル[3, 35]は順次言語を拡張し、複雑な科学的アプリケーションがその構造を維持しながらループの反復をアクセラレータにオフロードすることを可能にします。しかし、そのようなコンパイラはしばしば順次コード生成の基礎に依存し、最適化の機会を一般的な計算に限定してしまいます[4, 28]。

いくつかのプロジェクトでは、ディレクティブベースのコードに対するドメイン固有やアーキテクチャ固有のアプローチを探求しています。CLAW DSL[10]はグリッドベースのアルゴリズムのためのディレクティブを提供し、OpenACC/OpenMPコード生成をサポートしながら、空間ブロッキングのようなターゲット固有の最適化を可能にします。JACC[28]は動的定数拡張を伴うジャストインタイムカーネルコンパイレーションを提供するOpenACCランタイムフレームワークです。OptACC[30]はOpenACCの並列性を最適化するために、ランタイムパラメータの探索を実行します。CCAMP[27]はOpenACCとOpenMPを交換し、モデルとアーキテクチャの各組み合わせに対する並列化を最適化します。Baruaら[4]は、ループ展開を通じてILPを最大化するための自動OpenACCカーネルオプティマイザを開発します。SAFARA[46]は、OpenACCカーネルで配列参照の再利用を容易にするために、レジスタリソースを完全に活用します。

私たちのACC Saturatorは3つの点で異なります:

