fulfulggg / Information-gathering

Fusion of Python and GIMP
MIT License
0 stars 0 forks source link

NPU-CIM ヘテロジニアス AR/VR デバイス向けハイブリッドモデルのニューラルアーキテクチャサーチ #462

Open fulfulggg opened 6 hours ago

fulfulggg commented 6 hours ago

タイトル: NPU-CIM ヘテロジニアス AR/VR デバイス向けハイブリッドモデルのニューラルアーキテクチャサーチ

リンク: https://arxiv.org/abs/2410.08326

概要:

低遅延かつ低消費電力のエッジAIは、バーチャルリアリティや拡張現実アプリケーションに不可欠です。近年の進歩により、畳み込み層(CNN)とTransformer(ViT)を組み合わせたハイブリッドモデルが、さまざまなコンピュータービジョンや機械学習(ML)タスクにおいて、精度とパフォーマンスのトレードオフの点で優れた結果をもたらすことが示されています。しかし、ハイブリッドMLモデルは、データフローやメモリアクセスパターンが多様であるため、レイテンシとエネルギー効率の点でシステム上の課題をもたらす可能性があります。本研究では、ニューラルプロセッシングユニット(NPU)とコンピューティングインメモリ(CIM)のアーキテクチャの異質性を活用し、これらのハイブリッドモデルを効率的に実行するために多様な実行スキーマを実行します。また、NPUとCIMの両方を備えた異種エッジシステム向けに、効率的なハイブリッドCNN/ViTモデルを設計するためのニューラルアーキテクチャ検索フレームワークであるH4H-NASを紹介します。H4H-NASのアプローチは、実際のシリコン上で測定されたNPUのパフォーマンス結果と、業界のIPに基づくCIMのパフォーマンスで構築されたパフォーマンス推定器によって強化されています。H4H-NASは、きめ細かい粒度でハイブリッドCNN/ViTモデルを検索し、ImageNetデータセットにおいて、最大1.34%のTop-1精度の向上を達成しました。さらに、アルゴリズム/ハードウェア協調設計の結果、ベースラインソリューションと比較して、このような異種コンピューティングを導入することで、全体的なレイテンシが最大56.08%、エネルギーが最大41.72%向上することが明らかになりました。このフレームワークは、ハイブリッドネットワークアーキテクチャと、NPU+CIM異種システムのシステムアーキテクチャの設計をガイドします。

fulfulggg commented 5 hours ago

@yukihiko-fuyuki が以下のラベルを提案し、適用しました:

fulfulggg commented 5 hours ago

論文要約

NPU-CIM ヘテロジニアス AR/VR デバイス向けハイブリッドモデルのニューラルアーキテクチャサーチ:論文要約