Sunwood-ai-labs / Yukihiko

Fusion of Python and GIMP
MIT License
5 stars 4 forks source link

どこでも操作することを学ぶ: 強化学習のための視覚的汎化フレームワーク #40

Open yukihiko-fuyuki opened 1 month ago

yukihiko-fuyuki commented 1 month ago

タイトル: どこでも操作することを学ぶ: 強化学習のための視覚的汎化フレームワーク

リンク: https://arxiv.org/abs/2407.15815

概要:

視運動ロボットに、多様なオープンワールドシナリオで動作するための汎化能力を付与することはできるでしょうか?本稿では、視覚強化学習向けに調整された汎用フレームワークであるManiwhereを提案します。Maniwhereは、訓練されたロボットポリシーが、複数の視覚障害タイプの組み合わせにわたって汎化することを可能にします。具体的には、空間変換ネットワーク(STN)モジュールと融合したマルチビュー表現学習アプローチを導入し、異なる視点間で共有される意味情報と対応関係を捉えます。さらに、カリキュラムベースのランダム化および拡張アプローチを採用して、RLトレーニングプロセスを安定させ、視覚的汎化能力を強化します。Maniwhereの有効性を示すために、関節物体、両手、器用なハンドマニピュレーションタスクを含む8つのタスクを綿密に設計し、3つのハードウェアプラットフォームにわたるManiwhereの強力な視覚的汎化能力とsim2real転移能力を実証します。実験の結果、Maniwhereは既存の最先端手法を大幅に上回る性能を示すことが明らかになりました。ビデオはhttps://gemcollector.github.io/maniwhere/でご覧いただけます。

yukihiko-fuyuki commented 1 month ago

論文要約

論文要約:

結論: Maniwhereは、ロボットに汎化能力を付与するための効果的なフレームワークであり、将来的には、より複雑なタスクをこなせる、より汎用性の高いロボットの開発に貢献することが期待されます。

yukihiko-fuyuki commented 1 month ago

@yukihiko-fuyuki が以下のラベルを提案し、適用しました: