fulfulggg / Information-gathering

Fusion of Python and GIMP
MIT License
0 stars 0 forks source link

CameraHMR:遠近感を考慮した人物姿勢推定 #713

Open fulfulggg opened 2 weeks ago

fulfulggg commented 2 weeks ago

タイトル: CameraHMR:遠近感を考慮した人物姿勢推定

リンク: https://arxiv.org/abs/2411.08128

概要:

単眼画像からの高精度な3D人体姿勢・形状推定の課題に取り組みます。精度と頑健性の鍵は、高品質な訓練データにあります。既存の、疑似グランドトゥルース(pGT)付きの実画像を含む訓練データセットは、簡略化されたカメラとデフォルトの内部パラメータを想定し、SMPLifyを用いてスパースな2D関節位置にSMPLをフィッティングしています。本研究では、pGT精度を向上させる2つの貢献を行います。まず、カメラの内部パラメータを推定するために、人物を含む画像データセットで学習させた視野予測モデル(HumanFoV)を開発します。推定された内部パラメータを用いて、SMPLifyフィッティング中に完全な透視カメラモデルを組み込むことで、4D-Humansデータセットを強化します。次に、2D関節は3D体型に対する制約が限られているため、平均的な体型になってしまいます。これを解決するために、BEDLAMデータセットを用いて密な表面キーポイント検出器を学習させます。この検出器を4D-Humansデータセットに適用し、検出されたキーポイントにフィッティングするようにSMPLifyを修正することで、より現実的な体型を実現します。最後に、推定されたカメラパラメータを含めるようにHMR2.0アーキテクチャをアップグレードします。モデルの学習と、以前学習させたモデルで初期化したSMPLifyフィッティングを反復します。これにより、より正確なpGTと、最先端の精度を持つ新しいモデルCameraHMRが得られます。コードとpGTは研究目的で利用可能です。

fulfulggg commented 2 weeks ago

論文要約

この論文は、一枚の画像から人間の3D姿勢と体型をより正確に推定する方法を提案しています。

fulfulggg commented 2 weeks ago

@yukihiko-fuyuki が以下のラベルを提案し、適用しました: