Open fulfulggg opened 1 week ago
新しい3次元人間の頭部合成手法であるJokerを紹介します。Jokerは、1枚の参照画像から、その人物のアイデンティティを保持したまま、新しい表情を持つ3次元頭部を合成することができます。表情は、3次元モーファブルモデル(3DMM)とテキスト入力によって制御されます。3DMMだけでは、口の中の動きや舌の動きを含む微妙な感情の変化や極端な表情を表現することができないため、このマルチモーダルな条件付け信号が不可欠です。私たちの方法は、彫刻、濃い化粧、絵画など、領域外のサンプルにもうまく一般化できる2次元拡散ベースの事前分布に基づいており、高いレベルの表現力を実現しています。視点の一貫性を向上させるために、2次元事前分布の予測をニューラル放射輝度場(NeRF)に変換する新しい3次元蒸留技術を提案します。2次元事前分布と蒸留技術の両方が最先端の結果を生み出し、広範な評価によって確認されています。また、私たちの知る限り、この方法は視点の一貫性を保ったまま極端な舌の動きを実現した最初のものです。
@yukihiko-fuyuki が以下のラベルを提案し、適用しました:
タイトル: ジョーカー:極端な表情を用いた条件付き3D頭部合成
リンク: https://arxiv.org/abs/2410.16395
概要:
新しい3次元人間の頭部合成手法であるJokerを紹介します。Jokerは、1枚の参照画像から、その人物のアイデンティティを保持したまま、新しい表情を持つ3次元頭部を合成することができます。表情は、3次元モーファブルモデル(3DMM)とテキスト入力によって制御されます。3DMMだけでは、口の中の動きや舌の動きを含む微妙な感情の変化や極端な表情を表現することができないため、このマルチモーダルな条件付け信号が不可欠です。私たちの方法は、彫刻、濃い化粧、絵画など、領域外のサンプルにもうまく一般化できる2次元拡散ベースの事前分布に基づいており、高いレベルの表現力を実現しています。視点の一貫性を向上させるために、2次元事前分布の予測をニューラル放射輝度場(NeRF)に変換する新しい3次元蒸留技術を提案します。2次元事前分布と蒸留技術の両方が最先端の結果を生み出し、広範な評価によって確認されています。また、私たちの知る限り、この方法は視点の一貫性を保ったまま極端な舌の動きを実現した最初のものです。