fulfulggg / Information-gathering

Fusion of Python and GIMP
MIT License
0 stars 0 forks source link

拡散モデルにおける複数特徴量集約による顔超解像の高度化 #178

Open fulfulggg opened 3 weeks ago

fulfulggg commented 3 weeks ago

タイトル: 拡散モデルにおける複数特徴量集約による顔超解像の高度化

リンク: https://arxiv.org/abs/2408.15386

概要:

監視環境の画像は、未知の劣化、姿勢の変化、不規則な照明、オクルージョンなどの悪条件により、超解像アルゴリズムでは処理が難しい場合が多いです。しかし、監視カメラでは、低品質であっても複数枚の画像を取得することが可能です。本研究では、複数枚の低品質画像から抽出された特徴量と低解像度画像を組み合わせた拡散モデルに基づくアルゴリズムを開発し、個人の同一性における歪みを最小限に抑えながら、超解像画像を生成します。他のアルゴリズムとは異なり、私たちのアプローチは、属性情報を明示的に提供したり、再構成プロセス中に関数の勾配を計算したりすることなく、顔の特徴を回復します。私たちの知る限り、これは、複数の特徴量と低解像度画像を組み合わせたものを条件として使用し、確率微分方程式を用いて、より信頼性の高い超解像画像を生成する最初の試みです。FFHQデータセットを学習に用いた結果、CelebAデータセットとQuis-Campiデータセットを用いた評価において、顔認識と検証の指標で最先端の性能を達成しました。私たちのコードはhttps://github.com/marcelowds/fasrで公開されています。

fulfulggg commented 3 weeks ago

論文要約

論文要約: 拡散モデルにおける複数特徴量集約による顔超解像の高度化

本論文は、監視カメラなどで撮影された、画質の悪い複数の顔画像から、高画質な顔画像を生成する新しい手法を提案しています。

従来手法の問題点:

提案手法:

結果:

要点:

新規性:

fulfulggg commented 3 weeks ago

@yukihiko-fuyuki が以下のラベルを提案し、適用しました:

以下の新しいラベルが作成され、適用されました: