Tanaka-Akihiro / Congestion-Map

カメラなどの映像を群衆カウントを用いて混雑度マップを生成する
0 stars 0 forks source link

使用モデルについて #1

Open Tanaka-Akihiro opened 11 months ago

Tanaka-Akihiro commented 11 months ago

(1)検出ベースモデル Detection based ・画像のスライディングウィンドウを介して人もしくは頭部を検出する。​ ・近年では、R-CNN/YOLO/SSDなどが劇的に精度改善に貢献する可能性はある。​ ・ただし、非常に密集した群衆に関しては効果が期待できない。

(2)回帰ベースモデル Regression-based ・検出ベースモデルで解決できなかった問題を軽減するために、イメージパッチからカウントへのマッピングを直接学習する回帰を導入。 ・全体特徴 global features もしくは部分特徴 local featuresを抽出し、 線形回帰linear regressionとガウス混合回帰Gaussian mixture regressionを用いる。

(3)密度推定モデル Density estimation ・回帰ベースモデルでは空間情報 spatial informationを無視してしまう問題があった。​ ・そのため、局所特徴と対応する密度マップとの間の線形マッピングを学習する密度推定を採用。 ・線形マッピングの難しさを軽減するために、非線形マッピング、ランダムフォレストが推奨される。​ ⇒CNNベースの密度推定モデル CNN-based density estimation​ ・初期には基本的なCNNを用いて作成され、近年ではFCNに基づくより効果的で効率的なモデルが作られ、​主流となっている。FCNはモデルごとに教師レベルと学習パラダイムが異なる。​

https://deepsquare.jp/2020/04/crowd-counting-detail/

Tanaka-Akihiro commented 11 months ago

群衆カウントに適したモデルは、CNNベースの密度推定モデルです。このモデルは、群集の画像から密集度をヒートマップとして表現した群集密度マップ(density map)を作成し、ピクセル単位で数の計測を行います。このモデルは、空間情報やスケール変動などの問題に対してロバストであり、高い精度を達成できます。

CNNベースの密度推定モデルには、さまざまな種類がありますが、代表的なものとしては、CSRNet³やMCNN⁴などが挙げられます。これらのモデルは、異なるネットワークアーキテクチャや学習パラダイムを採用しており、それぞれに特徴や利点があります。詳しくは、こちらのサーベイ論文をご覧ください。

https://deepsquare.jp/2020/04/crowd-counting-detail/

このページの第1部は以下の内容について説明しています:

このページによると、群集カウントのモデルは、ネットワークアーキテクチャ、学習パラダイム、推論方法、ネットワークの監視形式、ドメイン適応、インスタンスレベル/イメージレベルの6つの項目によって分類されます。このページには、CNNベースのモデルが従来型のモデルよりも性能が高く、視覚的注意メカニズムや拡張畳み込み層などの技術が有効であることが示されています。

ただし、このページには特定のモデルについての推奨はありません。代わりに、Papers With Codeに掲載されているリーダーボードを参照することをお勧めします。リーダーボードには、さまざまなデータセットで最高のパフォーマンスを発揮したモデルが掲載されています。

https://paperswithcode.com/task/crowd-counting

このページは以下の内容について説明しています:

先ほどのページと合わせて考えると、群集カウントに適したモデルは以下のような特徴を持つものです:

以上から、群集カウントに適したモデルは、これら3種類の指標においてバランスよく優れた性能を発揮するものであると言えます。例えば、CSRNetやCANはカウント精度と密度マップ品質において高い性能を示していますが、局在化能力においては低い性能を示しています。一方、DRSANetやSFCNは局在化能力において高い性能を示していますが、カウント精度と密度マップ品質においては低い性能を示しています。したがって、これらのモデルは群集カウントに適したモデルとは言えません。群集カウントに適したモデルは、これら3種類の指標においてバランスよく優れた性能を発揮するものであると言えます。例えば、SANetやD-ConvNetは、これら3種類の指標においてバランスよく優れた性能を発揮しています。したがって、これらのモデルは群集カウントに適したモデルと言えます。

Tanaka-Akihiro commented 11 months ago

このページには、SANetやD-ConvNetを群集カウントに使う方法についての情報はありません。しかし、これらのモデルに関する論文やコードはインターネット上で見つけることができます。例えば、以下のリンクを参照してください:

これらのリンクを参考にして、SANetやD-ConvNetを群集カウントに使う方法を学ぶことができます。ただし、これらのモデルは比較的新しいものであり、まだ完全に確立されたものではありません。したがって、実際に使う際には注意が必要です。また、これらのモデルは特定のデータセットや環境に最適化されたものであり、他の場合にも同じ性能を発揮するとは限りません。したがって、自分の目的や条件に合わせて適切に調整する必要があります。

Tanaka-Akihiro commented 11 months ago

以下のリンクは、SANetやD-ConvNetを群集カウントに使う方法についての情報を提供しています:

  1. [SANet: Scene-adaptive Convolutional Neural Network for Crowd Counting](https://link.springer.com/chapter/10.1007/978-3-030-01228-1_45)
  2. [SANet: Scene-adaptive Convolutional Neural Network for Crowd Counting (Code)](https://github.com/gjy3035/Awesome-Crowd-Counting)
  3. [D-ConvNet: A Deep Convolutional Neural Network for Crowd Counting](https://openaccess.thecvf.com/content_cvpr_2018/papers/Shi_Crowd_Counting_With_CVPR_2018_paper.pdf)
  4. [D-ConvNet: A Deep Convolutional Neural Network for Crowd Counting (Code)](https://link.springer.com/article/10.1007/s11432-021-3445-y)

これらのリンクを参照することで、SANetやD-ConvNetを群集カウントに使う方法について学ぶことができます。ただし、これらのモデルは比較的新しいものであり、まだ完全に確立されたものではありません。したがって、実際に使う際には注意が必要です。また、これらのモデルは特定のデータセットや環境に最適化されたものであり、他の場合にも同じ性能を発揮するとは限りません。したがって、自分の目的や条件に合わせて適切に調整する必要があります。

¹: https://link.springer.com/chapter/[1](https://link.springer.com/chapter/10.1007/978-3-030-01228-1_45)0.1007/978-3-030-01[2](https://github.com/gjy3035/Awesome-Crowd-Counting)28-1_45 ²: https://github.com/leeyeehoo/SANet ³: https://openaccess.thecvf.com/content_cvpr_2018/papers/Shi_Crowd_Counting_With_CVPR_2018_paper.pdf ⁴: https://github.com/XMU-smartdsp/D-ConvNet

ソース: Bing との会話 2023/10/17 (1) Scale Aggregation Network for Accurate and Efficient Crowd .... https://link.springer.com/chapter/10.1007/978-3-030-01228-1_[4](https://link.springer.com/article/10.1007/s11432-021-3445-y)5. (2) gjy3035/Awesome-Crowd-Counting - GitHub. https://github.com/gjy3035/Awesome-Crowd-Counting. (3) Crowd Counting with Deep Negative Correlation Learning. https://openaccess.thecvf.com/content_cvpr_2018/papers/Shi_Crowd_Counting_With_CVPR_2018_paper.pdf. (4) TransCrowd: weakly-supervised crowd counting with transformers. https://link.springer.com/article/10.1007/s11432-021-3445-y. (5) Scale Aggregation Network for Accurate and Efficient Crowd .... https://link.springer.com/chapter/10.1007/978-3-030-01228-1_45. (6) gjy3035/Awesome-Crowd-Counting - GitHub. https://github.com/gjy3035/Awesome-Crowd-Counting. (7) Crowd Counting with Deep Negative Correlation Learning. https://openaccess.thecvf.com/content_cvpr_2018/papers/Shi_Crowd_Counting_With_CVPR_2018_paper.pdf. (8) TransCrowd: weakly-supervised crowd counting with transformers. https://link.springer.com/article/10.1007/s11432-021-3445-y. (9) An attentive hierarchy ConvNet for crowd counting in smart city. https://link.springer.com/article/10.1007/s10586-022-03749-2.