Open Yongtae723 opened 4 years ago
顔画像から感情分析するAIの2018年での最先端モデル。 精度は静止画で87%、動画で57%
Face expression classification
https://arxiv.org/abs/1805.04855
Dinesh Acharya
2018年
人の感情分析にはランドマーク(目、鼻等)の場所より、歪みの方が大事である。 しかし、一般的なCNNの手法では、polingの際、max pooling average poolingが行われている。しかしこのプーリングではランドマークの歪みを決してしまう恐れがある。したがってCovariance poolingに変更することで精度をあげる。
convolution層の後にCovariance Pooling (共分散プーリング)を導入することで歪み情報の抽出を試みた。
2種類のデータセット(SFEW 2.0 , RAF)には顔画像(動画)と感情のラベルがある。 このデータセットを用いてテストし、今までのモデルより正答率が良いのか確かめた。
Covariance Pooling を入れても精度が上がらないモデルもある。Covariance Poolingが一概に良いとは言えない。
https://github.com/d-acharya/CovPoolFER
SFEW 2.0 , RAF 本論文ではこの2つのデータセットが使われていたが、他のデータセットとその特徴の説明が丁寧にあった。
従来のモデルと比較して精度は上がっていた。しかし、上がり幅は数%であった。
ざっくり言うと
顔画像から感情分析するAIの2018年での最先端モデル。 精度は静止画で87%、動画で57%
キーワード
Face expression classification
1. 情報
論文リンク
https://arxiv.org/abs/1805.04855
著者
Dinesh Acharya
投稿日付
2018年
2. 先行研究と比べてどこがすごい?
人の感情分析にはランドマーク(目、鼻等)の場所より、歪みの方が大事である。 しかし、一般的なCNNの手法では、polingの際、max pooling average poolingが行われている。しかしこのプーリングではランドマークの歪みを決してしまう恐れがある。したがってCovariance poolingに変更することで精度をあげる。
3. 技術や手法のキモはどこ?
convolution層の後にCovariance Pooling (共分散プーリング)を導入することで歪み情報の抽出を試みた。
4. どうやって有効だと検証した?
2種類のデータセット(SFEW 2.0 , RAF)には顔画像(動画)と感情のラベルがある。 このデータセットを用いてテストし、今までのモデルより正答率が良いのか確かめた。
5. 議論はある?
Covariance Pooling を入れても精度が上がらないモデルもある。Covariance Poolingが一概に良いとは言えない。
6. 次に読むべき論文は?
7. 実装の詳細
https://github.com/d-acharya/CovPoolFER
8. データセット
SFEW 2.0 , RAF 本論文ではこの2つのデータセットが使われていたが、他のデータセットとその特徴の説明が丁寧にあった。
9. 結果の詳細
従来のモデルと比較して精度は上がっていた。しかし、上がり幅は数%であった。
雑感&メモ