karakuri-ai / paper-readings

repository to research the machine learning papers
2 stars 1 forks source link

【2018】Covariance Pooling For Facial Expression Recognition #52

Open Yongtae723 opened 4 years ago

Yongtae723 commented 4 years ago

ざっくり言うと

顔画像から感情分析するAIの2018年での最先端モデル。 精度は静止画で87%、動画で57%

キーワード

Face expression classification

1. 情報

論文リンク

https://arxiv.org/abs/1805.04855

著者

Dinesh Acharya

投稿日付

2018年

2. 先行研究と比べてどこがすごい?

人の感情分析にはランドマーク(目、鼻等)の場所より、歪みの方が大事である。 しかし、一般的なCNNの手法では、polingの際、max pooling average poolingが行われている。しかしこのプーリングではランドマークの歪みを決してしまう恐れがある。したがってCovariance poolingに変更することで精度をあげる。

3. 技術や手法のキモはどこ?

convolution層の後にCovariance Pooling (共分散プーリング)を導入することで歪み情報の抽出を試みた。

4. どうやって有効だと検証した?

2種類のデータセット(SFEW 2.0 , RAF)には顔画像(動画)と感情のラベルがある。 このデータセットを用いてテストし、今までのモデルより正答率が良いのか確かめた。

5. 議論はある?

Covariance Pooling を入れても精度が上がらないモデルもある。Covariance Poolingが一概に良いとは言えない。

6. 次に読むべき論文は?

7. 実装の詳細

https://github.com/d-acharya/CovPoolFER

8. データセット

SFEW 2.0 , RAF 本論文ではこの2つのデータセットが使われていたが、他のデータセットとその特徴の説明が丁寧にあった。

9. 結果の詳細

従来のモデルと比較して精度は上がっていた。しかし、上がり幅は数%であった。

雑感&メモ