【2018】Covariance Pooling For Facial Expression Recognition

ざっくり言うと

顔画像から感情分析するAIの2018年での最先端モデル。精度は静止画で87％、動画で57％

キーワード

Face expression classification

1. 情報

論文リンク

https://arxiv.org/abs/1805.04855

著者

Dinesh Acharya

投稿日付

2018年

2. 先行研究と比べてどこがすごい？

人の感情分析にはランドマーク（目、鼻等）の場所より、歪みの方が大事である。しかし、一般的なCNNの手法では、polingの際、max pooling average poolingが行われている。しかしこのプーリングではランドマークの歪みを決してしまう恐れがある。したがってCovariance poolingに変更することで精度をあげる。

3. 技術や手法のキモはどこ？

convolution層の後にCovariance Pooling （共分散プーリング）を導入することで歪み情報の抽出を試みた。

4. どうやって有効だと検証した？

２種類のデータセット(SFEW 2.0 , RAF)には顔画像（動画）と感情のラベルがある。このデータセットを用いてテストし、今までのモデルより正答率が良いのか確かめた。

5. 議論はある？

Covariance Pooling　を入れても精度が上がらないモデルもある。Covariance Poolingが一概に良いとは言えない。

6. 次に読むべき論文は？

7. 実装の詳細

https://github.com/d-acharya/CovPoolFER

8. データセット

SFEW 2.0 , RAF 本論文ではこの２つのデータセットが使われていたが、他のデータセットとその特徴の説明が丁寧にあった。

9. 結果の詳細

従来のモデルと比較して精度は上がっていた。しかし、上がり幅は数％であった。

karakuri-ai / paper-readings