Open tkuri opened 3 years ago
細画像識別にとってデータの多様性が重要である。しかしデータセットの偏りは解決が難しく例えばiNaturalistの鳥類データセットは生物多様性のあるアマゾン熱帯雨林のデータはほとんどない。そこで初期のデータを収集した後の最適なデータ追加戦略について提案をしている。
詳細画像識別とはドメインを絞る代わりに人間を超えるような高精度識別を行うこと。具体的にやっていることはImageNetで事前学習したCNNで5つのfoldでtest。性能に応じてクラスをソートして、悪いクラスを特定し画像を追加した方が良いと判断。性能基準はAccuracy/Precision/F1/Loss/KL-Divergence.
https://openaccess.thecvf.com/content_WACV_2020/html/Gwilliam_Intelligent_Image_Collection_Building_the_Optimal_Dataset_WACV_2020_paper.html
未確認。
論文概要
細画像識別にとってデータの多様性が重要である。しかしデータセットの偏りは解決が難しく例えばiNaturalistの鳥類データセットは生物多様性のあるアマゾン熱帯雨林のデータはほとんどない。そこで初期のデータを収集した後の最適なデータ追加戦略について提案をしている。
詳細画像識別とはドメインを絞る代わりに人間を超えるような高精度識別を行うこと。具体的にやっていることはImageNetで事前学習したCNNで5つのfoldでtest。性能に応じてクラスをソートして、悪いクラスを特定し画像を追加した方が良いと判断。性能基準はAccuracy/Precision/F1/Loss/KL-Divergence.
https://openaccess.thecvf.com/content_WACV_2020/html/Gwilliam_Intelligent_Image_Collection_Building_the_Optimal_Dataset_WACV_2020_paper.html
Code
未確認。