Open tkuri opened 3 years ago
映像からアクション(持ち上げる、掴む、手を開くetc…)の始まりなどのキーフレームを検出し分類するRNN。マウスの一連のアクションのアノテーションがされた大規模データセットを生成して検証をしている。Wasserstein lossが最適しやすいとのこと。
https://openaccess.thecvf.com/content_WACV_2020/html/Kwak_Detecting_the_Starting_Frame_of_Actions_in_Video_WACV_2020_paper.html
未確認。
https://research.janelia.org/bransonlab/MouseReachData/index.html
論文概要
映像からアクション(持ち上げる、掴む、手を開くetc…)の始まりなどのキーフレームを検出し分類するRNN。マウスの一連のアクションのアノテーションがされた大規模データセットを生成して検証をしている。Wasserstein lossが最適しやすいとのこと。
https://openaccess.thecvf.com/content_WACV_2020/html/Kwak_Detecting_the_Starting_Frame_of_Actions_in_Video_WACV_2020_paper.html
Code
未確認。
Dataset
https://research.janelia.org/bransonlab/MouseReachData/index.html