tkuri / papers

Summarizing the papers I have read (Japanese)
41 stars 1 forks source link

Learning to Predict Salient Faces: A Novel Visual-Audio Saliency Model #229

Open tkuri opened 4 years ago

tkuri commented 4 years ago

論文概要

映像中の音声が人間の注意力に影響を与えることを明らかにした研究。大規模な音声付アイトラッキング映像データベース(34名被験者が300の動画を視聴)を取得して傾向を分析、基本的に人の顔に注意が行くことを確認。映像中のSaliencyを予測するためのマルチモーダルNNを提案。

bib_20200920 00 https://www.ecva.net/papers/eccv_2020/papers_ECCV/html/3492_ECCV_2020_paper.php

Code

未確認。

Dataset

https://github.com/MinglangQiao/MVVA-Database

harshita2596 commented 4 years ago

Can you provide the trained model or code for this?