Open chullhwan-song opened 6 years ago
geo-tagging 된 데이터만을 가지고 landmark 인식을 할수 있는가..?란 주제.
기존 VLAD를 학습 가능하도록 만든개념이 NetVLAD
VLAD는
이를 network안에서 학습할수 있도록 구성 == NetVLAD
weakly labelled data에 adapt한 triplet ranking loss
close by location
즉, 가까운 거리에 있는 이미지는 먼거리에 있는 이미지보다 유사(Euclidean distance)하길 바란다. < 이게 이 논문의 가정인듯~ 사실 그렇지 않을 확률이 높으니..정말 가까운거리(동일한 건물?)를 찾아야할듯~
그래서, 학습을 위한 triplet 에 대한 ranking loss는
Google Street View Time Machine data 로부터,
best matching potential positive image
weakly supervised ranking loss
Datasets : Pittsburgh (Pitts250k), Tokyo 24/7, TokyoTM등 이용.
Evaluation metric : if at least one of the top N retrieved database images is within d = 25 meters from the ground truth position of the query.
Datasets : Pittsburgh (Pitts250k), Tokyo 24/7, TokyoTM등 이용.
Evaluation metric : if at least one of the top N retrieved database images is within d = 25 meters from the ground truth position of the query.
Implementation details
https://arxiv.org/abs/1511.07247 https://www.di.ens.fr/willow/research/netvlad/ http://www.itzikbs.com/feature-aggregatoin-using-vlad-netvlad https://seilna.github.io/youtube8m-review/#52 https://docs.google.com/presentation/d/1kwWbluhD-w8jFHu66UTjkQGCdo5T9YJ-W086yams2HU/edit#slide=id.g1c10829ee5_0_2