Over clusters - Githubissues

xiaoxiong74 / face-cluster-by-infomap

face-cluster-by-infomap 一种无监督人脸聚类方法，在开源数据集上取得SOTA效果

164 stars 25 forks source link

Over clusters #1

Open Youskrpig opened 3 years ago

Youskrpig commented 3 years ago

嗨，跑了infomap在part1_test结果, 但是聚类结果类别数是19276 但是真实类别是8573类。为啥会有这么大的类别差异呢

xiaoxiong74 commented 3 years ago

嗨，跑了infomap在part1_test结果, 但是聚类结果类别数是19276 但是真实类别是8573类。为啥会有这么大的类别差异呢

有很多孤立点，有8000多个，可以对孤立点进行二次聚类比如归入与它最相近点的的类别中去。

Youskrpig commented 3 years ago

问下n值一般怎么取，我看原paper中在MS-Celeb-1M实验，（MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.），k取得80和每个id数量差不太多，但是deepfashion实验里面取得5，但是我看你在infomap里面k取得400。

xiaoxiong74 commented 3 years ago

问下n值一般怎么取，我看原paper中在MS-Celeb-1M实验，（MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.），k取得80和每个id数量差不太多，但是deepfashion实验里面取得5，但是我看你在infomap里面k取得400。

Infomap是尽量把满足相似度阈值的边都链接起来。本代码中的k值只是为了用faiss快速构建knn，k并不是infomap的一个参数。根据实际数据情况调整即可。

Youskrpig commented 3 years ago

问下n值一般怎么取，我看原paper中在MS-Celeb-1M实验，（MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.），k取得80和每个id数量差不太多，但是deepfashion实验里面取得5，但是我看你在infomap里面k取得400。

Infomap是尽量把满足相似度阈值的边都链接起来。本代码中的k值只是为了用faiss快速构建knn，k并不是infomap的一个参数。根据实际数据情况调整即可。

哈喽，请问下GCN-V和GCN-E paper里面100w以上的数据实验是怎么跑的，一个GPU直接OOM了。。