xiaoxiong74 / face-cluster-by-infomap

face-cluster-by-infomap 一种无监督人脸聚类方法,在开源数据集上取得SOTA效果
164 stars 25 forks source link

Over clusters #1

Open Youskrpig opened 3 years ago

Youskrpig commented 3 years ago

嗨,跑了infomap在part1_test结果, 但是聚类结果类别数是19276 但是真实类别是8573类。为啥会有这么大的类别差异呢

xiaoxiong74 commented 3 years ago

嗨,跑了infomap在part1_test结果, 但是聚类结果类别数是19276 但是真实类别是8573类。为啥会有这么大的类别差异呢

有很多孤立点,有8000多个,可以对孤立点进行二次聚类比如归入与它最相近点的的类别中去。

Youskrpig commented 3 years ago

问下n值一般怎么取,我看原paper中在MS-Celeb-1M实验,(MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.),k取得80和每个id数量差不太多,但是deepfashion实验里面取得5,但是我看你在infomap里面k取得400。

xiaoxiong74 commented 3 years ago

问下n值一般怎么取,我看原paper中在MS-Celeb-1M实验,(MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.),k取得80和每个id数量差不太多,但是deepfashion实验里面取得5,但是我看你在infomap里面k取得400。

Infomap是尽量把满足相似度阈值的边都链接起来。本代码中的k值只是为了用faiss快速构建knn,k并不是infomap的一个参数。根据实际数据情况调整即可。

Youskrpig commented 3 years ago

问下n值一般怎么取,我看原paper中在MS-Celeb-1M实验,(MS-Celeb-1M [11] is a large-scale face recognition dataset consisting of 100K identities, and each identity has about 100 facial images.),k取得80和每个id数量差不太多,但是deepfashion实验里面取得5,但是我看你在infomap里面k取得400。

Infomap是尽量把满足相似度阈值的边都链接起来。本代码中的k值只是为了用faiss快速构建knn,k并不是infomap的一个参数。根据实际数据情况调整即可。

哈喽,请问下GCN-V和GCN-E paper里面100w以上的数据实验是怎么跑的,一个GPU直接OOM了。。