numbbbbb / githuber.info

打造最好用的GitHub人才挖掘工具
339 stars 57 forks source link

排序/分类可能有问题 #13

Open kxxoling opened 9 years ago

kxxoling commented 9 years ago

Binux 和 Lepture 都是 Python 大牛,Solfish、Ruanyf 应该是以 JS 为主,都出现在这个排行榜的 CSS 部分了:http://githuber.info/rank

numbbbbb commented 9 years ago

这个其实有个本质问题,就是判断一个项目所属语言。目前采用的方式是把代码量最多的语言当做项目所属语言,所以就会出现这种问题,一个项目CSS最多,但是这可能是一个其他项目。。。或许我们可以换个更好的排名算法?不再把一个项目划分到一个语言,而是把star分摊下去,比如一个项目1000star,JS代码占40%,那这个项目就算作400star的JS项目。但是这样算也有问题,就是有些语言天生代码量就大,会分走比较多的star。。。有什么好想法吗?

kxxoling commented 9 years ago

@numbbbbb 就算是这种排序逻辑,依然有问题, binux star 数最多的项目的主要语言都是 Python 和 JS,结果出现在 CSS 的榜单上, Lepture 也是。Python 那边, yixiaohan 几乎没有 Python 项目,居然第 6(比较火的两个项目都没有语言分类)。 排序方法我再想想,但是现在的算法实现上貌似是存在问题的。 PS:robots 那个 issue 你再不解决我就发 PR 了! =。=