Closed nibyig closed 1 year ago
You're right, for Globo dataset, the category_id
is very large so it will cost a lot of time. When I run, I will remove this line: if self.reverse_item[recList[i]] in self.category_id
. But this line is still needed for other datasets. As for reverse_item
, it maps the origin id with the index in embedding matrix, so it's better to keep it.
好的,明白了,谢谢您的解答!顺带问一下这个模型如何获得HR指标呀,源代码里似乎没有
In our session-based scenario, mathematically, Recall@k==HR@k
.
教授您好!关于指标ILD和unexp,我们有一些问题。 我们算出来的ILD20和unexp20都是0,并且速度非常慢,循环体量太大,耗时长。 我们有两个问题: 第一个是ILD20和unexp20的计算方法好像存在问题。 第二个是教授团队在具体实验中出指标计算速度似乎非常快,请问有什么诀窍嘛。 根据论文中的定义,ILD和unexp中的d(a,b)是指a,b不为一个topic或者category时为1,否则为0 根据源码:
我们需要通过中间的一个字典self.reverse_item来判断i和j是不是一个category,但是self.reverse_item并不是算的有关item的category,只是简单的标号而已,以至于我们算出来的ILD20和unexp20都是0。 我们尝试进行修改,self.reverse_item这一层好像需要去掉,即改成:
想向教授验证一下这样改动是否正确,如不正确,应当如何修改。