RUCAIBox / TG-ReDial

the dataset TG-ReDial
Apache License 2.0
60 stars 5 forks source link

关于train_inter_history.pkl中一些数值的疑问 #9

Open JerrryNie opened 1 year ago

JerrryNie commented 1 year ago

您好,在train_inter_history.pkl (train_identity2history.pkl) 这个文件中, 最前面几行是:

 "0/7": [
        14644
    ],
    "0/11": [
        14644
    ],
    "0/15": [
        14644
    ],
    "1/5": [
        14644,
        0
    ],
    "1/7": [
        14644,
        0
    ],
    "1/11": [
        14644,
        0
    ],
    "10/7": [
        2998,
        33834,
        11982,
        9813,
        .....

我查了一下train_data.pkl中的数据,发现上面列出的三个conversations (conv_id=0, 1, 10),都是同一个user (user_id=0)和recommender对话产生的。那么为什么上面的"0/7", "1/7"和"10/7" (属于user 0的三次不同的对话) 所对应的lists是不同的呢?我对这些lists的理解是,user在对话之前产生的Film Watching Record。但为什么同一个人的三次不同对话会对应不同的film watching record呢?

谢谢!

LQlq123 commented 1 year ago

我有同样的疑惑,如果按照该数据集,那么是否一个用户的交互记录需要将他参与的所有对话的项目取并集?