RUCAIBox / RecBole

A unified, comprehensive and efficient recommendation library
https://recbole.io/
MIT License
3.38k stars 605 forks source link

请问一下,对于Sequence Recommendation的模型GRU4Rec和SaSRec,他们的数据都是如何预处理的? #1700

Open SakuraXiaMF opened 1 year ago

SakuraXiaMF commented 1 year ago

请问一下,对于Sequence Recommendation的模型GRU4Rec和SaSRec,他们的数据都是如何预处理的?比如我选择ml20M和taobao数据集……是如果处理的……

peteryang1031 commented 1 year ago

您好,这需要将原始的数据集按照RecBole中的.inter文件的格式进行处理。具体来说,.inter文件中每一条记录包含 [user_id, item_id, rating, timestamp, review] 这五项数据。在实际操作中,您可以参考我们所提供的ml-100k的数据集格式,或查阅下面的文档获取更加详细的数据集原子文件信息:https://recbole.io/atomic_files.html

SakuraXiaMF commented 1 year ago

感谢您的回复。看到了数据atomic文件的数据处理格式。大概了解了我们数据处理的要求。 我现在还有一个问题,就是我想做这样的任务, 1 利用SASRec模型来进行Sequence recommendation任务,数据集是ml20m 2 利用GRU4Rec模型来进行Sequence recommendation任务或者Session-based recommendation任务,数据集是taobao [https://tianchi.aliyun.com/dataset/649]。 请问一下,对于我想利用taobao数据集进行sequence-recommendation的任务,我应该执行哪个文件来处理淘宝的raw data呢?或者我想利用taobao数据集进行Session-based任务,我应该执行哪个文件呢?

peteryang1031 commented 1 year ago

您好,您可以参考我们提供的数据集转换工具对您的原始数据进行处理。对于您的Sequence Recommendation任务,只需将数据集转化成.inter文件即可。

SakuraXiaMF commented 1 year ago

哦了,我今天debug一天,大概了解了。谢谢。那如果对于session sequence recommend任务可以处理吗?

---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2023年03月20日 18:57 | | 收件人 | @.> | | 抄送至 | @.>@.> | | 主题 | Re: [RUCAIBox/RecBole] 请问一下,对于Sequence Recommendation的模型GRU4Rec和SaSRec,他们的数据都是如何预处理的? (Issue #1700) |

您好,您可以参考我们提供的数据集转换工具对您的原始数据进行处理。对于您的Sequence Recommendation任务,只需将数据集转化成.inter文件即可。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

SakuraXiaMF commented 1 year ago

后面想基于我们的框架,做一下FedRecommendation的推荐,但感觉好多东西都不太懂

peteryang1031 commented 1 year ago

您好,做Session Recommendation Task是可以的,具体可以参考伯乐中的运行案例

SakuraXiaMF commented 1 year ago

您好,做Session Recommendation Task是可以的,具体可以参考伯乐中的运行案例

谢谢您的答复。我看看感觉还行,不是很困难。现在有一个问题就是……我用我们的数据处理工具处理mvln-1m的数据,但他没有处理出timestamp. 细节见:https://github.com/RUCAIBox/RecBole/issues/1704