Closed ranydb closed 6 months ago
我尝试在examples文件夹下执行python -u data_preprocess.py --dataset_name ednet。
最终报错 train+valid original interactions num: 178558352, select num: 0, qs: 12277, cs: 188, seqnum: 588152
Killed
在killed之前我观察到系统内存不断升高,直至killed。 我个人的机器配置有192G内存。请问是处理这个数据集需要更大的内存还是说预处理代码存在内存泄露?
hello ednet数据集比较大,内存要求较高, 我们处理这个数据集时,使用的机子内存在400G以上
我尝试在examples文件夹下执行python -u data_preprocess.py --dataset_name ednet。
最终报错 train+valid original interactions num: 178558352, select num: 0, qs: 12277, cs: 188, seqnum: 588152
dropnum: 1848 train+valid sequences interactions num: 178556504, select num: 178556504, qs: 12277, cs: 188, seqnum: 1340548 dropnum: 438 original test interactions num: 45675101, select num: 0, qs: 12267, cs: 188, seqnum: 147038 test sequences interactions num: 45674663, select num: 45674663, qs: 12267, cs: 188, seqnum: 340129
Killed
在killed之前我观察到系统内存不断升高,直至killed。 我个人的机器配置有192G内存。请问是处理这个数据集需要更大的内存还是说预处理代码存在内存泄露?