zhougr1993 / DeepInterestNetwork

1.61k stars 559 forks source link

cat aa ab ac 与python运行脚本生成的dataset.pkl不相同?大小差了两倍左右?! #62

Open Ming-Qin-tech opened 4 years ago

Ming-Qin-tech commented 4 years ago

python build_dataset.py

We put a processed data 'dataset.pkl' in DeepInterestNetwork/din. Considering the GitHub's file size limit of 100.00 MB, we split it into 3 file aa ab ac.

cat aa ab ac > dataset.pkl 按道理讲,两个dataset不应该是一样的吗?cat aa ab ac 不是仅仅是为了读者方便吗?

ghost commented 4 years ago

cat aa ab ac > dataset.pkl 生成的文件为223,497KB,bulid_dataset.py生成的文件为84,779KB,你是这样吗?

Ming-Qin-tech commented 4 years ago

太久了,不记得了,不好意思,

YoungsonZhao commented 4 years ago

cat aa ab ac > dataset.pkl 生成的文件为223,497KB,bulid_dataset.py生成的文件为84,779KB,你是这样吗?

我这是这样的,不知道为何

ucasiggcas commented 3 years ago

cat aa ab ac > dataset.pkl 生成的文件为223,497KB,bulid_dataset.py生成的文件为84,779KB,你是这样吗?

我的和你的差不多。难道原来的数据集不一样??或者pickle版本升级了?