gqqnbig / cs145project

0 stars 2 forks source link

Closed gqqnbig closed 4 years ago

gqqnbig commented 4 years ago

pycharm64_2019-11-28_12-23-16 这里报错，你运行一下试试。

还有validate_ver3.py里，你用我们标准的读数据的方式，不要硬编码"E:/pycharm/cs145project/data"

改完以后assign给我，谢谢。

gqqnbig commented 4 years ago

SQL

cursor.execute('select * from Ratings')
all_ratings = cursor.fetchall()

Loading data takes 5.71154522895813 seconds. dataset shape is (138020, 11401)

virt: 2838M

all_ratings= pd.read_sql('select * from Ratings',con)

Loading data takes 9.735082149505615 seconds.

virt: 1576M

Loading data takes 1.562063455581665 seconds. dataset shape is (138020, 11401)

gqqnbig commented 4 years ago

你可以从历史记录里看出，我基于

整合后的apriori.py

修改了读入数据方式为标准版，测试可运行，准确率51%。仅仅考虑了电影id的Apriori不行。

版本修改，算法有一点点不一样，具体看提交日志。算出来validation set全集准确率只有0.48。

因为我先拿去看了，你再提交new.py，我就没法基于new.py修改。

如果frequent pattern这个方法准确率不行，你就close issue。如果你想继续修改，千万不要在#18分支上修改。

gqqnbig commented 4 years ago

存档到分支 archived/#18