gqqnbig / cs145project

0 stars 2 forks source link

如何用frequent pattern预测 #18

Closed gqqnbig closed 4 years ago

gqqnbig commented 4 years ago

pycharm64_2019-11-28_12-23-16 这里报错,你运行一下试试。

还有validate_ver3.py里,你用我们标准的读数据的方式,不要硬编码"E:/pycharm/cs145project/data"

改完以后assign给我,谢谢。

gqqnbig commented 4 years ago

SQL

cursor.execute('select * from Ratings')
all_ratings = cursor.fetchall()

Loading data takes 5.71154522895813 seconds. dataset shape is (138020, 11401)

virt: 2838M

SQL-pandas

all_ratings= pd.read_sql('select * from Ratings',con)

Loading data takes 9.735082149505615 seconds.

virt: 1576M

CSV

Loading data takes 1.562063455581665 seconds. dataset shape is (138020, 11401)

gqqnbig commented 4 years ago

你可以从历史记录里看出,我基于

整合后的apriori.py

修改了读入数据方式为标准版,测试可运行,准确率51%。仅仅考虑了电影id的Apriori不行。

版本修改,算法有一点点不一样,具体看提交日志。算出来validation set全集准确率只有0.48。

因为我先拿去看了,你再提交new.py,我就没法基于new.py修改。

如果frequent pattern这个方法准确率不行,你就close issue。如果你想继续修改,千万不要在#18分支上修改

gqqnbig commented 4 years ago

存档到分支 archived/#18