Closed gqqnbig closed 4 years ago
cursor.execute('select * from Ratings')
all_ratings = cursor.fetchall()
Loading data takes 5.71154522895813 seconds. dataset shape is (138020, 11401)
virt: 2838M
all_ratings= pd.read_sql('select * from Ratings',con)
Loading data takes 9.735082149505615 seconds.
virt: 1576M
Loading data takes 1.562063455581665 seconds. dataset shape is (138020, 11401)
你可以从历史记录里看出,我基于
整合后的apriori.py
修改了读入数据方式为标准版,测试可运行,准确率51%。仅仅考虑了电影id的Apriori不行。
版本修改,算法有一点点不一样,具体看提交日志。算出来validation set全集准确率只有0.48。
因为我先拿去看了,你再提交new.py,我就没法基于new.py修改。
如果frequent pattern这个方法准确率不行,你就close issue。如果你想继续修改,千万不要在#18分支上修改。
存档到分支 archived/#18
这里报错,你运行一下试试。
还有validate_ver3.py里,你用我们标准的读数据的方式,不要硬编码"E:/pycharm/cs145project/data"
改完以后assign给我,谢谢。