Open NeirT opened 2 years ago
Cảm ơn bạn đã góp ý cho nhóm. Đúng là các dòng trùng ID và các dòng trùng nhau có bị trùng, mình sẽ bổ sung markdown giải thích. R2 score thấp thật, mình có thử LinearRegression, RandomForestRegressor mà kết quả không tốt hơn MLPRegressor
Theo mình đọc thì nhóm bạn drop 2 dòng có giá trị thiếu, 14 dòng lặp và 23 dòng có id trùng vậy dữ liệu sau khi xử lý phải là 20021-2-14-23 = 19982 thay vì 19993 không. Mình không chắc mình hiểu đúng không hay giữa 14 dòng lặp có 23 dòng trùng id có chung dòng với nhau. Nên nhóm bạn có thể viết markdown giải thích rõ hơn thì tốt quá.
Mình thấy sau khi chạy mô hình thì điểm của r2 khá thấp thì nên có thêm nhận xét sẽ giúp bài của bạn nhóm tốt hơn
Mình thấy cách các bạn lấy data từ tiki khá hay và đề tài rất thú vị. Cảm ơn các bạn đã đọc ý kiến của mình. 😄