lethuyduong2000 / Data_science-Project

0 stars 0 forks source link

Review Project #3

Open NeirT opened 2 years ago

NeirT commented 2 years ago

image Ở dòng trong hình nếu được nhóm bạn có thể show 2 dòng đó vì đôi khi các giá trị thiếu của các cột có thể nằm trên các dòng khác nhau

Theo mình đọc thì nhóm bạn drop 2 dòng có giá trị thiếu, 14 dòng lặp và 23 dòng có id trùng vậy dữ liệu sau khi xử lý phải là 20021-2-14-23 = 19982 thay vì 19993 không. Mình không chắc mình hiểu đúng không hay giữa 14 dòng lặp có 23 dòng trùng id có chung dòng với nhau. Nên nhóm bạn có thể viết markdown giải thích rõ hơn thì tốt quá.

image

Mình thấy sau khi chạy mô hình thì điểm của r2 khá thấp thì nên có thêm nhận xét sẽ giúp bài của bạn nhóm tốt hơn

Mình thấy cách các bạn lấy data từ tiki khá hay và đề tài rất thú vị. Cảm ơn các bạn đã đọc ý kiến của mình. 😄

lethuyduong2000 commented 2 years ago

Cảm ơn bạn đã góp ý cho nhóm. Đúng là các dòng trùng ID và các dòng trùng nhau có bị trùng, mình sẽ bổ sung markdown giải thích. R2 score thấp thật, mình có thử LinearRegression, RandomForestRegressor mà kết quả không tốt hơn MLPRegressor