Dự án là dự án của nhóm làm về bài tập lớn môn Nhập môn Khoa học dữ liệu. Nội dung dự án là cào dữ liệu từ trang https://batdongsan.vn/ban-nha/, sau đó thực hiện phân tích và đánh giá giá nhà sử dụng các mô hình cơ bản.
Báo cáo của nhóm có thể tìm thấy ở file report.ipynb
Tuần/Ngày | Công Việc | Người Thực Hiện | Ghi Chú |
---|---|---|---|
02/06 - 05/06 | Phát triển script scrape dữ liệu | Trần Lê Hữu Vinh | |
06/06 - 07/06 | Kiểm tra và làm sạch dữ liệu | Lý Quang Thắng | |
08/06 - 09/06 | EDA | Lê Phú Trường | Outlier, Distribution, Tuong quan |
10/06 - 14/06 | Feature Engineer | Hồ Quốc Nhân Hòa | Chuẩn bị dữ liệu cho mô hình hóa |
15/06 | Huấn luyện các mô hình | Đào Xuân Tân | Linear Regression, Decision Tree |
16/06 | Đánh giá mô hình | Trần Lê Hữu Vinh, Lý Quang Thắng | So sánh hiệu suất các mô hình |
17/06-19/06 | Tinh chỉnh mô hình tốt nhất | Lê Phú Trường, Hồ Quốc Nhân Hòa | Hyper Tuning |
20/06-21/06 | Hoàn thiện báo cáo | Đào Xuân Tân | Mô tả quá trình, phương pháp luận |
21/06 | Đóng gói dữ liệu và nộp báo cáo | Tất cả | Kiểm tra lại toàn bộ dự án |