tandao0909 / intro-to-ds-project

Apache License 2.0
1 stars 1 forks source link

Dự án là dự án của nhóm làm về bài tập lớn môn Nhập môn Khoa học dữ liệu. Nội dung dự án là cào dữ liệu từ trang https://batdongsan.vn/ban-nha/, sau đó thực hiện phân tích và đánh giá giá nhà sử dụng các mô hình cơ bản.

Introduce to Data Science - Project 1

Report

Báo cáo của nhóm có thể tìm thấy ở file report.ipynb

Timeline

Tuần/Ngày Công Việc Người Thực Hiện Ghi Chú
02/06 - 05/06 Phát triển script scrape dữ liệu Trần Lê Hữu Vinh
06/06 - 07/06 Kiểm tra và làm sạch dữ liệu Lý Quang Thắng
08/06 - 09/06 EDA Lê Phú Trường Outlier, Distribution, Tuong quan
10/06 - 14/06 Feature Engineer Hồ Quốc Nhân Hòa Chuẩn bị dữ liệu cho mô hình hóa
15/06 Huấn luyện các mô hình Đào Xuân Tân Linear Regression, Decision Tree
16/06 Đánh giá mô hình Trần Lê Hữu Vinh, Lý Quang Thắng So sánh hiệu suất các mô hình
17/06-19/06 Tinh chỉnh mô hình tốt nhất Lê Phú Trường, Hồ Quốc Nhân Hòa Hyper Tuning
20/06-21/06 Hoàn thiện báo cáo Đào Xuân Tân Mô tả quá trình, phương pháp luận
21/06 Đóng gói dữ liệu và nộp báo cáo Tất cả Kiểm tra lại toàn bộ dự án

Project Structure