Closed passi3 closed 1 week ago
Dataset: V8
columns: 'area_m2', 'contract_date_numeric', 'floor', 'built_year', 'latitude', 'longitude', 'age', 'contract_0', 'contract_1', 'contract_year_month', 'deposit', 'apt_idx', 'area', 'grid_id', 'nearest_subway_distance', 'nearest_subway_idx', 'nearest_park_distance', 'apt_deposit_rank', 'apt_area_deposit_rank', 'recent_deposit', 'nearest_park_idx', 'nearest_school_idx', 'nearest_school_distance', 'park_area'
Hyper parameters: n_estimators=100 max_depth=20
Score(MAE): train: 2777 val: 3705 test: 3842
Feature Importances:
새로운 데이터셋에서 MAE 값이 줄어드는 것이 확인됨
RF는 max_depth가 증가할 수록, 다른 피처들의 importance도 같이 증가하는 경향이 확인되나, train에 대해서만 과적합되는 것으로 추정됨에 따라 max_depth에 따른 test MAE 값 확인 필요