boostcampaitech7 / level2-competitiveds-recsys-06

level2-competitiveds-recsys-06 created by GitHub Classroom
2 stars 0 forks source link

[Feature] 아파트 기준 공원과 학교의 개수 피처 추가 #42

Closed minari-c closed 1 month ago

minari-c commented 1 month ago

park, school 공통으로 사용한 변수

interval: float

train_df["_type"] = "train" test_df["_type"] = "test"

concat_df = pd.concat([train_df, test_df],axis=0)

from src.pre_process.feature_add import FeatureAddition

df = FeatureAddition(concat_df).get_data()

park_df = pd.read_csv('parkInfo.csv') school_df = pd.read_csv('schoolinfo.csv')

경로와 무관하게


### 추가 되는 feature

## school feature
- nearest_{level}_school_distance: float
  - 가장 가까운 학교 거리
- nearest_{level}_school_within_{interval_str}: int
  - interval 내의 학교 개수 
- has_{level}_school_within_{interval_str}: int
  - interval 내의 학교 유무

level은 각각 high, middle, elementary가 들어가서 총 9개의 feature가 추가된다.

### 활용 코드
```python
from src.pre_process.school.school_info_feature_add import SchoolInfoFeatureAdd

school = SchoolInfoFeatureAdd(df, school_df)
school.get_data()

image

park feature

활용 코드

from src.pre_process.park.park_info_feature_add import ParkInfoFeatureAdd

park = ParkInfoFeatureAdd(df, park_df)
park.get_data()

image 사진 상의 park_idx는 추가되지 않는다.