boostcampaitech3 / level2-dkt-level2-recsys-10

부스트캠프 AI Tech 3기 RecSys-10 / 👨‍🏫 Deep Knowledge Tracing(DKT) Competition 👨‍🏫
2 stars 5 forks source link

[discussion] Feature Engineering 기능 모듈화 제의 #19

Closed Gangtaro closed 2 years ago

Gangtaro commented 2 years ago

💡 Issue

현재 tabular와 dkt에 있는 dataloader.py > Preprocess > __feature_engineering 부분에서 Feature engineering을 적용할 수 있습니다. 이 때, 여기에 모든 방법론을 바로 적용하는 것이 아니라, 기능별로 함수 또는 클래스로 모듈화 해서 추가하는 것이 깔끔하고 더 실험에 유리하다고 생각합니다. 어떻게 생각하시나요? 이해가 가지 않는다면, 말씀 부탁드리겠습니다.

📝 TODO

📚 Reference

yst3147 commented 2 years ago

저는 모듈화보다는 버전 관리를 하는것이 낫다고 봅니다. feature 하나하나를 모듈화하면 너무 많아질 것 같아요.

ahyeon0508 commented 2 years ago

장단점이 있어 보이는데.. feature 하나하나를 모듈화하면 너무 많아질 것 같다는 말씀은 매우 공감이 되네요!

minchoul2 commented 2 years ago

저도 모듈화하는게 실험관리 측면에서 더 나을 것 같습니다 feature engineering 파일을 따로만들어서 config로 on/off 하는식으로 하는건 어떨런지요