Closed Gangtaro closed 2 years ago
저는 모듈화보다는 버전 관리를 하는것이 낫다고 봅니다. feature 하나하나를 모듈화하면 너무 많아질 것 같아요.
장단점이 있어 보이는데.. feature 하나하나를 모듈화하면 너무 많아질 것 같다는 말씀은 매우 공감이 되네요!
저도 모듈화하는게 실험관리 측면에서 더 나을 것 같습니다 feature engineering 파일을 따로만들어서 config로 on/off 하는식으로 하는건 어떨런지요
💡 Issue
현재 tabular와 dkt에 있는 dataloader.py > Preprocess > __feature_engineering 부분에서 Feature engineering을 적용할 수 있습니다. 이 때, 여기에 모든 방법론을 바로 적용하는 것이 아니라, 기능별로 함수 또는 클래스로 모듈화 해서 추가하는 것이 깔끔하고 더 실험에 유리하다고 생각합니다. 어떻게 생각하시나요? 이해가 가지 않는다면, 말씀 부탁드리겠습니다.
📝 TODO
📚 Reference