ig-snooper pipeline.py predictor parameter

Feodorov commented 10 years ago

Привет.

Мог бы ты вынести отдельным параметром скриптов train.py predict.py имя предиктора?

Нужно добавить дополнительный ключ запуска: --predictor=RandomForest Внутри должен быть dict "Имя предиктора" -> ("Список параметров train", "Список параметров predict"). Затем эти списки подставляются в pipeline.py в строки 77 и 100 взамен части параметров. Если ключ --predictor отсутствует, то подставляется дефолтное значение из мапы (сейчас подставляй "RandomForest").

Например, для предиктора RandomForest в словаре будут два списка: ['weka.classifiers.trees.RandomForest', '-I', '10', '-K', '0', '-S', '1'] для train и ['weka.classifiers.trees.RandomForest'] для predict. Первый подставляется в 77 строку взамен захардкоженных, а второй - в строку 100. Остальные параметры в этих строках ('--no-cv' и т.п.) оставь как есть.

Я затем расширю словарь, добавив новые классификаторы.

Feodorov commented 10 years ago

ping?

Feodorov commented 10 years ago

Спасибо! Выглядит круто.

zmactep / ig-pipeline

ig-snooper pipeline.py predictor parameter #39