aimclub / FEDOT

Automated modeling and machine learning framework FEDOT
https://fedot.readthedocs.io
BSD 3-Clause "New" or "Revised" License
632 stars 86 forks source link

Balanced / unbalanced data #365

Closed MAGLeb closed 1 year ago

MAGLeb commented 3 years ago
chain_evo_composed = composer.compose_chain(data=input_data, is_visualise=True)

Got error: ValueError: Only one class present in y_true. ROC AUC score is not defined in that case.

In my case binary classification with 620k objects and only 30k equal ones. 5% ones in the target variable.

nicl-nno commented 3 years ago

Попробуй добавить внутри composer в train_test_data_setup установку shuffle_flag как True. Раньше это было так, видимо затерлось при каких-то правках.

MAGLeb commented 3 years ago

Может быть написать функцию, которая будет делить сбалансированно данные на train and test опираясь на таргет. Аналогичная ошибка падает, когда вызываю метод fine_tune_all_nodes.

kasyanovse commented 1 year ago

В https://github.com/aimclub/FEDOT/pull/1138 включена стратификация при разделении данных на выборки для задач классификации. Проблема должна быть исчерпана.