Closed ryukinix closed 7 months ago
clf.predict_proba
pra calcular as probabilidades por classe:
https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html @Oscar280578
Colocado 3 jupyter notebook com os threholds de 30%, 50% e 80%. Não observei muitas diferenças significativas com eles. Sugiro usarmos 50/50.
Perfeito @Oscar280578. Issue fechada como concluída.
Dataset: https://www.kaggle.com/datasets/mysarahmadbhat/lung-cancer
Exemplo de abordagem: https://www.kaggle.com/code/adhamalahmady/lung-cancer-project-1
Definition of done:
model
no diretórioanalysis
que contenha o treinamento de um modelo indutivo com métricas de performance para o problema de estimar cancer.