atualmente é possivel passar valores diferentes de 0 e 1 para o target. Não temos certeza se é realmente um Bug, pois não está claro o que o eixo y está representando.
Expected Results
.
Actual Results
No exemplo abaixo, o y_true é um array de 1's e 2's.
Porém, o 'mean target value' (eixo y) se mantém no intervalo 0,1. Porque?
Esperavamos que para cada 'bin' (eixo x) fosse calculado a média do target, que nesse caso devia ser sempre maior do que 1.
Steps/Code to Reproduce
import pandas as pd
import numpy as np
from galeritas.plot_calibration_and_distribution import plot_calibration_and_distribution
data = pd.read_feather('../../../abc-score/data/i0/analysis/processed_data-exp03-test-predictions.feather')
data['y_true_toy'] = np.where(data['generic_default_6m'] == 0, 2, data['generic_default_6m'])
plot_calibration_and_distribution(data=abc_score, target='y_true_toy', predictions='y_pred', strategy='quantile', n_bins=100)
Describe the bug
atualmente é possivel passar valores diferentes de 0 e 1 para o target. Não temos certeza se é realmente um Bug, pois não está claro o que o eixo y está representando.
Expected Results
.
Actual Results
No exemplo abaixo, o y_true é um array de 1's e 2's.
Porém, o 'mean target value' (eixo y) se mantém no intervalo 0,1. Porque?
Esperavamos que para cada 'bin' (eixo x) fosse calculado a média do target, que nesse caso devia ser sempre maior do que 1.
Steps/Code to Reproduce
Your environment
pandas=1.1.5 numpy=1.20.3 matplotlib=3.5.0 seaborn=0.11.2
OS: Ubuntu 20.04
Any possible solutions?
No response
Any other comments?
No response