Creditas / galeritas

Galeritas is an open library for data visualization.
Apache License 2.0
37 stars 3 forks source link

[Bug] Valores diferentes de 0 e 1 para o 'target' no grafico da calibragem #13

Open joaoOarthur opened 2 years ago

joaoOarthur commented 2 years ago

Describe the bug

atualmente é possivel passar valores diferentes de 0 e 1 para o target. Não temos certeza se é realmente um Bug, pois não está claro o que o eixo y está representando.

Expected Results

.

Actual Results

No exemplo abaixo, o y_true é um array de 1's e 2's. image

Porém, o 'mean target value' (eixo y) se mantém no intervalo 0,1. Porque?

Esperavamos que para cada 'bin' (eixo x) fosse calculado a média do target, que nesse caso devia ser sempre maior do que 1.

Steps/Code to Reproduce

import pandas as pd
import numpy as np
from galeritas.plot_calibration_and_distribution import plot_calibration_and_distribution

data = pd.read_feather('../../../abc-score/data/i0/analysis/processed_data-exp03-test-predictions.feather')
data['y_true_toy'] = np.where(data['generic_default_6m'] == 0, 2, data['generic_default_6m'])
plot_calibration_and_distribution(data=abc_score, target='y_true_toy', predictions='y_pred', strategy='quantile', n_bins=100)

Your environment

pandas=1.1.5 numpy=1.20.3 matplotlib=3.5.0 seaborn=0.11.2

OS: Ubuntu 20.04

Any possible solutions?

No response

Any other comments?

No response