cancer-estimator / model

Model Search Repository
0 stars 0 forks source link

Add catboost regression with p@k #32

Closed ryukinix closed 6 months ago

ryukinix commented 6 months ago

28

ryukinix commented 6 months ago

Falta ajustar algumas coisas:

Contraponto:

image

https://chatgpt.com/share/4c6ac2ff-488f-46b9-a589-7cb05ba628a1

cc: @verri

ryukinix commented 6 months ago

@verri @Oscar280578 @helen0l Deixei ambas formúlas de calcular como print, mas considerei como p@k apenas como a fórmula:

$$p@k = \dfrac{TP}{K}$$

Invés de:

$$p@k = \dfrac{TP}{TP + FP}$$

verri commented 6 months ago

@verri @Oscar280578 @helen0l Deixei ambas formúlas de calcular como print, mas considerei como p@k apenas como a fórmula:

$$p@k = \dfrac{TP}{K}$$

Invés de:

$$p@k = \dfrac{TP}{TP + FP}$$

TP + FP no caso tradicional vem do total de positivos preditos. No caso de recuperação de informação, esse denominador é por definição o próprio k.

Em geral, no caso do parcialmente não rotulado, uma premissa é que ao menos conhecemos a priori.

Como vocês não a conhecem certamente, sugiro observar a curva p@k vs k. Ela pode trazer bons insights quanto a isso. (Concatene as saídas dos folds para calcular uma curva só)