ik kan inkomen dat voor sommige gezinnen, de dag van de week een zinvolle predictor is voor watergebruik, maar een paar van de boven-genoemde regressie-parameters louter toeval, niet zinvol voor het verhogen van de predictiekwaliteit... ook al hebben ze toevallig een hogere correlatie in historische data. Lijkt me eerder een geval van overfitting en toevallige correlatie.
Misschien zinvol om de regressieparameters voor deze utility te beperken, ook al komt er dan een midner goede correlatie uit, deze zal waarschijnlijk toch betere voorspellingen opleveren (grey box vs black box)?
ik kan inkomen dat voor sommige gezinnen, de dag van de week een zinvolle predictor is voor watergebruik, maar een paar van de boven-genoemde regressie-parameters louter toeval, niet zinvol voor het verhogen van de predictiekwaliteit... ook al hebben ze toevallig een hogere correlatie in historische data. Lijkt me eerder een geval van overfitting en toevallige correlatie.
Misschien zinvol om de regressieparameters voor deze utility te beperken, ook al komt er dan een midner goede correlatie uit, deze zal waarschijnlijk toch betere voorspellingen opleveren (grey box vs black box)?