Closed habroptilus closed 3 years ago
時系列データのvalidaitonの作り方は大きく分けてふたつあり
後者はhttps://blog.amedama.jp/entry/time-series-cvとかが参考になるので自分の実装にいれたものの、一番古いfoldに対してoof_predが計算できない問題があり、evaluatorの方はそのデータをdropしてwarningを出すようにして計算するようにしたが、ensembleはできないままになっている。
前者はその点どのfoldに対してもoofは計算できるが、trainとvalidの順序は守られない。データの時系列的な近さだけ気にする必要があり順序は気にしなくていい場合はこれでも良い。
foldの作り方によっては全てのtrainデータがvalidに現れるという前提を満たさない場合もあるわけで、そういう場合のvalidationをした場合でも対応できる必要はある。別のissueにする
このissueは概要のふたつの時系列CVを実装して、(後者はensembleできない状態だが)closeして別のissueで対応する
時系列データのvalidaitonの作り方は大きく分けてふたつあり
後者はhttps://blog.amedama.jp/entry/time-series-cvとかが参考になるので自分の実装にいれたものの、一番古いfoldに対してoof_predが計算できない問題があり、evaluatorの方はそのデータをdropしてwarningを出すようにして計算するようにしたが、ensembleはできないままになっている。
前者はその点どのfoldに対してもoofは計算できるが、trainとvalidの順序は守られない。データの時系列的な近さだけ気にする必要があり順序は気にしなくていい場合はこれでも良い。