habroptilus / lilac

0 stars 0 forks source link

時系列データに関するCV #27

Closed habroptilus closed 3 years ago

habroptilus commented 3 years ago

時系列データのvalidaitonの作り方は大きく分けてふたつあり

後者はhttps://blog.amedama.jp/entry/time-series-cvとかが参考になるので自分の実装にいれたものの、一番古いfoldに対してoof_predが計算できない問題があり、evaluatorの方はそのデータをdropしてwarningを出すようにして計算するようにしたが、ensembleはできないままになっている。

前者はその点どのfoldに対してもoofは計算できるが、trainとvalidの順序は守られない。データの時系列的な近さだけ気にする必要があり順序は気にしなくていい場合はこれでも良い。

habroptilus commented 3 years ago

foldの作り方によっては全てのtrainデータがvalidに現れるという前提を満たさない場合もあるわけで、そういう場合のvalidationをした場合でも対応できる必要はある。別のissueにする

habroptilus commented 3 years ago

このissueは概要のふたつの時系列CVを実装して、(後者はensembleできない状態だが)closeして別のissueで対応する