Kalau kata bahrun #2 itu bagusnya kumulatif? Mengapa, karena secara intuitif, kita tak bisa memprediksi masa sekarang dengan data masa depan.
Misal hari ini adalah N, besok N+1, lusa N+2. Kita tak dapat memprediksi N+1 dengan data N+2, hanya data di hari ke-N yang dapat kita gunakan
Sedangkan, return_prob di data testing pakai probabilitas terakhir (yaitu ekuivalen dengan implementasi sekarang yang menjumlah seluruh baris)
Istilah yang lebih tepat adalah prior probability.
Bagaimana menurut kalian? Diskusikan!
Contoh argumen terhadap isu ini:
pro: seperti argumen bahrun
kontra: apakah model machine learning dapat mempelajari makna dari probabilitas prior?(probabilitas yang dipelajari dari masa lalu; berubah seiring waktu )
Langkah benerin?
[x] ganti sum() jadi cumsum()
[ ] pastikan data testing/validation pakai probabilitas kumulatif terakhir
Kalau kata bahrun #2 itu bagusnya kumulatif? Mengapa, karena secara intuitif, kita tak bisa memprediksi masa sekarang dengan data masa depan. Misal hari ini adalah N, besok N+1, lusa N+2. Kita tak dapat memprediksi N+1 dengan data N+2, hanya data di hari ke-N yang dapat kita gunakan
Sedangkan, return_prob di data testing pakai probabilitas terakhir (yaitu ekuivalen dengan implementasi sekarang yang menjumlah seluruh baris)
Istilah yang lebih tepat adalah prior probability.
Bagaimana menurut kalian? Diskusikan!
Contoh argumen terhadap isu ini:
Langkah benerin?
sum()
jadicumsum()