Open stianteien opened 3 years ago
portofolio og pris per funket dårlig med 10 000 steps
Større problem: lstm støttes ikke hos stable_baselines3 enda så får vente på det.
Kan bruke sigmoid til å belønne lengre handler. Må putte inn counter i env. p(x) = 1/(1+e^-x) r' = r + p
Kan bruke sigmoid til å belønne lengre handler. Må putte inn counter i env. p(x) = 1/(1+e^-x) r' = r + p
^- dette skaper jo bare lengre handler men fjerner ikke de korte.
Ha med punsihment i env siden jeg nå tester ut openai sine rl