stianteien / instradag

0 stars 0 forks source link

Kjøpspunish i env #20

Open stianteien opened 3 years ago

stianteien commented 3 years ago

Ha med punsihment i env siden jeg nå tester ut openai sine rl

stianteien commented 3 years ago

portofolio og pris per funket dårlig med 10 000 steps

stianteien commented 3 years ago

Større problem: lstm støttes ikke hos stable_baselines3 enda så får vente på det.

stianteien commented 3 years ago

Kan bruke sigmoid til å belønne lengre handler. Må putte inn counter i env. p(x) = 1/(1+e^-x) r' = r + p

stianteien commented 3 years ago

Kan bruke sigmoid til å belønne lengre handler. Må putte inn counter i env. p(x) = 1/(1+e^-x) r' = r + p

^- dette skaper jo bare lengre handler men fjerner ikke de korte.