antoniofrancaib / multi-armed-bandits

0 stars 0 forks source link

testear ambos con muchos timesteps para ver si funciona #7

Open antoniofrancaib opened 2 years ago

antoniofrancaib commented 2 years ago

hipotesis: si el tiempo del time step tiende a 0, el con step actua mejor en nuestro caso se traduce a actuar con muchos steps