Closed caburu closed 4 years ago
Resolvido no pull request #13
Agora há os seguintes novos parâmetros para o ambiente:
stochastic_leadtimes
: indica se os leadtimes são estocásticos ou constantes.avg_leadtime
: leadtime médio a ser considerado no caso estocástico (ou o valor constante no caso contrário).max_leadtime
: valor máximo do leadtime estocástico (deve ser igual ao avg_leadtime no caso constante).Os leadtimes são escolhidos de uma distribuição de Poisson.
avg_leadtime-1
e os valores são somados com 1.max_leadtime
são igualados a esse valor.
Na extensão 1 do projeto de doutorado a ideia é usar um cenário de demandas sazonais para comparar o PPO2 com um agente baseado em programação linear.
Os experimentos preliminares mostraram que o agente PL é melhor mesmo com aumentando a variação das demandas. A hipótese é de que quanto maior a incerteza melhor para o PPO2 e pior para o baseline, e vice-versa.
Nesse sentido uma outra forma de aumentar a incerteza do cenário é considerar leadtimes estocásticos. A ideia então é alterar o código do ambiente para que ele possa trabalhar também com leadtimes estocásticos (além de continuar permitindo o uso de leadtimes constantes).