Как SpaceObject должен реагировать на предложение выполнить невозможный манёвр?

yandexdataschool / satellite-collision-avoidance

RL for optimal satellite collision avoidance maneuvres

25 stars 7 forks source link

Как SpaceObject должен реагировать на предложение выполнить невозможный манёвр? #20

Closed kazeevn closed 6 years ago

kazeevn commented 6 years ago

Какое поведение закладывать, если запрошенный манёвр некорректен (не хватает топлива/слишком большой импульс)?

Наивные идеи:

Не делать ничего.
Делать максимально возможный.

Dsdubov commented 6 years ago

Так же вопрос что делать в таком случае с time to request. Мы можем оставить его как было и получается сразу на следующей итерации запросить action, возможно это имеет смысл. Либо обновить его на то значение, которое вернет агент.

kazeevn commented 6 years ago

Дмитрий Дубов

насколько я сегодня понял правильно Сашу (за пару минут), в policy-based или value-based подходах можно как-то нормализовать распределения чтобы неподходящие actions не выбирались никогда. Я постараюсь поточнее понять)

kazeevn commented 6 years ago

Решили:

Не выполнять ничего
Писать в лог
В агенте делать перенормировку действий на пространство разрешенных манёвров