yandexdataschool / satellite-collision-avoidance

RL for optimal satellite collision avoidance maneuvres
25 stars 7 forks source link

Как SpaceObject должен реагировать на предложение выполнить невозможный манёвр? #20

Closed kazeevn closed 6 years ago

kazeevn commented 6 years ago

Какое поведение закладывать, если запрошенный манёвр некорректен (не хватает топлива/слишком большой импульс)?

Наивные идеи:

  1. Не делать ничего.
  2. Делать максимально возможный.
Dsdubov commented 6 years ago

Так же вопрос что делать в таком случае с time to request. Мы можем оставить его как было и получается сразу на следующей итерации запросить action, возможно это имеет смысл. Либо обновить его на то значение, которое вернет агент.

kazeevn commented 6 years ago

Дмитрий Дубов

насколько я сегодня понял правильно Сашу (за пару минут), в policy-based или value-based подходах можно как-то нормализовать распределения чтобы неподходящие actions не выбирались никогда. Я постараюсь поточнее понять)

kazeevn commented 6 years ago

Решили:

  1. Не выполнять ничего
  2. Писать в лог
  3. В агенте делать перенормировку действий на пространство разрешенных манёвров