faherngeit / rl_pss

Scientific project about Power System Stabiliser based on reinforcement learning techniques
4 stars 0 forks source link

Separate function to estimate model performance #13

Open faherngeit opened 2 years ago

faherngeit commented 2 years ago

Предлагаю сделать отдельную функцию в матлабе, которая будет запускать расчет эксперимента с текущей версией агента и возвращать суммарную награду ( а может быть еще и награду типового регулятора), чтобы можно было в процессе обучение раз в несколько шагов делать независимый тест качества обучения. Я бы даже предложил вынести несколько моделей, которых нет в обучающей выборке с разными по характеру сценариями и на них тестироваться.

HipHopZmey commented 2 years ago

Да, давно собирались кстати. Я помню, что ты писал про такое. Я сделаю в течение пары дней. В качестве набора сценариев думаю взять все варианты событий для базового режима, т.е. без случайных отклонений. Это 27 сценариев. Один вопрос. Правильно понимаю, что в этой функции не нужно отдельно предусматривать загрузку агента? Все настройки автоматически подгрузятся через matlab функцию агента, верно?

faherngeit commented 2 years ago

В текущей версии мы агента вообще не грузим, у нас запускается скрипт, который отправляет запросы на сервер, где он крутится постоянно. Либо я не совсем тебя понял. 27 сценариев – это даже многовато, я бы сказал :) Будет хорошо, если можно будет также указывать количество, а еще лучше явно номер сценария, а не семплировать его случайно, чтобы можно было следить за качеством на одном отдельном примере. Ну и будет отлично, если модель будет возвращать уже итоговую осчитанную суммарную награду.