cerebro-ai / lux-ai-2021

Lux AI 2021 Competition
2 stars 1 forks source link

Implement Learner #11

Closed fxbk closed 3 years ago

fxbk commented 3 years ago

also evtl brauchen wir noch einen Learner, der sich die replaybuffer von allen agents zieht (können auch 10 sein) dann die gradient steps macht, und all den agents dann das neue modell zurück gibt

Originally posted by @rkstgr in https://github.com/cerebro-ai/lux-ai-2021/issues/10#issuecomment-947501228

fxbk commented 3 years ago

@rkstgr reicht es nicht ein Agent immer trainieren zu lassen? Der andere bekommt dann einfach die Modelle von dem anderen

rkstgr commented 3 years ago

ja würde eigentlich reichen, wir müssten nach jedem step nur dem anderen agent die geupdatete action & critic parameters geben

rkstgr commented 3 years ago

Mit dem Learner können wir nur schneller replays sammeln (aka parallelisation on multiple cores)

fxbk commented 3 years ago

Ja macht Sinn. Können wir uns ja mal vormerken ;)

rkstgr commented 3 years ago

Closed since the project transitioned to using ray rllib which includes a learner