set up rl-human-prefs - Githubissues

yamatokataoka / learning-from-human-preferences

Replication of Deep Reinforcement Learning from Human Preferences (Christiano et al, 2017).

MIT License

2 stars 0 forks source link

Closed yamatokataoka closed 2 years ago

yamatokataoka commented 2 years ago

yamatokataoka commented 2 years ago

poetry would be good option for sophisticated dependency management

yamatokataoka commented 2 years ago

I don't use Docker because we can't run Docker on Colab and isolation of environment would be enough with poetry and its venv.

yamatokataoka commented 2 years ago

linters

yamatokataoka commented 2 years ago

yamatokataoka commented 2 years ago