Action out of bound when running PPO on Atari

  File "/home/seungjaeryanlee/git/agents/tf_agents/environments/tf_py_environment.py", line 203, in _step_py
    self._time_step = self._env.step(packed)

  File "/home/seungjaeryanlee/git/agents/tf_agents/environments/py_environment.py", line 174, in step
    self._current_time_step = self._step(action)

  File "/home/seungjaeryanlee/git/agents/tf_agents/environments/parallel_py_environment.py", line 135, in _step
    time_steps = [promise() for promise in time_steps]

  File "/home/seungjaeryanlee/git/agents/tf_agents/environments/parallel_py_environment.py", line 135, in <listcomp>
    time_steps = [promise() for promise in time_steps]

  File "/home/seungjaeryanlee/git/agents/tf_agents/environments/parallel_py_environment.py", line 337, in _receive
    raise Exception(stacktrace)

Exception: Traceback (most recent call last):
  File "/home/seungjaeryanlee/git/agents/tf_agents/environments/parallel_py_environment.py", line 376, in _worker
    result = getattr(env, name)(*args, **kwargs)
  File "/home/seungjaeryanlee/git/agents/tf_agents/environments/py_environment.py", line 174, in step
    self._current_time_step = self._step(action)
  File "/home/seungjaeryanlee/git/agents/tf_agents/environments/atari_wrappers.py", line 86, in _step
    time_step = self._env.step(action)
  File "/home/seungjaeryanlee/git/agents/tf_agents/environments/py_environment.py", line 174, in step
    self._current_time_step = self._step(action)
  File "/home/seungjaeryanlee/git/agents/tf_agents/environments/gym_wrapper.py", line 178, in _step
    observation, reward, self._done, self._info = self._gym_env.step(action)
  File "/home/seungjaeryanlee/git/agents/tf_agents/environments/atari_wrappers.py", line 57, in step
    observation, reward, done, info = self._env.step(action)
  File "/home/seungjaeryanlee/git/agents/tf_agents/environments/atari_preprocessing.py", line 146, in step
    _, reward, game_over, info = self.env.step(action)
  File "/home/seungjaeryanlee/anaconda3/envs/gsoc/lib/python3.6/site-packages/gym/envs/atari/atari_env.py", line 113, in step
    action = self._action_set[a]
IndexError: index 18 is out of bounds for axis 0 with size 18

         [[{{node driver_loop/body/_1/step/step_py_func}}]] [Op:__inference_run_44015]

Function call stack:
run

  In call to configurable 'train_eval' (<function train_eval at 0x7fcde7d1f7b8>)
seungjaeryanlee / agents

Action out of bound when running PPO on Atari #16