https://www.bilibili.com/video/BV1FV41177dR
actor.py:指针网络建立、训练过程 config.py:各参数配置 critic.py:评论家网络 dataset.py:生成训练样本 decoder.py:解码器解码过程 main.py:程序入口、结果展示
python 3.7
tensorflow-gpu 1.0.0
numpy
matplotlib
tqdm