JobSchedule

Implementation of paper "Research on Adaptive Job Shop Scheduling Problems Based on Dueling Double DQN" (论文复现)

运行

训练

python3 run_ddqn.py --output=../output_jobshop --dueling

测试

python3 run_ddqn.py --output=../output_jobshop --dueling --test

测试并生成图片

python3 run_ddqn.py --output=../output_jobshop --dueling --test --render --mode=img

该observation由3个channel组成, 包含: Processing time, Scheduling finish, 和 Machine Utilization. 三者的行表示 job，列表示 operation (有的文章也叫 task). 结合图5和图11来看:

Processing time: 初始化为每个operation所需的执行时长, 运行过程中, 取哪个operation出来, 就将位置的值置为0
Scheduling finish: 该任务执行完成时的时刻, 赋值时需要判断该operation前一个完成时间和该operation对应机器完成时间哪个比较长，取长的那个
Machine Utilization: 记录每个机器的利用率，注意这里为每个cell赋值时，值为该operation对应的机器的当前时间，而不是该operation之前的完成时刻

reward = 当前已完成所有operation的操作时间和/(机器数量*当前makespan)

测试时最低makespan可得到1040左右 (似乎比论文中展示的效果还要好些)