add max_memory_reserved for benchmark

训练benchmark 使用 API paddle.device.cuda.max_memory_reserved() 收集模型训练时的显存占用，因此本PR 修改 benchmark 打印日志部分，新增 max_mem_reserved max_mem_allocated 指标打印；如下： [11/21 15:37:17] ppdet.engine INFO: Epoch: [0] [ 110/3125] eta: 0:24:11 lr: 0.000000 loss_box: 0.256545 loss_cls: 0.059035 loss_obj: 0.247987 loss: 0.563567 batch_cost: 0.4402 data_cost: 0.0004 ips: 18.1718 images/s max_mem_reserved: 11613581568 max_mem_allocated: 10151881472

PaddlePaddle / PaddleYOLO

add max_memory_reserved for benchmark #202