Problem on text detection finetuning - English

kevinzezel commented 3 months ago

问题描述 / Problem Description

Hi,

Which .yml file should I use to perform text detection finetuning in English?

ch_PP-OCRv3_det_cml.yml
ch_PP-OCRv3_det_dml.yml
ch_PP-OCRv3_det_student.yml

ch_PP-OCRv4_det_cml.yml
ch_PP-OCRv4_det_student.yml
ch_PP-OCRv4_det_teacher.yml

And which pretrained model should I start to do the finetuning in English?

I tried using the template ch_PP-OCRv3_det_student.yml and pre trained model en_PP-OCRv3_det_distill_train/student.pdparams. However, the loss error never drops with each iteration, it is always fixed at 1.

运行环境 / Runtime Environment

OS: Linux Ubuntu 22.04
Paddle: 2.6.0
PaddleOCR: 2.7.3

复现代码 / Reproduction Code

python3 /root/paddle/PaddleOCR/tools/train.py -c /root/src/ch_PP-OCRv3_det_student.yml

完整报错 / Complete Error Message


[2024/06/22 06:26:56] ppocr INFO: Architecture : 
[2024/06/22 06:26:56] ppocr INFO:     Backbone : 
[2024/06/22 06:26:56] ppocr INFO:         disable_se : True
[2024/06/22 06:26:56] ppocr INFO:         model_name : large
[2024/06/22 06:26:56] ppocr INFO:         name : MobileNetV3
[2024/06/22 06:26:56] ppocr INFO:         scale : 0.5
[2024/06/22 06:26:56] ppocr INFO:     Head : 
[2024/06/22 06:26:56] ppocr INFO:         k : 50
[2024/06/22 06:26:56] ppocr INFO:         name : DBHead
[2024/06/22 06:26:56] ppocr INFO:     Neck : 
[2024/06/22 06:26:56] ppocr INFO:         name : RSEFPN
[2024/06/22 06:26:56] ppocr INFO:         out_channels : 96
[2024/06/22 06:26:56] ppocr INFO:         shortcut : True
[2024/06/22 06:26:56] ppocr INFO:     Transform : None
[2024/06/22 06:26:56] ppocr INFO:     algorithm : DB
[2024/06/22 06:26:56] ppocr INFO:     model_type : det
[2024/06/22 06:26:56] ppocr INFO: Eval : 
[2024/06/22 06:26:56] ppocr INFO:     dataset : 
[2024/06/22 06:26:56] ppocr INFO:         data_dir : /root/train_dataset/v2-det/imgs/Val
[2024/06/22 06:26:56] ppocr INFO:         label_file_list : ['/root/train_dataset/v2-det/imgs/Val.txt']
[2024/06/22 06:26:56] ppocr INFO:         name : SimpleDataSet
[2024/06/22 06:26:56] ppocr INFO:         transforms : 
[2024/06/22 06:26:56] ppocr INFO:             DecodeImage : 
[2024/06/22 06:26:56] ppocr INFO:                 channel_first : False
[2024/06/22 06:26:56] ppocr INFO:                 img_mode : BGR
[2024/06/22 06:26:56] ppocr INFO:             DetLabelEncode : None
[2024/06/22 06:26:56] ppocr INFO:             DetResizeForTest : None
[2024/06/22 06:26:56] ppocr INFO:             NormalizeImage : 
[2024/06/22 06:26:56] ppocr INFO:                 mean : [0.485, 0.456, 0.406]
[2024/06/22 06:26:56] ppocr INFO:                 order : hwc
[2024/06/22 06:26:56] ppocr INFO:                 scale : 1./255.
[2024/06/22 06:26:56] ppocr INFO:                 std : [0.229, 0.224, 0.225]
[2024/06/22 06:26:56] ppocr INFO:             ToCHWImage : None
[2024/06/22 06:26:56] ppocr INFO:             KeepKeys : 
[2024/06/22 06:26:56] ppocr INFO:                 keep_keys : ['image', 'shape', 'polys', 'ignore_tags']
[2024/06/22 06:26:56] ppocr INFO:     loader : 
[2024/06/22 06:26:56] ppocr INFO:         batch_size_per_card : 1
[2024/06/22 06:26:56] ppocr INFO:         drop_last : False
[2024/06/22 06:26:56] ppocr INFO:         num_workers : 1
[2024/06/22 06:26:56] ppocr INFO:         shuffle : False
[2024/06/22 06:26:56] ppocr INFO: Global : 
[2024/06/22 06:26:56] ppocr INFO:     cal_metric_during_train : False
[2024/06/22 06:26:56] ppocr INFO:     checkpoints : None
[2024/06/22 06:26:56] ppocr INFO:     debug : False
[2024/06/22 06:26:56] ppocr INFO:     distributed : False
[2024/06/22 06:26:56] ppocr INFO:     epoch_num : 500
[2024/06/22 06:26:56] ppocr INFO:     eval_batch_step : [0, 400]
[2024/06/22 06:26:56] ppocr INFO:     infer_img : /root/paddle/PaddleOCR/doc/imgs_words/ch/word_1.jpg
[2024/06/22 06:26:56] ppocr INFO:     log_smooth_window : 20
[2024/06/22 06:26:56] ppocr INFO:     pretrained_model : /root/src/pretrain_models/en_PP-OCRv3_det_distill_train/student.pdparams
[2024/06/22 06:26:56] ppocr INFO:     print_batch_step : 10
[2024/06/22 06:26:56] ppocr INFO:     save_epoch_step : 100
[2024/06/22 06:26:56] ppocr INFO:     save_inference_dir : None
[2024/06/22 06:26:56] ppocr INFO:     save_model_dir : ./output/det_ppocr_v3_Train_v2
[2024/06/22 06:26:56] ppocr INFO:     save_res_path : ./output/det/predicts_ppocrv3_Train_v2.txt
[2024/06/22 06:26:56] ppocr INFO:     use_gpu : True
[2024/06/22 06:26:56] ppocr INFO:     use_visualdl : False
[2024/06/22 06:26:56] ppocr INFO: Loss : 
[2024/06/22 06:26:56] ppocr INFO:     alpha : 5
[2024/06/22 06:26:56] ppocr INFO:     balance_loss : True
[2024/06/22 06:26:56] ppocr INFO:     beta : 10
[2024/06/22 06:26:56] ppocr INFO:     main_loss_type : DiceLoss
[2024/06/22 06:26:56] ppocr INFO:     name : DBLoss
[2024/06/22 06:26:56] ppocr INFO:     ohem_ratio : 3
[2024/06/22 06:26:56] ppocr INFO: Metric : 
[2024/06/22 06:26:56] ppocr INFO:     main_indicator : hmean
[2024/06/22 06:26:56] ppocr INFO:     name : DetMetric
[2024/06/22 06:26:56] ppocr INFO: Optimizer : 
[2024/06/22 06:26:56] ppocr INFO:     beta1 : 0.9
[2024/06/22 06:26:56] ppocr INFO:     beta2 : 0.999
[2024/06/22 06:26:56] ppocr INFO:     lr : 
[2024/06/22 06:26:56] ppocr INFO:         learning_rate : 0.0001
[2024/06/22 06:26:56] ppocr INFO:         name : Cosine
[2024/06/22 06:26:56] ppocr INFO:         warmup_epoch : 2
[2024/06/22 06:26:56] ppocr INFO:     name : Adam
[2024/06/22 06:26:56] ppocr INFO:     regularizer : 
[2024/06/22 06:26:56] ppocr INFO:         factor : 0
[2024/06/22 06:26:56] ppocr INFO:         name : L2
[2024/06/22 06:26:56] ppocr INFO: PostProcess : 
[2024/06/22 06:26:56] ppocr INFO:     box_thresh : 0.6
[2024/06/22 06:26:56] ppocr INFO:     max_candidates : 1000
[2024/06/22 06:26:56] ppocr INFO:     name : DBPostProcess
[2024/06/22 06:26:56] ppocr INFO:     thresh : 0.3
[2024/06/22 06:26:56] ppocr INFO:     unclip_ratio : 1.5
[2024/06/22 06:26:56] ppocr INFO: Train : 
[2024/06/22 06:26:56] ppocr INFO:     dataset : 
[2024/06/22 06:26:56] ppocr INFO:         data_dir : /root/train_dataset/v2-det/imgs/Train
[2024/06/22 06:26:56] ppocr INFO:         label_file_list : ['/root/train_dataset/v2-det/imgs/Train.txt']
[2024/06/22 06:26:56] ppocr INFO:         name : SimpleDataSet
[2024/06/22 06:26:56] ppocr INFO:         ratio_list : [1.0]
[2024/06/22 06:26:56] ppocr INFO:         transforms : 
[2024/06/22 06:26:56] ppocr INFO:             DecodeImage : 
[2024/06/22 06:26:56] ppocr INFO:                 channel_first : False
[2024/06/22 06:26:56] ppocr INFO:                 img_mode : BGR
[2024/06/22 06:26:56] ppocr INFO:             DetLabelEncode : None
[2024/06/22 06:26:56] ppocr INFO:             IaaAugment : 
[2024/06/22 06:26:56] ppocr INFO:                 augmenter_args : 
[2024/06/22 06:26:56] ppocr INFO:                     args : 
[2024/06/22 06:26:56] ppocr INFO:                         p : 0.5
[2024/06/22 06:26:56] ppocr INFO:                     type : Fliplr
[2024/06/22 06:26:56] ppocr INFO:                     args : 
[2024/06/22 06:26:56] ppocr INFO:                         rotate : [-10, 10]
[2024/06/22 06:26:56] ppocr INFO:                     type : Affine
[2024/06/22 06:26:56] ppocr INFO:                     args : 
[2024/06/22 06:26:56] ppocr INFO:                         size : [0.5, 3]
[2024/06/22 06:26:56] ppocr INFO:                     type : Resize
[2024/06/22 06:26:56] ppocr INFO:             EastRandomCropData : 
[2024/06/22 06:26:56] ppocr INFO:                 keep_ratio : True
[2024/06/22 06:26:56] ppocr INFO:                 max_tries : 50
[2024/06/22 06:26:56] ppocr INFO:                 size : [960, 960]
[2024/06/22 06:26:56] ppocr INFO:             MakeBorderMap : 
[2024/06/22 06:26:56] ppocr INFO:                 shrink_ratio : 0.4
[2024/06/22 06:26:56] ppocr INFO:                 thresh_max : 0.7
[2024/06/22 06:26:56] ppocr INFO:                 thresh_min : 0.3
[2024/06/22 06:26:56] ppocr INFO:             MakeShrinkMap : 
[2024/06/22 06:26:56] ppocr INFO:                 min_text_size : 8
[2024/06/22 06:26:56] ppocr INFO:                 shrink_ratio : 0.4
[2024/06/22 06:26:56] ppocr INFO:             NormalizeImage : 
[2024/06/22 06:26:56] ppocr INFO:                 mean : [0.485, 0.456, 0.406]
[2024/06/22 06:26:56] ppocr INFO:                 order : hwc
[2024/06/22 06:26:56] ppocr INFO:                 scale : 1./255.
[2024/06/22 06:26:56] ppocr INFO:                 std : [0.229, 0.224, 0.225]
[2024/06/22 06:26:56] ppocr INFO:             ToCHWImage : None
[2024/06/22 06:26:56] ppocr INFO:             KeepKeys : 
[2024/06/22 06:26:56] ppocr INFO:                 keep_keys : ['image', 'threshold_map', 'threshold_mask', 'shrink_map', 'shrink_mask']
[2024/06/22 06:26:56] ppocr INFO:     loader : 
[2024/06/22 06:26:56] ppocr INFO:         batch_size_per_card : 8
[2024/06/22 06:26:56] ppocr INFO:         drop_last : False
[2024/06/22 06:26:56] ppocr INFO:         num_workers : 1
[2024/06/22 06:26:56] ppocr INFO:         shuffle : True
[2024/06/22 06:26:56] ppocr INFO: profiler_options : None
[2024/06/22 06:26:56] ppocr INFO: train with paddle 2.6.0 and device Place(gpu:0)
[2024/06/22 06:26:56] ppocr INFO: Initialize indexs of datasets:['/root/train_dataset/v2-det/imgs/Train.txt']
[2024/06/22 06:26:56] ppocr INFO: Initialize indexs of datasets:['/root/train_dataset/v2-det/imgs/Val.txt']
[2024/06/22 06:26:57] ppocr INFO: train dataloader has 43 iters
[2024/06/22 06:26:57] ppocr INFO: valid dataloader has 35 iters
[2024/06/22 06:26:57] ppocr INFO: load pretrain successful from /root/src/pretrain_models/en_PP-OCRv3_det_distill_train/student
[2024/06/22 06:26:57] ppocr INFO: During the training process, after the 0th iteration, an evaluation is run every 400 iterations
[2024/06/22 06:27:02] ppocr INFO: epoch: [1/500], global_step: 10, lr: 0.000005, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.34768 s, avg_batch_cost: 0.48897 s, avg_samples: 8.0, ips: 16.36105 samples/s, eta: 2:55:07, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:27:07] ppocr INFO: epoch: [1/500], global_step: 20, lr: 0.000011, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.39644 s, avg_batch_cost: 0.47503 s, avg_samples: 8.0, ips: 16.84097 samples/s, eta: 2:52:33, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:27:12] ppocr INFO: epoch: [1/500], global_step: 30, lr: 0.000023, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.39779 s, avg_batch_cost: 0.47222 s, avg_samples: 8.0, ips: 16.94117 samples/s, eta: 2:51:18, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:27:17] ppocr INFO: epoch: [1/500], global_step: 40, lr: 0.000034, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.38268 s, avg_batch_cost: 0.45703 s, avg_samples: 8.0, ips: 17.50420 samples/s, eta: 2:49:17, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:27:18] ppocr INFO: epoch: [1/500], global_step: 43, lr: 0.000038, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.07223 s, avg_batch_cost: 0.09504 s, avg_samples: 1.7, ips: 17.88766 samples/s, eta: 2:45:21, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:27:18] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:27:22] ppocr INFO: epoch: [2/500], global_step: 50, lr: 0.000046, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.30681 s, avg_batch_cost: 0.36121 s, avg_samples: 5.6, ips: 15.50328 samples/s, eta: 2:47:59, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:27:27] ppocr INFO: epoch: [2/500], global_step: 60, lr: 0.000058, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.41076 s, avg_batch_cost: 0.48654 s, avg_samples: 8.0, ips: 16.44258 samples/s, eta: 2:48:54, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:27:33] ppocr INFO: epoch: [2/500], global_step: 70, lr: 0.000069, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.41125 s, avg_batch_cost: 0.48567 s, avg_samples: 8.0, ips: 16.47198 samples/s, eta: 2:49:29, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:27:38] ppocr INFO: epoch: [2/500], global_step: 80, lr: 0.000081, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.38905 s, avg_batch_cost: 0.46356 s, avg_samples: 8.0, ips: 17.25771 samples/s, eta: 2:48:55, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:27:41] ppocr INFO: epoch: [2/500], global_step: 86, lr: 0.000088, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.20185 s, avg_batch_cost: 0.24275 s, avg_samples: 4.1, ips: 16.88992 samples/s, eta: 2:47:09, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:27:41] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:27:43] ppocr INFO: epoch: [3/500], global_step: 90, lr: 0.000092, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.20462 s, avg_batch_cost: 0.23697 s, avg_samples: 3.2, ips: 13.50378 samples/s, eta: 2:49:05, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:27:48] ppocr INFO: epoch: [3/500], global_step: 100, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.36509 s, avg_batch_cost: 0.43948 s, avg_samples: 8.0, ips: 18.20325 samples/s, eta: 2:47:47, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:27:53] ppocr INFO: epoch: [3/500], global_step: 110, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.42108 s, avg_batch_cost: 0.49870 s, avg_samples: 8.0, ips: 16.04167 samples/s, eta: 2:48:37, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:27:59] ppocr INFO: epoch: [3/500], global_step: 120, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.41669 s, avg_batch_cost: 0.49111 s, avg_samples: 8.0, ips: 16.28949 samples/s, eta: 2:49:05, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:03] ppocr INFO: epoch: [3/500], global_step: 129, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.33289 s, avg_batch_cost: 0.39617 s, avg_samples: 6.5, ips: 16.40697 samples/s, eta: 2:48:09, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:03] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:28:04] ppocr INFO: epoch: [4/500], global_step: 130, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.08027 s, avg_batch_cost: 0.08785 s, avg_samples: 0.8, ips: 9.10618 samples/s, eta: 2:49:16, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:09] ppocr INFO: epoch: [4/500], global_step: 140, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.38438 s, avg_batch_cost: 0.45876 s, avg_samples: 8.0, ips: 17.43813 samples/s, eta: 2:48:46, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:14] ppocr INFO: epoch: [4/500], global_step: 150, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.40133 s, avg_batch_cost: 0.47572 s, avg_samples: 8.0, ips: 16.81673 samples/s, eta: 2:48:43, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:19] ppocr INFO: epoch: [4/500], global_step: 160, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.42255 s, avg_batch_cost: 0.49692 s, avg_samples: 8.0, ips: 16.09902 samples/s, eta: 2:49:09, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:25] ppocr INFO: epoch: [4/500], global_step: 170, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.42679 s, avg_batch_cost: 0.50122 s, avg_samples: 8.0, ips: 15.96111 samples/s, eta: 2:49:36, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:25] ppocr INFO: epoch: [4/500], global_step: 172, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.04024 s, avg_batch_cost: 0.05132 s, avg_samples: 0.9, ips: 17.53771 samples/s, eta: 2:48:41, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:26] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:28:30] ppocr INFO: epoch: [5/500], global_step: 180, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.35601 s, avg_batch_cost: 0.41762 s, avg_samples: 6.4, ips: 15.32489 samples/s, eta: 2:49:22, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:36] ppocr INFO: epoch: [5/500], global_step: 190, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.43728 s, avg_batch_cost: 0.51183 s, avg_samples: 8.0, ips: 15.63033 samples/s, eta: 2:49:57, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:41] ppocr INFO: epoch: [5/500], global_step: 200, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.43455 s, avg_batch_cost: 0.51277 s, avg_samples: 8.0, ips: 15.60145 samples/s, eta: 2:50:28, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:47] ppocr INFO: epoch: [5/500], global_step: 210, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.44282 s, avg_batch_cost: 0.51930 s, avg_samples: 8.0, ips: 15.40533 samples/s, eta: 2:51:03, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:49] ppocr INFO: epoch: [5/500], global_step: 215, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.17145 s, avg_batch_cost: 0.20484 s, avg_samples: 3.3, ips: 16.11017 samples/s, eta: 2:50:25, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:49] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:28:52] ppocr INFO: epoch: [6/500], global_step: 220, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.23835 s, avg_batch_cost: 0.28041 s, avg_samples: 4.0, ips: 14.26505 samples/s, eta: 2:51:01, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:28:57] ppocr INFO: epoch: [6/500], global_step: 230, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.40337 s, avg_batch_cost: 0.47782 s, avg_samples: 8.0, ips: 16.74257 samples/s, eta: 2:50:52, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:02] ppocr INFO: epoch: [6/500], global_step: 240, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.41576 s, avg_batch_cost: 0.49029 s, avg_samples: 8.0, ips: 16.31689 samples/s, eta: 2:50:55, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:08] ppocr INFO: epoch: [6/500], global_step: 250, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.43906 s, avg_batch_cost: 0.51352 s, avg_samples: 8.0, ips: 15.57863 samples/s, eta: 2:51:17, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:12] ppocr INFO: epoch: [6/500], global_step: 258, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.30602 s, avg_batch_cost: 0.36205 s, avg_samples: 5.7, ips: 15.74365 samples/s, eta: 2:50:52, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:12] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:29:13] ppocr INFO: epoch: [7/500], global_step: 260, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.12012 s, avg_batch_cost: 0.13509 s, avg_samples: 1.6, ips: 11.84384 samples/s, eta: 2:51:23, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:18] ppocr INFO: epoch: [7/500], global_step: 270, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.38890 s, avg_batch_cost: 0.46347 s, avg_samples: 8.0, ips: 17.26097 samples/s, eta: 2:51:02, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:24] ppocr INFO: epoch: [7/500], global_step: 280, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.39936 s, avg_batch_cost: 0.47382 s, avg_samples: 8.0, ips: 16.88411 samples/s, eta: 2:50:50, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:29] ppocr INFO: epoch: [7/500], global_step: 290, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.42865 s, avg_batch_cost: 0.50305 s, avg_samples: 8.0, ips: 15.90287 samples/s, eta: 2:50:59, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:35] ppocr INFO: epoch: [7/500], global_step: 300, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.42037 s, avg_batch_cost: 0.49480 s, avg_samples: 8.0, ips: 16.16810 samples/s, eta: 2:51:02, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:35] ppocr INFO: epoch: [7/500], global_step: 301, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.00001 s, avg_batch_cost: 0.00379 s, avg_samples: 0.1, ips: 26.39056 samples/s, eta: 2:50:30, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:35] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:29:39] ppocr INFO: epoch: [8/500], global_step: 310, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.38395 s, avg_batch_cost: 0.45104 s, avg_samples: 7.2, ips: 15.96314 samples/s, eta: 2:50:38, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:45] ppocr INFO: epoch: [8/500], global_step: 320, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.43605 s, avg_batch_cost: 0.51049 s, avg_samples: 8.0, ips: 15.67126 samples/s, eta: 2:50:51, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:50] ppocr INFO: epoch: [8/500], global_step: 330, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.39944 s, avg_batch_cost: 0.47387 s, avg_samples: 8.0, ips: 16.88242 samples/s, eta: 2:50:39, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:56] ppocr INFO: epoch: [8/500], global_step: 340, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.43197 s, avg_batch_cost: 0.50641 s, avg_samples: 8.0, ips: 15.79739 samples/s, eta: 2:50:49, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:57] ppocr INFO: epoch: [8/500], global_step: 344, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.12975 s, avg_batch_cost: 0.15587 s, avg_samples: 2.5, ips: 16.03918 samples/s, eta: 2:50:24, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:29:58] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:30:01] ppocr INFO: epoch: [9/500], global_step: 350, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.27500 s, avg_batch_cost: 0.32360 s, avg_samples: 4.8, ips: 14.83310 samples/s, eta: 2:50:41, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:30:06] ppocr INFO: epoch: [9/500], global_step: 360, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.41272 s, avg_batch_cost: 0.48817 s, avg_samples: 8.0, ips: 16.38778 samples/s, eta: 2:50:38, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:30:11] ppocr INFO: epoch: [9/500], global_step: 370, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.41834 s, avg_batch_cost: 0.49279 s, avg_samples: 8.0, ips: 16.23414 samples/s, eta: 2:50:38, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:30:17] ppocr INFO: epoch: [9/500], global_step: 380, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.42939 s, avg_batch_cost: 0.50383 s, avg_samples: 8.0, ips: 15.87828 samples/s, eta: 2:50:44, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:30:20] ppocr INFO: epoch: [9/500], global_step: 387, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.25607 s, avg_batch_cost: 0.30456 s, avg_samples: 4.9, ips: 16.08889 samples/s, eta: 2:50:22, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:30:20] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:30:22] ppocr INFO: epoch: [10/500], global_step: 390, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.16360 s, avg_batch_cost: 0.18603 s, avg_samples: 2.4, ips: 12.90141 samples/s, eta: 2:50:42, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:30:27] ppocr INFO: epoch: [10/500], global_step: 400, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.37831 s, avg_batch_cost: 0.45275 s, avg_samples: 8.0, ips: 17.66979 samples/s, eta: 2:50:20, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:30:29] ppocr INFO: cur metric, precision: 0.0, recall: 0.0, hmean: 0, fps: 48.435995970723404
[2024/06/22 06:30:29] ppocr INFO: save best model is to ./output/det_ppocr_v3_Train_v2/best_accuracy
[2024/06/22 06:30:29] ppocr INFO: best metric, hmean: 0, is_float16: False, precision: 0.0, recall: 0.0, fps: 48.435995970723404, best_epoch: 10
[2024/06/22 06:30:34] ppocr INFO: epoch: [10/500], global_step: 410, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.30762 s, avg_batch_cost: 0.38676 s, avg_samples: 8.0, ips: 20.68471 samples/s, eta: 2:49:25, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:30:39] ppocr INFO: epoch: [10/500], global_step: 420, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.40879 s, avg_batch_cost: 0.48333 s, avg_samples: 8.0, ips: 16.55187 samples/s, eta: 2:49:21, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:30:44] ppocr INFO: epoch: [10/500], global_step: 430, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.37490 s, avg_batch_cost: 0.44570 s, avg_samples: 7.3, ips: 16.37890 samples/s, eta: 2:48:59, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:30:44] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:30:50] ppocr INFO: epoch: [11/500], global_step: 440, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.44996 s, avg_batch_cost: 0.52447 s, avg_samples: 8.0, ips: 15.25356 samples/s, eta: 2:49:14, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:30:55] ppocr INFO: epoch: [11/500], global_step: 450, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.42454 s, avg_batch_cost: 0.49903 s, avg_samples: 8.0, ips: 16.03112 samples/s, eta: 2:49:17, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:00] ppocr INFO: epoch: [11/500], global_step: 460, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.40045 s, avg_batch_cost: 0.47485 s, avg_samples: 8.0, ips: 16.84755 samples/s, eta: 2:49:09, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:05] ppocr INFO: epoch: [11/500], global_step: 470, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.40107 s, avg_batch_cost: 0.47551 s, avg_samples: 8.0, ips: 16.82411 samples/s, eta: 2:49:01, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:06] ppocr INFO: epoch: [11/500], global_step: 473, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.08019 s, avg_batch_cost: 0.09883 s, avg_samples: 1.7, ips: 17.20212 samples/s, eta: 2:48:39, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:07] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:31:10] ppocr INFO: epoch: [12/500], global_step: 480, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.31967 s, avg_batch_cost: 0.37189 s, avg_samples: 5.6, ips: 15.05816 samples/s, eta: 2:48:51, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:16] ppocr INFO: epoch: [12/500], global_step: 490, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.42436 s, avg_batch_cost: 0.49883 s, avg_samples: 8.0, ips: 16.03742 samples/s, eta: 2:48:54, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:21] ppocr INFO: epoch: [12/500], global_step: 500, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.41772 s, avg_batch_cost: 0.49215 s, avg_samples: 8.0, ips: 16.25505 samples/s, eta: 2:48:53, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:27] ppocr INFO: epoch: [12/500], global_step: 510, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.43064 s, avg_batch_cost: 0.50504 s, avg_samples: 8.0, ips: 15.84043 samples/s, eta: 2:48:57, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:29] ppocr INFO: epoch: [12/500], global_step: 516, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.21525 s, avg_batch_cost: 0.25622 s, avg_samples: 4.1, ips: 16.00165 samples/s, eta: 2:48:41, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:30] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:31:32] ppocr INFO: epoch: [13/500], global_step: 520, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.20061 s, avg_batch_cost: 0.23046 s, avg_samples: 3.2, ips: 13.88521 samples/s, eta: 2:48:54, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:38] ppocr INFO: epoch: [13/500], global_step: 530, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.44634 s, avg_batch_cost: 0.52074 s, avg_samples: 8.0, ips: 15.36289 samples/s, eta: 2:49:04, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:43] ppocr INFO: epoch: [13/500], global_step: 540, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.44389 s, avg_batch_cost: 0.51834 s, avg_samples: 8.0, ips: 15.43403 samples/s, eta: 2:49:13, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:49] ppocr INFO: epoch: [13/500], global_step: 550, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.44498 s, avg_batch_cost: 0.51935 s, avg_samples: 8.0, ips: 15.40390 samples/s, eta: 2:49:21, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:53] ppocr INFO: epoch: [13/500], global_step: 559, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.35373 s, avg_batch_cost: 0.41698 s, avg_samples: 6.5, ips: 15.58840 samples/s, eta: 2:49:10, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:31:54] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:31:54] ppocr INFO: epoch: [14/500], global_step: 560, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.08543 s, avg_batch_cost: 0.09292 s, avg_samples: 0.8, ips: 8.60911 samples/s, eta: 2:49:26, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:32:00] ppocr INFO: epoch: [14/500], global_step: 570, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.41791 s, avg_batch_cost: 0.49197 s, avg_samples: 8.0, ips: 16.26106 samples/s, eta: 2:49:23, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:32:06] ppocr INFO: epoch: [14/500], global_step: 580, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.46274 s, avg_batch_cost: 0.53683 s, avg_samples: 8.0, ips: 14.90226 samples/s, eta: 2:49:37, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:32:11] ppocr INFO: epoch: [14/500], global_step: 590, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.45967 s, avg_batch_cost: 0.53374 s, avg_samples: 8.0, ips: 14.98843 samples/s, eta: 2:49:49, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:32:17] ppocr INFO: epoch: [14/500], global_step: 600, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.45993 s, avg_batch_cost: 0.53398 s, avg_samples: 8.0, ips: 14.98173 samples/s, eta: 2:50:00, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:32:18] ppocr INFO: epoch: [14/500], global_step: 602, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.04572 s, avg_batch_cost: 0.05686 s, avg_samples: 0.9, ips: 15.82706 samples/s, eta: 2:49:45, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:32:18] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:32:22] ppocr INFO: epoch: [15/500], global_step: 610, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.35790 s, avg_batch_cost: 0.41979 s, avg_samples: 6.4, ips: 15.24568 samples/s, eta: 2:49:51, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:32:28] ppocr INFO: epoch: [15/500], global_step: 620, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.43742 s, avg_batch_cost: 0.51177 s, avg_samples: 8.0, ips: 15.63187 samples/s, eta: 2:49:54, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:32:33] ppocr INFO: epoch: [15/500], global_step: 630, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.44167 s, avg_batch_cost: 0.51603 s, avg_samples: 8.0, ips: 15.50308 samples/s, eta: 2:49:59, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:32:39] ppocr INFO: epoch: [15/500], global_step: 640, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.44321 s, avg_batch_cost: 0.51760 s, avg_samples: 8.0, ips: 15.45605 samples/s, eta: 2:50:03, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:32:41] ppocr INFO: epoch: [15/500], global_step: 645, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.17530 s, avg_batch_cost: 0.20879 s, avg_samples: 3.3, ips: 15.80545 samples/s, eta: 2:49:49, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:32:41] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:32:44] ppocr INFO: epoch: [16/500], global_step: 650, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.23683 s, avg_batch_cost: 0.27411 s, avg_samples: 4.0, ips: 14.59265 samples/s, eta: 2:49:56, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:32:50] ppocr INFO: epoch: [16/500], global_step: 660, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.44583 s, avg_batch_cost: 0.52017 s, avg_samples: 8.0, ips: 15.37948 samples/s, eta: 2:50:01, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:32:55] ppocr INFO: epoch: [16/500], global_step: 670, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.44358 s, avg_batch_cost: 0.51792 s, avg_samples: 8.0, ips: 15.44651 samples/s, eta: 2:50:05, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:33:01] ppocr INFO: epoch: [16/500], global_step: 680, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.46145 s, avg_batch_cost: 0.54205 s, avg_samples: 8.0, ips: 14.75873 samples/s, eta: 2:50:16, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:33:05] ppocr INFO: epoch: [16/500], global_step: 688, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.30465 s, avg_batch_cost: 0.36261 s, avg_samples: 5.7, ips: 15.71925 samples/s, eta: 2:50:03, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:33:05] ppocr INFO: save model in ./output/det_ppocr_v3_Train_v2/latest
[2024/06/22 06:33:07] ppocr INFO: epoch: [17/500], global_step: 690, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.12019 s, avg_batch_cost: 0.13513 s, avg_samples: 1.6, ips: 11.84015 samples/s, eta: 2:50:14, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB
[2024/06/22 06:33:12] ppocr INFO: epoch: [17/500], global_step: 700, lr: 0.000100, loss: 1.000000, loss_shrink_maps: 0.000000, loss_threshold_maps: 0.000000, loss_binary_maps: 1.000000, loss_cbn: 0.000000, avg_reader_cost: 0.41169 s, avg_batch_cost: 0.48604 s, avg_samples: 8.0, ips: 16.45960 samples/s, eta: 2:50:07, max_mem_reserved: 6177 MB, max_mem_allocated: 5281 MB

tzktok commented 3 months ago

how to u annotate the datset..could u explain.. thx in advance @kevinzezel

GreatV commented 3 months ago

ch_ is used for Chinese, 'en_' is used for English

kevinzezel commented 3 months ago

@tzktok @GreatV Thanks for the quick response. Follow my files

Sample of Train.txt:

/root/train_dataset/v2-det/imgs/Train/d1ea1a2e6a3740048f5ea6d091b545c7.jpg  [{"transcription": "AZT7235", "points": [[87, 37], [163, 35], [163, 52], [88, 54]]}]
/root/train_dataset/v2-det/imgs/Train/00d537f64c814ddd832d5caaf78ffa16.jpg  [{"transcription": "AOZ4677", "points": [[101, 47], [183, 48], [183, 69], [100, 68]]}]
/root/train_dataset/v2-det/imgs/Train/65f2a95eee1a4ef987c20f697962444c.jpg  [{"transcription": "ARO2I68", "points": [[87, 34], [150, 35], [150, 50], [87, 49]]}]
/root/train_dataset/v2-det/imgs/Train/a2ad35b967cd4aad82639b71668ec0e5.jpg  [{"transcription": "FPZ8I83", "points": [[98, 42], [171, 42], [171, 58], [98, 58]]}]
/root/train_dataset/v2-det/imgs/Train/8433e07446b640d5be3604e446826662.jpg  [{"transcription": "ARN7E15", "points": [[92, 37], [162, 36], [163, 53], [92, 55]]}]
/root/train_dataset/v2-det/imgs/Train/401f5fefa5104fb391864d9107bc408d.jpg  [{"transcription": "HHK2374", "points": [[78, 38], [148, 40], [147, 55], [78, 54]]}]
/root/train_dataset/v2-det/imgs/Train/657a590260ab44eb857e44d0660c9b68.jpg  [{"transcription": "MHG", "points": [[129, 219], [175, 157], [203, 177], [157, 240]]}, {"transcription": "0131", "points": [[151, 246], [194, 182], [222, 201], [178, 265]]}]

Sample of Val.txt:

/root/train_dataset/v2-det/imgs/Val/9273322ce5d642e488233bef39bd7ab4.jpg    [{"transcription": "AYB2776", "points": [[83, 34], [155, 38], [155, 53], [83, 49]]}]
/root/train_dataset/v2-det/imgs/Val/96df43de1ec64905958169a1b55943f9.jpg    [{"transcription": "REE1491", "points": [[86, 33], [158, 35], [157, 52], [86, 50]]}]
/root/train_dataset/v2-det/imgs/Val/d37a0268537643e2821965ca692b41a5.jpg    [{"transcription": "RYU7068", "points": [[97, 71], [160, 88], [154, 111], [91, 94]]}]
/root/train_dataset/v2-det/imgs/Val/09fba0919dde4f8492b082e91fece609.jpg    [{"transcription": "ATX6I80", "points": [[94, 45], [168, 45], [168, 65], [94, 65]]}]

Sample of img dataset: Screenshot from 2024-06-22 15-42-25

Pretrained model: en_PP-OCRv3_det_distill_train/student.pdparams

ch_PP-OCRv3_det_student.yml

Global:
  debug: false
  use_gpu: true
  epoch_num: 500
  log_smooth_window: 20
  print_batch_step: 10
  save_model_dir: ./output/det_ppocr_v3_Train_v2
  save_epoch_step: 100
  eval_batch_step:
  - 0
  - 400
  cal_metric_during_train: false
  pretrained_model: /root/src/pretrain_models/en_PP-OCRv3_det_distill_train/student.pdparams
  checkpoints: null
  save_inference_dir: null
  use_visualdl: false
  infer_img: /root/paddle/PaddleOCR/doc/imgs_words/ch/word_1.jpg
  save_res_path: ./output/det/predicts_ppocrv3_Train_v2.txt
  distributed: true

Architecture:
  model_type: det
  algorithm: DB
  Transform:
  Backbone:
    name: MobileNetV3
    scale: 0.5
    model_name: large
    disable_se: True
  Neck:
    name: RSEFPN
    out_channels: 96
    shortcut: True
  Head:
    name: DBHead
    k: 50

Loss:
  name: DBLoss
  balance_loss: true
  main_loss_type: DiceLoss
  alpha: 5
  beta: 10
  ohem_ratio: 3
Optimizer:
  name: Adam
  beta1: 0.9
  beta2: 0.999
  lr:
    name: Cosine
    learning_rate: 0.0001
    warmup_epoch: 2
  regularizer:
    name: L2
    factor: 0
PostProcess:
  name: DBPostProcess
  thresh: 0.3
  box_thresh: 0.6
  max_candidates: 1000
  unclip_ratio: 1.5
Metric:
  name: DetMetric
  main_indicator: hmean
Train:
  dataset:
    name: SimpleDataSet
    data_dir: /root/train_dataset/v2-det/imgs/Train
    label_file_list:
    - /root/train_dataset/v2-det/imgs/Train.txt
    ratio_list: [1.0]
    transforms:
    - DecodeImage:
        img_mode: BGR
        channel_first: false
    - DetLabelEncode: null
    - IaaAugment:
        augmenter_args:
        - type: Fliplr
          args:
            p: 0.5
        - type: Affine
          args:
            rotate:
            - -10
            - 10
        - type: Resize
          args:
            size:
            - 0.5
            - 3
    - EastRandomCropData:
        size:
        - 960
        - 960
        max_tries: 50
        keep_ratio: true
    - MakeBorderMap:
        shrink_ratio: 0.4
        thresh_min: 0.3
        thresh_max: 0.7
    - MakeShrinkMap:
        shrink_ratio: 0.4
        min_text_size: 8
    - NormalizeImage:
        scale: 1./255.
        mean:
        - 0.485
        - 0.456
        - 0.406
        std:
        - 0.229
        - 0.224
        - 0.225
        order: hwc
    - ToCHWImage: null
    - KeepKeys:
        keep_keys:
        - image
        - threshold_map
        - threshold_mask
        - shrink_map
        - shrink_mask
  loader:
    shuffle: true
    drop_last: false
    batch_size_per_card: 8
    num_workers: 1
Eval:
  dataset:
    name: SimpleDataSet
    data_dir: /root/train_dataset/v2-det/imgs/Val
    label_file_list:
    - /root/train_dataset/v2-det/imgs/Val.txt
    transforms:
    - DecodeImage:
        img_mode: BGR
        channel_first: false
    - DetLabelEncode: null
    - DetResizeForTest: null
    - NormalizeImage:
        scale: 1./255.
        mean:
        - 0.485
        - 0.456
        - 0.406
        std:
        - 0.229
        - 0.224
        - 0.225
        order: hwc
    - ToCHWImage: null
    - KeepKeys:
        keep_keys:
        - image
        - shape
        - polys
        - ignore_tags
  loader:
    shuffle: false
    drop_last: false
    batch_size_per_card: 1
    num_workers: 1

PaddlePaddle / PaddleOCR