ilovin / lstm_ctc_ocr

Use CTC + tensorflow to OCR
https://ilovin.github.io/2017-04-06/tensorflow-lstm-ctc-ocr/
354 stars 140 forks source link

time_steps.append(nw//cfg.POOL_SCALE+cfg.OFFSET_TIME_STEP) #56

Closed SolinTao closed 5 years ago

SolinTao commented 5 years ago

time_steps.append(nw//cfg.POOL_SCALE+cfg.OFFSET_TIME_STEP) max_w = math.ceil(max_w/cfg.POOL_SCALE)*cfg.POOL_SCALE

你好,请问这两句是什么意思呢?为什么不是w呢?

ilovin commented 5 years ago
  1. conv's padding : 'valid',所以加了一个offset(lib/networks/LSTM_train.py)
  2. 这应该是用来生成一个batch数据的,所以需要得到一个batch里的最大长度,将所有的img padding到同一大小。同时保证了该长度可以被POOL_SCALE整除