YCG09 / chinese_ocr

CTPN + DenseNet + CTC based end-to-end Chinese OCR implemented using tensorflow and keras
Apache License 2.0
2.74k stars 1.08k forks source link

加快訓練不定長圖片的速度 #327

Open kellylin841015 opened 4 years ago

kellylin841015 commented 4 years ago

我想訓練不定長圖片 我目前是batch size設為1才能夠執行 但這樣我的訓練速度明顯變慢 想請問有沒有人有其他辦法?

Husiolois commented 4 years ago

一个不成熟的建议: 同一个batch里数据等长处理,拉伸或者padding都可以尝试,不同的batch之间的数据可以需要等长

kellylin841015 commented 4 years ago

我嘗試padding是可以訓練的,非常感謝,看起來字典裡的'卍'字應該是用來當作填充字符