YCG09 / chinese_ocr

CTPN + DenseNet + CTC based end-to-end Chinese OCR implemented using tensorflow and keras
Apache License 2.0
2.76k stars 1.08k forks source link

只用來訓練數字時,不理想. #322

Open kaiyiuw opened 4 years ago

kaiyiuw commented 4 years ago

用訓練中文字同樣的方法,訓練數字,先試一下:

  1. dict 中只有 2\n 4\n
  2. GenerateDataFromString --> random 10 個 characters 在一張圖中,e.g. image 0: 2224244422 image 1: 2424424442 , etc.
    ... image 1199 共 1200 張
  3. Training class 就只有兩個 2 及 4

訓練時,acc 0.3~0.4 就提升不起來。 有調動過droprate, learnRate 都沒有明顯改善。

強行加入 weight 去運行Demo..... 有查看過ctpn result, 雖然不是很準確,但有找到數字的,只是到了test - recognitiion 時,就不準確了。

數字為什麼訓練不了?是圖片數量太少? 還是什麼沒注意好?

shining-love commented 4 years ago

用訓練中文字同樣的方法,訓練數字,先試一下:

dict 中只有 2\n 4\n GenerateDataFromString --> random 10 個 characters 在一張圖中,e.g. image 0: 2224244422 image 1: 2424424442 , etc. ... image 1199 共 1200 張 Training class 就只有兩個 2 及 4

訓練時,acc 0.3~0.4 就提升不起來。 有調動過droprate, learnRate 都沒有明顯改善。 強行加入 weight 去運行Demo..... 有查看過ctpn result, 雖然不是很準確,但有找到數字的,只是到了test - recognitiion 時,就不準確了。 數字為什麼訓練不了?是圖片數量太少? 還是什麼沒注意好?

你好,我现在也在训练数字。请问这种情况怎么回事?如何解决