YCG09 / chinese_ocr

CTPN + DenseNet + CTC based end-to-end Chinese OCR implemented using tensorflow and keras
Apache License 2.0
2.74k stars 1.08k forks source link

花了很久時間,但Loss降不下去 #287

Open kellylin841015 opened 5 years ago

kellylin841015 commented 5 years ago

大家好,我目前是使用跟博主產生數據集相似,做傾斜、fit、不同字型、以及灰度的繁體字圖片,數據為4800字,主要產生於wiki文件、連續數字、地址、隨機文字,產生長度固定為10個字,目前我steps_per_epoch = 1000000,產生300萬張圖片訓練 設備是TITAN Xp (12G) 其他地方沒有更動,可是我已經訓練了5天以上了,loss下降的非常慢,且accuracy一直停留在67%左右,大概已經有9小時左右(10個epoch左右),訓練都沒有再進步了 但我使用10萬筆數據集,在空白背景是有不錯效果的,請問這是欠擬合,需要加深層數嗎? 想請問一下大家的意見,如果有描述不清楚的地方可以再補充 p.s.有沒有訓練得很成功的朋友,可以提供給我一些訓練數量,訓練時間與設備的參考,因為我對要訓練多久目前很不確定

jjl001 commented 5 years ago

先用博主的数据集试试?

kellylin841015 commented 5 years ago

加深網路後解決了感謝 應該是欠擬合

praymich commented 4 years ago

想问一下大概是如何加深网络的啊?是直接添加卷积层吗

kellylin841015 commented 4 years ago

按照DenseNets論文結構適當的加深,你也可以試試看先加深卷積就好