yizt / keras-ctpn

keras复现场景文本检测网络CPTN: 《Detecting Text in Natural Image with Connectionist Text Proposal Network》;欢迎试用,关注,并反馈问题...
Apache License 2.0
107 stars 38 forks source link

关于多分类的问题 #24

Closed kaixinbaba closed 4 years ago

kaixinbaba commented 4 years ago

代码中和训练有关的代码反复看了好几遍,算大致搞懂了流程,想基于这个模型做点调整,代码中文本分类只有两类,文字和背景,我想修改成文字多分类,比如有10类,维度什么就跟着调整了下从原来的2 变成了11,但是训练开始没多久loss就开始无限增大了,估计是和修改的地方有关系 。自己折腾了很久也没看出哪里不对。。大佬有什么建议么

有个疑问 一开始的这个Input 参数2 代表的是2个分类还是第一索引是分类,第二索引是padding?

gt_class_ids = Input(shape=(config.MAX_GT_INSTANCES, 2), name='gt_class_ids')
yizt commented 4 years ago

@kaixinbaba 第一个是padding,第二个是分类,参数2 代表的是2个分类