WenmuZhou / PAN.pytorch

A unofficial pytorch implementation of PAN(PSENet2): Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network
Apache License 2.0
413 stars 112 forks source link

想问问,作者跑的时候有没有发现边界比较差 #19

Open GYxiaOH opened 4 years ago

GYxiaOH commented 4 years ago

rt。。。发现最后的结果边界都比较差,会往内缩一点,不知道是不是我迭代的次数太少了,但是600个epoch也太长了吧,现在我一般只训50个epoch左右,600个估计一个星期能有一个结果

GYxiaOH commented 4 years ago

PSE好像也是这个问题

FredlinT commented 4 years ago

@GYxiaOH 你有改他后处理的参数吗,我训练一开始边界还行,后来越训练边界差的越多了。不仅仅是收缩的问题,一开始输出的框比较贴文字轮廓的,但是后来就趋向输出水平的四边形,还有就是漏检的比较多。

GYxiaOH commented 4 years ago

@FredlinT 尝试过后处理参数,没啥作用,后期趋向水平我到是没发现,漏检确实多。。看召回率就觉得挺差的

FredlinT commented 4 years ago

@GYxiaOH 我改后处理的那个参数,边界能有一定的调整,但是漏检和趋向水平我没办法。

GYxiaOH commented 4 years ago

@FredlinT 你怎么改的,我怎么改边界感觉都不大好

FredlinT commented 4 years ago

@也只是相对变好,你试试pse_cpp传进去的最后一个阈值,改到3以上。

AlexJunCpp commented 4 years ago

我也觉得边界是有点问题

pekinghk commented 4 years ago

而且我发现一个问题,对于比较长的图,越靠近图像下部,拟合边界会有整体上移的趋势,大家有遇到么

Lanme commented 4 years ago

而且我发现一个问题,对于比较长的图,越靠近图像下部,拟合边界会有整体上移的趋势,大家有遇到么

pse也是这个问题,https://github.com/whai362/PSENet/issues/121

pekinghk commented 4 years ago

而且我发现一个问题,对于比较长的图,越靠近图像下部,拟合边界会有整体上移的趋势,大家有遇到么

pse也是这个问题,whai362/PSENet#121

好的,十分感谢

xxlxx1 commented 4 years ago

把长和宽都resize到32的倍数就没问题了,因为icdar图片大小都是一样的而且是32的倍数,所以这个项目里没出问题 @pekinghk

GYxiaOH commented 4 years ago

@xxlxx1 ..好像是好一点,这是什么原理啊。。

xxlxx1 commented 4 years ago

@GYxiaOH 我感觉是因为网络中间过程polling取整了,最小的是原始图片的1/32,如果原始图片大小不能被32整除,那么特征图得到的框对于原始图片就会产生便宜,因为取整舍去了小数部分。有点像maskrcnn里面说的roipooling 和它提出的 roialign

pekinghk commented 4 years ago

把长和宽都resize到32的倍数就没问题了,因为icdar图片大小都是一样的而且是32的倍数,所以这个项目里没出问题 @pekinghk

好的,我试试

Debugerss commented 4 years ago

trainer.py[line:171]: test: recall: 0.000000, precision: 0.000000, f1: 0.000000 在验证的时候,出现这样的问题,请问有人知道吗?

tonhathuy commented 3 years ago

@Debugerss I have a same error, have you fixed it yet ?

zzcqinag commented 3 years ago

trainer.py[line:171]: test: recall: 0.000000, precision: 0.000000, f1: 0.000000 在验证的时候,出现这样的问题,请问有人知道吗?

你好!请问你解决了吗? @Debugerss

adijindal30 commented 3 years ago

@Debugerss I also get the same error, have you fixed it?( test: recall: 0.000000, precision: 0.000000, f1: 0.000000)

summer-1010 commented 3 years ago

@xxlxx1 你好,为什么最后的预测结果只有标注框的坐标信息但没有实际的文本识别信息呢?