PFCCLab / PPOCRLabel

PPOCRLabelv2 is a semi-automatic graphic annotation tool suitable for OCR field, with built-in PP-OCR model to automatically detect and re-recognize data.
105 stars 32 forks source link

换行的文字如何识别?手动输入? #46

Closed PlayerJian closed 3 months ago

PlayerJian commented 3 months ago
屏幕截图 2024-08-05 094606

像这种换行的文字,在表格标注时是不是按整个单元格画框,但是这个框里的文字,在重新识别时,换行的只能识别第一行,下面的几行文字就要手动输入么?

GreatV commented 3 months ago

按行标注

PlayerJian commented 3 months ago

屏幕截图 2024-08-05 115452 我不太理解,表格标注功能,这两个红色框位置这样标注是对的么?

PlayerJian commented 3 months ago

屏幕截图 2024-08-05 180008 还有一个问题,标注文件里的gt部分参与训练么?因为我发现gt部分的内容完全不符合表格的版面和内容,丢失了审批单,而且排版也不一致,调试了好几次还是这样

GreatV commented 3 months ago

按照这个说明来 https://github.com/PFCCLab/PPOCRLabel/blob/main/README_ch.md#22-%E8%A1%A8%E6%A0%BC%E6%A0%87%E6%B3%A8%E8%A7%86%E9%A2%91%E6%BC%94%E7%A4%BA

PlayerJian commented 3 months ago

按照这个说明来 https://github.com/PFCCLab/PPOCRLabel/blob/main/README_ch.md#22-%E8%A1%A8%E6%A0%BC%E6%A0%87%E6%B3%A8%E8%A7%86%E9%A2%91%E6%BC%94%E7%A4%BA

我看到这个说明了 只是有些地方不懂 比如上面说的

PlayerJian commented 3 months ago

按照这个说明来 https://github.com/PFCCLab/PPOCRLabel/blob/main/README_ch.md#22-%E8%A1%A8%E6%A0%BC%E6%A0%87%E6%B3%A8%E8%A7%86%E9%A2%91%E6%BC%94%E7%A4%BA

2.更改标注结果:以表格中的单元格为单位增加标注框(即一个单元格内的文字都标记为一个框) 这句话我理解是,以单元格画框,但是单元格中有的文字内容有换行情况,如上我提出的,换行的话,又如我上述所说,怎么办

PlayerJian commented 3 months ago

按照这个说明来 https://github.com/PFCCLab/PPOCRLabel/blob/main/README_ch.md#22-%E8%A1%A8%E6%A0%BC%E6%A0%87%E6%B3%A8%E8%A7%86%E9%A2%91%E6%BC%94%E7%A4%BA

也就是说,有换行文字的单元格,如何进行表格标注

GreatV commented 3 months ago

表格一个cell只用标一个框,空白的单元也要标。因为表格识别并不看里面的内容,只看表格结构是不是对的。

PlayerJian commented 3 months ago

好的,感谢

lwinhong commented 3 months ago

image 使用【单元格重识别】可以

PlayerJian commented 3 months ago

image 使用【单元格重识别】可以

好的 学到了 我以为单元格重识别功能 和 右上角的重新识别按钮是一个功能呢 谢谢