MrZilinXiao / Hyper-Table-OCR

A carefully-designed OCR pipeline for universal boarded table recognition and reconstruction.
https://mrxiao.net/hyper-table-ocr.html
168 stars 43 forks source link

你好,想请教下,我训练表格结构时高分辨率表格效果不是很好,有什么方法调整参数训练吗?以下是我附上我识别的效果 #6

Open 965662766 opened 3 years ago

965662766 commented 3 years ago

image image

MrZilinXiao commented 3 years ago

如果您准备好了大量类似context的高分辨率表格图片,可以参照tensorflow实现自行训练一个UNet分割网络。

965662766 commented 3 years ago

如果您准备好了大量类似context的高分辨率表格图片,可以参照tensorflow实现自行训练一个UNet分割网络。

非常感谢你的回复!我是已经准备好了上千张的高分辨率数据集,并且已经标注好,但参考源码中去训练时效果并不好,但不知道如何参照tensorflow实现自行训练,我是https://github.com/chineseocr/table-detect 这个源码是修改尺寸参数时报错

965662766 commented 3 years ago

如果您准备好了大量类似context的高分辨率表格图片,可以参照tensorflow实现自行训练一个UNet分割网络。

请问下,我个有疑问,高分辨率的图片训练时是不是会压缩成低分辨率去训练,如果是这样子的话那么压缩后会丢失掉线条

MrZilinXiao commented 3 years ago

如果您准备好了大量类似context的高分辨率表格图片,可以参照tensorflow实现自行训练一个UNet分割网络。

请问下,我个有疑问,高分辨率的图片训练时是不是会压缩成低分辨率去训练,如果是这样子的话那么压缩后会丢失掉线条

抱歉,本项目可以算是业余爱好,我个人对UNet不甚了解。 你描述的情况的确可能存在,建议调整网络结构到可以接受较大尺寸的输入。