chineseocr / table-detect

table detect(yolo) , table line(unet)
MIT License
236 stars 86 forks source link

关于数据集的问题 #6

Open PC-god opened 3 years ago

PC-god commented 3 years ago

首先,非常感谢您的分享。我尝试了表格识别,然后后处理稍微修改一点,效果非常棒。 其中,如果我想 迁移学习,有什么公开数据集可以训练unet么? 下载了TableBank和其他的,他们的标签要么作表格检测,要么是预测 表格单元关系。 不会真的都要用 LabelImage制作segmentation img吧。 手动狗头

PC-god commented 3 years ago

而且 你给的 样例数据,是json格式的。就很秀

ancybeibei commented 3 years ago

用labelme

WuChannn commented 3 years ago

@PC-god 请问您说的“尝试了表格识别,然后后处理稍微修改一点,效果非常棒。”是指table-ocr吗

joeqincai commented 3 years ago

您好,这个repo在用的数据集是哪个数据集的,可否告知一下的

joeqincai commented 3 years ago

@PC-god ,你好,目前你这边用的是什么数据集,可否分享一下啊

zhengquanhe commented 2 years ago

用labelme

您好 labelme 具体怎么标注啊谢谢 我想自己手动标个1000左右的数据集/狗头

PC-god commented 2 years ago

就按照直线的像素尽可能贴近 直线,不按框。另外我看有的公司说 这个表格线分割用生成的数据集也可以。 你生成一大批再训练也可以。

哈工程-张忠亮 @.***