JiaquanYe / TableMASTER-mmocr

2nd solution of ICDAR 2021 Competition on Scientific Literature Parsing, Task B.
Apache License 2.0
410 stars 100 forks source link

请问对于倾斜的 手机拍照图片可以识别吗?比如下面的图片 #35

Open dotsonliu opened 2 years ago

dotsonliu commented 2 years ago

image

JiaquanYe commented 2 years ago

需要自己补充数据训练,这套算法框架做这个没问题

发自我的iPhone

------------------ 原始邮件 ------------------ 发件人: DZ @.> 发送时间: 2021年12月14日 14:43 收件人: JiaquanYe/TableMASTER-mmocr @.> 抄送: Subscribed @.***> 主题: Re: [JiaquanYe/TableMASTER-mmocr] 请问对于倾斜的 手机拍照图片可以识别吗?比如下面的图片 (Issue #35)

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub, or unsubscribe.

dotsonliu commented 2 years ago

对于这种柔性形变,折纸问题,也可以解决吗?

dotsonliu commented 2 years ago

您好,对这块的输入输出部分有些疑惑,每个图片表格多少不一样, 最终输出的49*500,其中500是模型的序列长度,49为每个位置序列特征的维度? 这个怎么理解?是指预测500个38类别?相当于有500个文本框? 49是指什么?

dotsonliu commented 2 years ago

另外请问这个是基于单个字符做的,还是基于文本框里面的n个字符做? 对于有些情况n个字符文本框会不准确,怎么办呢?