whai362 / PSENet

Official Pytorch implementations of PSENet.
Apache License 2.0
1.17k stars 344 forks source link

输出结果区域如何提取? #56

Open wangshuai66666 opened 5 years ago

wangshuai66666 commented 5 years ago

请问输出的检测结果区域,怎样提取出来呢?以便于做识别。因为结果区域并不是规则的矩形,我们怎样提取出来做识别呢? @whai362

saicoco commented 5 years ago

可以获取最小外界旋转矩形进行仿射变换进行扣取文本

wangshuai66666 commented 5 years ago

可以获取最小外界旋转矩形进行仿射变换进行扣取文本

thanks!

xiiiiiiii commented 5 years ago

请问输出的检测结果区域,怎样提取出来呢?以便于做识别。因为结果区域并不是规则的矩形,我们怎样提取出来做识别呢? @whai362

想问问如果是竖向排列的文本,怎么样对他进行提取和进一步的识别?竖的文本是不是要进行转化成横的才能识别?

wangshuai66666 commented 5 years ago

请问输出的检测结果区域,怎样提取出来呢?以便于做识别。因为结果区域并不是规则的矩形,我们怎样提取出来做识别呢? @whai362

想问问如果是竖向排列的文本,怎么样对他进行提取和进一步的识别?竖的文本是不是要进行转化成横的才能识别? 那看你用的什么识别算法了,用博主的检测算法得到检测结果后,利用最小外接旋转矩阵很容易实现旋转矫正。

xiiiiiiii commented 5 years ago

请问输出的检测结果区域,怎样提取出来呢?以便于做识别。因为结果区域并不是规则的矩形,我们怎样提取出来做识别呢? @whai362

想问问如果是竖向排列的文本,怎么样对他进行提取和进一步的识别?竖的文本是不是要进行转化成横的才能识别? 那看你用的什么识别算法了,用博主的检测算法得到检测结果后,利用最小外接旋转矩阵很容易实现旋转矫正。

谢谢你,刚入门理解的不是很到位,想再问一下,如果是是这种竖着的图片 image 或者是 image 这张图片里的“造字”这两个字,用博主的这个方法,通过最小外接旋转矩阵可以把它矫正成横的吗?可是他们的标签不是“造字”这个竖着的字的一个整体吗?如果是这种规律的四变形,同样也可以同最小外接旋转矩阵变矫正吗?

wangshuai66666 commented 5 years ago

请问输出的检测结果区域,怎样提取出来呢?以便于做识别。因为结果区域并不是规则的矩形,我们怎样提取出来做识别呢? @whai362

想问问如果是竖向排列的文本,怎么样对他进行提取和进一步的识别?竖的文本是不是要进行转化成横的才能识别? 那看你用的什么识别算法了,用博主的检测算法得到检测结果后,利用最小外接旋转矩阵很容易实现旋转矫正。

谢谢你,刚入门理解的不是很到位,想再问一下,如果是是这种竖着的图片 image 或者是 image 这张图片里的“造字”这两个字,用博主的这个方法,通过最小外接旋转矩阵可以把它矫正成横的吗?可是他们的标签不是“造字”这个竖着的字的一个整体吗?如果是这种规律的四变形,同样也可以同最小外接旋转矩阵变矫正吗?

首先,博主的方法是pse net检测的,跟识别无关。第一幅图,根据检测结果和旋转矩阵,矫正还是很容易的。第二个“造字”就不知道了,因为不知道用pse net检测出来是什么效果,如果检测结果是一个字 一个字的,那不就不用矫正了么。博主的方法是从最小的核开始,实现检测结果是一个字 一个字的 ,也不难。建议先好好研究博主的检测方法,去实现一下,看看真正的效果。我不是博主,我也是来学习的~

xiiiiiiii commented 5 years ago

明白了,非常感谢你

---原始邮件--- 发件人: "wangshuai66666"notifications@github.com 发送时间: 2019年6月14日(星期五) 上午9:20 收件人: "whai362/PSENet"PSENet@noreply.github.com; 抄送: "guopeijun"494207346@qq.com;"Comment"comment@noreply.github.com; 主题: Re: [whai362/PSENet] 输出结果区域如何提取? (#56)

请问输出的检测结果区域,怎样提取出来呢?以便于做识别。因为结果区域并不是规则的矩形,我们怎样提取出来做识别呢? @whai362

想问问如果是竖向排列的文本,怎么样对他进行提取和进一步的识别?竖的文本是不是要进行转化成横的才能识别? 那看你用的什么识别算法了,用博主的检测算法得到检测结果后,利用最小外接旋转矩阵很容易实现旋转矫正。

谢谢你,刚入门理解的不是很到位,想再问一下,如果是是这种竖着的图片

或者是

这张图片里的“造字”这两个字,用博主的这个方法,通过最小外接旋转矩阵可以把它矫正成横的吗?可是他们的标签不是“造字”这个竖着的字的一个整体吗?如果是这种规律的四变形,同样也可以同最小外接旋转矩阵变矫正吗?

首先,博主的方法是pse net检测的,跟识别无关。第一幅图,根据检测结果和旋转矩阵,矫正还是很容易的。第二个“造字”就不知道了,因为不知道用pse net检测出来是什么效果,如果检测结果是一个字 一个字的,那不就不用矫正了么。博主的方法是从最小的核开始,实现检测结果是一个字 一个字的 ,也不难。建议先好好研究博主的检测方法,去实现一下,看看真正的效果。我不是博主,我也是来学习的~

— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or mute the thread.

wangshuai66666 commented 5 years ago

明白了,非常感谢你 ---原始邮件--- 发件人: "wangshuai66666"notifications@github.com 发送时间: 2019年6月14日(星期五) 上午9:20 收件人: "whai362/PSENet"PSENet@noreply.github.com; 抄送: "guopeijun"494207346@qq.com;"Comment"comment@noreply.github.com; 主题: Re: [whai362/PSENet] 输出结果区域如何提取? (#56) 请问输出的检测结果区域,怎样提取出来呢?以便于做识别。因为结果区域并不是规则的矩形,我们怎样提取出来做识别呢? @whai362 想问问如果是竖向排列的文本,怎么样对他进行提取和进一步的识别?竖的文本是不是要进行转化成横的才能识别? 那看你用的什么识别算法了,用博主的检测算法得到检测结果后,利用最小外接旋转矩阵很容易实现旋转矫正。 谢谢你,刚入门理解的不是很到位,想再问一下,如果是是这种竖着的图片 或者是 这张图片里的“造字”这两个字,用博主的这个方法,通过最小外接旋转矩阵可以把它矫正成横的吗?可是他们的标签不是“造字”这个竖着的字的一个整体吗?如果是这种规律的四变形,同样也可以同最小外接旋转矩阵变矫正吗? 首先,博主的方法是pse net检测的,跟识别无关。第一幅图,根据检测结果和旋转矩阵,矫正还是很容易的。第二个“造字”就不知道了,因为不知道用pse net检测出来是什么效果,如果检测结果是一个字 一个字的,那不就不用矫正了么。博主的方法是从最小的核开始,实现检测结果是一个字 一个字的 ,也不难。建议先好好研究博主的检测方法,去实现一下,看看真正的效果。我不是博主,我也是来学习的~ — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or mute the thread.

我用我训练的pse net模型试了一下,检测“造字”,结果是一个字 一个字的,就是“造”一个检测框,“字”一个检测框,这就不需要矫正了,直接识别就好了,我识别用的crnn算法

xiiiiiiii commented 5 years ago

明白了,非常感谢你 ---原始邮件--- 发件人: "wangshuai66666"notifications@github.com 发送时间: 2019年6月14日(星期五) 上午9:20 收件人: "whai362/PSENet"PSENet@noreply.github.com; 抄送: "guopeijun"494207346@qq.com;"Comment"comment@noreply.github.com; 主题: Re: [whai362/PSENet] 输出结果区域如何提取? (#56) 请问输出的检测结果区域,怎样提取出来呢?以便于做识别。因为结果区域并不是规则的矩形,我们怎样提取出来做识别呢? @whai362 想问问如果是竖向排列的文本,怎么样对他进行提取和进一步的识别?竖的文本是不是要进行转化成横的才能识别? 那看你用的什么识别算法了,用博主的检测算法得到检测结果后,利用最小外接旋转矩阵很容易实现旋转矫正。 谢谢你,刚入门理解的不是很到位,想再问一下,如果是是这种竖着的图片 或者是 这张图片里的“造字”这两个字,用博主的这个方法,通过最小外接旋转矩阵可以把它矫正成横的吗?可是他们的标签不是“造字”这个竖着的字的一个整体吗?如果是这种规律的四变形,同样也可以同最小外接旋转矩阵变矫正吗? 首先,博主的方法是pse net检测的,跟识别无关。第一幅图,根据检测结果和旋转矩阵,矫正还是很容易的。第二个“造字”就不知道了,因为不知道用pse net检测出来是什么效果,如果检测结果是一个字 一个字的,那不就不用矫正了么。博主的方法是从最小的核开始,实现检测结果是一个字 一个字的 ,也不难。建议先好好研究博主的检测方法,去实现一下,看看真正的效果。我不是博主,我也是来学习的~ — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or mute the thread.

我用我训练的pse net模型试了一下,检测“造字”,结果是一个字 一个字的,就是“造”一个检测框,“字”一个检测框,这就不需要矫正了,直接识别就好了,我识别用的crnn算法

明白了,我试试,非常感谢

xiiiiiiii commented 5 years ago

明白了,非常感谢你 ---原始邮件--- 发件人: "wangshuai66666"notifications@github.com 发送时间: 2019年6月14日(星期五) 上午9:20 收件人: "whai362/PSENet"PSENet@noreply.github.com; 抄送: "guopeijun"494207346@qq.com;"Comment"comment@noreply.github.com; 主题: Re: [whai362/PSENet] 输出结果区域如何提取? (#56) 请问输出的检测结果区域,怎样提取出来呢?以便于做识别。因为结果区域并不是规则的矩形,我们怎样提取出来做识别呢? @whai362 想问问如果是竖向排列的文本,怎么样对他进行提取和进一步的识别?竖的文本是不是要进行转化成横的才能识别? 那看你用的什么识别算法了,用博主的检测算法得到检测结果后,利用最小外接旋转矩阵很容易实现旋转矫正。 谢谢你,刚入门理解的不是很到位,想再问一下,如果是是这种竖着的图片 或者是 这张图片里的“造字”这两个字,用博主的这个方法,通过最小外接旋转矩阵可以把它矫正成横的吗?可是他们的标签不是“造字”这个竖着的字的一个整体吗?如果是这种规律的四变形,同样也可以同最小外接旋转矩阵变矫正吗? 首先,博主的方法是pse net检测的,跟识别无关。第一幅图,根据检测结果和旋转矩阵,矫正还是很容易的。第二个“造字”就不知道了,因为不知道用pse net检测出来是什么效果,如果检测结果是一个字 一个字的,那不就不用矫正了么。博主的方法是从最小的核开始,实现检测结果是一个字 一个字的 ,也不难。建议先好好研究博主的检测方法,去实现一下,看看真正的效果。我不是博主,我也是来学习的~ — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or mute the thread.

我用我训练的pse net模型试了一下,检测“造字”,结果是一个字 一个字的,就是“造”一个检测框,“字”一个检测框,这就不需要矫正了,直接识别就好了,我识别用的crnn算法

我对于识别方面还有一点问题,想请教一下你,比如说我识别出来的结果是这样的: image

检测出来的是一个字一个字的,比如华润苏果是检测成华,润,苏果,可是我最后想识别出来的结果是华润苏果这四个字,那么送入crnn网络里的图片应该是什么样子呢?是按照坐标把这三个字分别剪裁下来,然后识别,可是识别出来的是分来的三组字,最后怎么进行合并呢? 还有就是检测出来的结果只有坐标信息,没有字的标签,那么如果要训练crnn,就是识别这一块的话训练数据要怎么处理?因为检测出来的只有标签没有添加图片中的文字信息。谢谢你。

Crescentz commented 5 years ago

可以获取最小外界旋转矩形进行仿射变换进行扣取文本

请问这具体是cv2. 哪个操作,不胜感激

Crescentz commented 5 years ago

@saicoco