输出结果区域如何提取？

wangshuai66666 commented 5 years ago

请问输出的检测结果区域，怎样提取出来呢？以便于做识别。因为结果区域并不是规则的矩形，我们怎样提取出来做识别呢？ @whai362

saicoco commented 5 years ago

可以获取最小外界旋转矩形进行仿射变换进行扣取文本

wangshuai66666 commented 5 years ago

可以获取最小外界旋转矩形进行仿射变换进行扣取文本

thanks!

xiiiiiiii commented 5 years ago

请问输出的检测结果区域，怎样提取出来呢？以便于做识别。因为结果区域并不是规则的矩形，我们怎样提取出来做识别呢？ @whai362

想问问如果是竖向排列的文本，怎么样对他进行提取和进一步的识别？竖的文本是不是要进行转化成横的才能识别？

wangshuai66666 commented 5 years ago

请问输出的检测结果区域，怎样提取出来呢？以便于做识别。因为结果区域并不是规则的矩形，我们怎样提取出来做识别呢？ @whai362

想问问如果是竖向排列的文本，怎么样对他进行提取和进一步的识别？竖的文本是不是要进行转化成横的才能识别？那看你用的什么识别算法了，用博主的检测算法得到检测结果后，利用最小外接旋转矩阵很容易实现旋转矫正。

xiiiiiiii commented 5 years ago

请问输出的检测结果区域，怎样提取出来呢？以便于做识别。因为结果区域并不是规则的矩形，我们怎样提取出来做识别呢？ @whai362

想问问如果是竖向排列的文本，怎么样对他进行提取和进一步的识别？竖的文本是不是要进行转化成横的才能识别？那看你用的什么识别算法了，用博主的检测算法得到检测结果后，利用最小外接旋转矩阵很容易实现旋转矫正。

谢谢你，刚入门理解的不是很到位，想再问一下，如果是是这种竖着的图片或者是这张图片里的“造字”这两个字，用博主的这个方法，通过最小外接旋转矩阵可以把它矫正成横的吗？可是他们的标签不是“造字”这个竖着的字的一个整体吗？如果是这种规律的四变形，同样也可以同最小外接旋转矩阵变矫正吗？

wangshuai66666 commented 5 years ago

请问输出的检测结果区域，怎样提取出来呢？以便于做识别。因为结果区域并不是规则的矩形，我们怎样提取出来做识别呢？ @whai362

想问问如果是竖向排列的文本，怎么样对他进行提取和进一步的识别？竖的文本是不是要进行转化成横的才能识别？那看你用的什么识别算法了，用博主的检测算法得到检测结果后，利用最小外接旋转矩阵很容易实现旋转矫正。

谢谢你，刚入门理解的不是很到位，想再问一下，如果是是这种竖着的图片或者是这张图片里的“造字”这两个字，用博主的这个方法，通过最小外接旋转矩阵可以把它矫正成横的吗？可是他们的标签不是“造字”这个竖着的字的一个整体吗？如果是这种规律的四变形，同样也可以同最小外接旋转矩阵变矫正吗？

首先，博主的方法是pse net检测的，跟识别无关。第一幅图，根据检测结果和旋转矩阵，矫正还是很容易的。第二个“造字”就不知道了，因为不知道用pse net检测出来是什么效果，如果检测结果是一个字一个字的，那不就不用矫正了么。博主的方法是从最小的核开始，实现检测结果是一个字一个字的，也不难。建议先好好研究博主的检测方法，去实现一下，看看真正的效果。我不是博主，我也是来学习的～

xiiiiiiii commented 5 years ago

明白了，非常感谢你

---原始邮件--- 发件人: "wangshuai66666"notifications@github.com 发送时间: 2019年6月14日(星期五) 上午9:20 收件人: "whai362/PSENet"PSENet@noreply.github.com; 抄送: "guopeijun"494207346@qq.com;"Comment"comment@noreply.github.com; 主题: Re: [whai362/PSENet] 输出结果区域如何提取？ (#56)

请问输出的检测结果区域，怎样提取出来呢？以便于做识别。因为结果区域并不是规则的矩形，我们怎样提取出来做识别呢？ @whai362

想问问如果是竖向排列的文本，怎么样对他进行提取和进一步的识别？竖的文本是不是要进行转化成横的才能识别？那看你用的什么识别算法了，用博主的检测算法得到检测结果后，利用最小外接旋转矩阵很容易实现旋转矫正。

谢谢你，刚入门理解的不是很到位，想再问一下，如果是是这种竖着的图片

或者是

这张图片里的“造字”这两个字，用博主的这个方法，通过最小外接旋转矩阵可以把它矫正成横的吗？可是他们的标签不是“造字”这个竖着的字的一个整体吗？如果是这种规律的四变形，同样也可以同最小外接旋转矩阵变矫正吗？

首先，博主的方法是pse net检测的，跟识别无关。第一幅图，根据检测结果和旋转矩阵，矫正还是很容易的。第二个“造字”就不知道了，因为不知道用pse net检测出来是什么效果，如果检测结果是一个字一个字的，那不就不用矫正了么。博主的方法是从最小的核开始，实现检测结果是一个字一个字的，也不难。建议先好好研究博主的检测方法，去实现一下，看看真正的效果。我不是博主，我也是来学习的～

— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or mute the thread.

wangshuai66666 commented 5 years ago

明白了，非常感谢你 … ---原始邮件--- 发件人: "wangshuai66666"notifications@github.com 发送时间: 2019年6月14日(星期五) 上午9:20 收件人: "whai362/PSENet"PSENet@noreply.github.com; 抄送: "guopeijun"494207346@qq.com;"Comment"comment@noreply.github.com; 主题: Re: [whai362/PSENet] 输出结果区域如何提取？ (#56) 请问输出的检测结果区域，怎样提取出来呢？以便于做识别。因为结果区域并不是规则的矩形，我们怎样提取出来做识别呢？ @whai362 想问问如果是竖向排列的文本，怎么样对他进行提取和进一步的识别？竖的文本是不是要进行转化成横的才能识别？那看你用的什么识别算法了，用博主的检测算法得到检测结果后，利用最小外接旋转矩阵很容易实现旋转矫正。谢谢你，刚入门理解的不是很到位，想再问一下，如果是是这种竖着的图片或者是这张图片里的“造字”这两个字，用博主的这个方法，通过最小外接旋转矩阵可以把它矫正成横的吗？可是他们的标签不是“造字”这个竖着的字的一个整体吗？如果是这种规律的四变形，同样也可以同最小外接旋转矩阵变矫正吗？首先，博主的方法是pse net检测的，跟识别无关。第一幅图，根据检测结果和旋转矩阵，矫正还是很容易的。第二个“造字”就不知道了，因为不知道用pse net检测出来是什么效果，如果检测结果是一个字一个字的，那不就不用矫正了么。博主的方法是从最小的核开始，实现检测结果是一个字一个字的，也不难。建议先好好研究博主的检测方法，去实现一下，看看真正的效果。我不是博主，我也是来学习的～ — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or mute the thread.

我用我训练的pse net模型试了一下，检测“造字”，结果是一个字一个字的，就是“造”一个检测框，“字”一个检测框，这就不需要矫正了，直接识别就好了，我识别用的crnn算法

xiiiiiiii commented 5 years ago

明白了，非常感谢你 … ---原始邮件--- 发件人: "wangshuai66666"notifications@github.com 发送时间: 2019年6月14日(星期五) 上午9:20 收件人: "whai362/PSENet"PSENet@noreply.github.com; 抄送: "guopeijun"494207346@qq.com;"Comment"comment@noreply.github.com; 主题: Re: [whai362/PSENet] 输出结果区域如何提取？ (#56) 请问输出的检测结果区域，怎样提取出来呢？以便于做识别。因为结果区域并不是规则的矩形，我们怎样提取出来做识别呢？ @whai362 想问问如果是竖向排列的文本，怎么样对他进行提取和进一步的识别？竖的文本是不是要进行转化成横的才能识别？那看你用的什么识别算法了，用博主的检测算法得到检测结果后，利用最小外接旋转矩阵很容易实现旋转矫正。谢谢你，刚入门理解的不是很到位，想再问一下，如果是是这种竖着的图片或者是这张图片里的“造字”这两个字，用博主的这个方法，通过最小外接旋转矩阵可以把它矫正成横的吗？可是他们的标签不是“造字”这个竖着的字的一个整体吗？如果是这种规律的四变形，同样也可以同最小外接旋转矩阵变矫正吗？首先，博主的方法是pse net检测的，跟识别无关。第一幅图，根据检测结果和旋转矩阵，矫正还是很容易的。第二个“造字”就不知道了，因为不知道用pse net检测出来是什么效果，如果检测结果是一个字一个字的，那不就不用矫正了么。博主的方法是从最小的核开始，实现检测结果是一个字一个字的，也不难。建议先好好研究博主的检测方法，去实现一下，看看真正的效果。我不是博主，我也是来学习的～ — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or mute the thread.

我用我训练的pse net模型试了一下，检测“造字”，结果是一个字一个字的，就是“造”一个检测框，“字”一个检测框，这就不需要矫正了，直接识别就好了，我识别用的crnn算法

明白了，我试试，非常感谢

xiiiiiiii commented 5 years ago

明白了，非常感谢你 … ---原始邮件--- 发件人: "wangshuai66666"notifications@github.com 发送时间: 2019年6月14日(星期五) 上午9:20 收件人: "whai362/PSENet"PSENet@noreply.github.com; 抄送: "guopeijun"494207346@qq.com;"Comment"comment@noreply.github.com; 主题: Re: [whai362/PSENet] 输出结果区域如何提取？ (#56) 请问输出的检测结果区域，怎样提取出来呢？以便于做识别。因为结果区域并不是规则的矩形，我们怎样提取出来做识别呢？ @whai362 想问问如果是竖向排列的文本，怎么样对他进行提取和进一步的识别？竖的文本是不是要进行转化成横的才能识别？那看你用的什么识别算法了，用博主的检测算法得到检测结果后，利用最小外接旋转矩阵很容易实现旋转矫正。谢谢你，刚入门理解的不是很到位，想再问一下，如果是是这种竖着的图片或者是这张图片里的“造字”这两个字，用博主的这个方法，通过最小外接旋转矩阵可以把它矫正成横的吗？可是他们的标签不是“造字”这个竖着的字的一个整体吗？如果是这种规律的四变形，同样也可以同最小外接旋转矩阵变矫正吗？首先，博主的方法是pse net检测的，跟识别无关。第一幅图，根据检测结果和旋转矩阵，矫正还是很容易的。第二个“造字”就不知道了，因为不知道用pse net检测出来是什么效果，如果检测结果是一个字一个字的，那不就不用矫正了么。博主的方法是从最小的核开始，实现检测结果是一个字一个字的，也不难。建议先好好研究博主的检测方法，去实现一下，看看真正的效果。我不是博主，我也是来学习的～ — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or mute the thread.

我用我训练的pse net模型试了一下，检测“造字”，结果是一个字一个字的，就是“造”一个检测框，“字”一个检测框，这就不需要矫正了，直接识别就好了，我识别用的crnn算法

我对于识别方面还有一点问题，想请教一下你，比如说我识别出来的结果是这样的：

检测出来的是一个字一个字的，比如华润苏果是检测成华，润，苏果，可是我最后想识别出来的结果是华润苏果这四个字，那么送入crnn网络里的图片应该是什么样子呢？是按照坐标把这三个字分别剪裁下来，然后识别，可是识别出来的是分来的三组字，最后怎么进行合并呢？还有就是检测出来的结果只有坐标信息，没有字的标签，那么如果要训练crnn，就是识别这一块的话训练数据要怎么处理？因为检测出来的只有标签没有添加图片中的文字信息。谢谢你。

Crescentz commented 5 years ago

可以获取最小外界旋转矩形进行仿射变换进行扣取文本

请问这具体是cv2. 哪个操作，不胜感激

Crescentz commented 5 years ago

@saicoco

whai362 / PSENet

输出结果区域如何提取？ #56