yuantailing / ctw-baseline

Baseline methods for [CTW dataset](https://ctwdataset.github.io/)
MIT License
329 stars 88 forks source link

检测的时候怎么提取一行字符或者一列的区域 yolo例子下面那个只能提取单个字符的区域 #32

Open mahxn0 opened 5 years ago

mahxn0 commented 5 years ago

image

1 比如获取这个兰州牛肉拉面的区域为一个box 论文里面有说数据这样做过标记 但是json文件太大看不出来是哪个label 灰常感谢

yuantailing commented 5 years ago

Bounding boxes of text lines are not included in the .json file. You may compute the convex hull of all character instances in a line as the bounding box of the line.

mahxn0 commented 5 years ago

但是如果有几个文字区域的话(比如三个面馆的横幅) 这种方法好像没办法提取. json里面没有对不同的区域做个划分. 只是给出了每个字的label . 我现在用yolov3训练的模型只能检测出来单个字. 我需要这个区域的目的就是先检测区域 .再扣字做识别. 另外请问一下论文里面说的这个文字区域标记的json有没有下载链接呀 谢谢. image

yuantailing commented 5 years ago

You may compute the convex hull (or minimum area rectangle) of character instances in a line as the region of the line.

mahxn0 commented 5 years ago

好的 灰常谢谢 我试一下

vivilau commented 5 years ago

请问具体怎么把单个字的检测框合并成文本行检测框啊,qq1484473667,感谢!