Closed nissansz closed 9 months ago
来个例图
可能会有各种复杂的文本框,彼此靠近的,上下交错之类
怎么切出单个文本框
使用段落合并中的 多行-自然段
,可以尽量以文本框为单位进行划分。(但是,文本框之间的顺序,仍需你手动排序。)
另,建议修改软件目录中的一个文件,修正一个bug,以提高准确度。
用记事本或编辑器打开 UmiOCR-data/py_src/ocr/tbpu/merge_para.py
参考这个commit,修改其中一行代码
https://github.com/YCG09/chinese_ocr
这里的模型能转成onnx吗? win10下怎么用DenseNet训练?
这个项目我不太了解,估计可能不行吧
有没有什么模型可以将ppt中散落的文本框,分割出文本框段落?