hiroi-sora / Umi-OCR_v2

结束和新的开始
MIT License
933 stars 73 forks source link

有没有什么模型可以将ppt中散落的文本框,分割出文本框段落? #56

Closed nissansz closed 9 months ago

nissansz commented 10 months ago

有没有什么模型可以将ppt中散落的文本框,分割出文本框段落?

hiroi-sora commented 10 months ago

来个例图

nissansz commented 10 months ago

药理学(沈祥春,陈晓红)PPT模板_Page_63 可能会有各种复杂的文本框,彼此靠近的,上下交错之类

nissansz commented 10 months ago

image

怎么切出单个文本框

hiroi-sora commented 10 months ago

使用段落合并中的 多行-自然段,可以尽量以文本框为单位进行划分。(但是,文本框之间的顺序,仍需你手动排序。)

image image

另,建议修改软件目录中的一个文件,修正一个bug,以提高准确度。 用记事本或编辑器打开 UmiOCR-data/py_src/ocr/tbpu/merge_para.py 参考这个commit,修改其中一行代码

nissansz commented 10 months ago

https://github.com/YCG09/chinese_ocr

这里的模型能转成onnx吗? win10下怎么用DenseNet训练?

hiroi-sora commented 10 months ago

这个项目我不太了解,估计可能不行吧