PaddlePaddle / PaddleOCR

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)
https://paddlepaddle.github.io/PaddleOCR/
Apache License 2.0
44.6k stars 7.85k forks source link

PP-Structure 加载其他模型 #7975

Closed JackMeiLong closed 1 year ago

JackMeiLong commented 2 years ago
image

你好,基于PP-Structure 和layout parser 进行版面分析,如何加载其他模型?比如 picodet_lcnet_x1_0_fgd_layout_cdla, model = lp.PaddleDetectionLayoutModel(model_path="./picodet_lcnet_x1_0_fgd_layout_cdla/",...) 通过这种方式加载本地模型,报错显示 Cannot open file ./picodet_lcnet_x1_0_fgd_layout_cdla/inference.pdmodel,求解答

an1018 commented 2 years ago

V2版本不再使用lp.*,目前有2种方式, 1)下载PaddleDetection代码,参考这个文档进行推理 2)使用paddllocr whl包预测

JackMeiLong commented 2 years ago

你好 使用paddleocr whl 包预测, 针对 版面分析, 如何在原图上绘制关键区域,如文字、标题、表格、图片等?

image
an1018 commented 2 years ago

重新安装paddleocr whl包,运行代码,可视化结果会存储在save_folder子文件夹内

LeonWang91 commented 1 year ago

想请问可以使用CDLA的预训练模型直接去运行版面分析测试的命令吗,我也报了上面类似的错误 错误如下:

image

命令如下: python3 tools/infer.py -c configs/picodet/legacy_model/application/layout_analysis/picodet_lcnet_x1_0_layout.yml --slim_config configs/picodet/legacy_model/application/layout_analysis/picodet_lcnet_x2_5_layout.yml -o weights='/data_1/wangl/LeiWang/Projects/PaddleOCR/pretrained_model/picodet_lcnet_x1_0_fgd_layout_cdla.pdparams' --infer_img='/data_1/wangl/LeiWang/Projects/PaddleOCR/dataset/1.jpg' --output_dir=/data_1/wangl/LeiWang/Projects/PaddleOCR/output/ --draw_threshold=0.5

我只替换了weights的内容,没有更改配置文件,好像也没有找到CDLA的配置文件