-
https://github.com/PaddlePaddle/PaddleSlim/tree/develop/example/auto_compression/ocr
该方案更换ICDAR2015数据集,采用预训练ResNet50模型(更改模型配置即可)可以成功运行,其精度基本不变,速度减少为1/4,获得Inference模型。此时的模型在转为ONNX时报错,缺少量化配置文件(cali…
-
### Description of the bug | 错误描述
对于一个图片型pdf, 一页中间有表格也有文字的.
minerU 把表格提取成了图片, 却遗漏了表格中间的文字.
效果截图(线上demo)
![lQLPKIIQ0YeosD_NA4bNBx2wdJxHAVSnnQoGn0Eea-_RAA_1821_902](https://github.com/user-attachmen…
-
The current implementation extracts the ReadingOrder from the top-level parents of all `WORD` blocks (in the order of these word blocks). This seems to be necessary for cases with `TABLE` results.
…
-
从 MinerU 的底层代码来看,似乎每一页 PDF 都是一个独立的处理单元,使用简单的 for-loop 依次处理,不存在拼页凑 block 的步骤。
未来是否考虑加入并行处理的机制,分页后根据资源情况同时处理不同的页对象。最后再按照 page_index 拼接。
理论上可行,但我看了下调用和加载模型的逻辑,不管是协程,多线程还是多进程,在调用 paddle 模型的时候都会有问题。
…
-
训练训练自己的数据报错:
File "/root/miniconda/envs/d2/lib/python3.7/site-packages/mmdet/models/detectors/base.py", line 181, in forward
return self.forward_train(img, img_metas, **kwargs)
File "/roo…
-
Hi @NielsRogge, thank you for your recent [notebook](https://github.com/NielsRogge/Transformers-Tutorials/blob/master/Table%20Transformer/Inference_with_Table_Transformer_(TATR)_for_parsing_tables.ipy…
-
*********************************************
温馨提示:根据社区不完全统计,按照模板提问,可以加快回复和解决问题的速度
*********************************************
## 环境
- 【FastDeploy版本】: 自行编译FastDeploy SDK 的Csharp API接口
- 【编译…
-
### Description of the bug | 错误描述
pip install -U magic-pdf[full] --extra-index-url https://wheels.myhloli.com 按照这个文档上的安装,安装出来的版本是0.6.1, 我理解应该是0.7.1 才对。
使用的是python:3.10的docker镜像里运行的。
### How to r…
-
Traceback (most recent call last):
File "/opt/anaconda3/envs/Hyper-Table-Recognition/lib/python3.6/runpy.py", line 193, in _run_module_as_main
"__main__", mod_spec)
File "/opt/anaconda3/env…
-
Thanks a lot for your excellent job. I wonder how you evaluate the trained model, do you use ./scripts/more/eval/pope.sh, which uses llava.eval.model_vqa_loader for evaluation (seems no modification f…