PaddlePaddle / Paddle

PArallel Distributed Deep LEarning: Machine Learning Framework from Industrial Practice (『飞桨』核心框架,深度学习&机器学习高性能单机、分布式训练和跨平台部署)
http://www.paddlepaddle.org/
Apache License 2.0
21.79k stars 5.47k forks source link

发票关键信息抽取.md #64164

Open greatliu opened 1 month ago

greatliu commented 1 month ago

文档链接&描述 Document Links & Description

这个案例中的多次提到的 fapiao/ser_vi_layoutxlm.yml 这个yml文件能给个链接吗?一直没找到下载。 我按照4.3.2训练说明修改的yml总是各种报错。好像这个案例有些老了,各种版本不匹配。

请提出你的建议 Please give your suggestion

No response

zhiboniu commented 1 month ago

请问这里说的是哪个案例?

greatliu commented 1 month ago

请问这里说的是哪个案例?

https://github.com/PaddlePaddle/PaddleOCR/blob/main/applications/%E5%8F%91%E7%A5%A8%E5%85%B3%E9%94%AE%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96.md 这个案例。

里面除去训练,其他都给了代码,而且用的都是同一个re_vi_layoutxlm.yml。这个yml没给出。 我找到了预训练模型,那个包里也没这个yml文件。我只能用案例中“4.3.2 开始训练”中修改的训练yml跑预测,总是报各种错。

所以,能给个对应预训练模型预测用的re_vi_layoutxlm.yml吗? 刚开始用paddle,懂的有限,谢谢。

zhiboniu commented 1 month ago

你用的4.3.2中的yml是对的,命令中的re_vi_layoutxlm.yml只是示例名称,教程中明确说了在给出的yml上根据你的数据修改配置就可以了。报错可能是有其他问题。paddleocr的具体报错问题可以在paddleocr repo的issue中继续提问。

greatliu commented 1 month ago

好的。我现在问题是各种跑不通,查issue知道应该是版本问题,但换过几个版本,只是报错变了。 我觉得应该是这个md文件太老了,能不能给更新一下啊,现在各组件版本都更迭很多次了。