为什么推理结果图和网盘图片不一样

fh2019ustc / DocTr

The official code for “DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction”, ACM MM, Oral Paper, 2021.

Other

345 stars 48 forks source link

Open awsssix opened 1 year ago

awsssix commented 1 year ago

使用百度网盘模型，运行inference.py得到几何矫正结果，为什么和网盘中Rectified_DocUNet_DocTr结果评估结果不一致，而且读取后图片元素也不相等

fh2019ustc commented 1 year ago

您好，我今天又确认一下，是没问题的。以下是的torch版本和cv2版本信息：

如果你还是复现不出来呢，我直接提供一个docker吧

awsssix commented 1 year ago

安装相同环境还是不一致，可以先提供一张docunet测试图吗，看一下测试图片是否相同

fh2019ustc commented 1 year ago

此外，是否需要我提供docker文件？您也可以邮件联系我，我再给你现场演示一下。

awsssix commented 1 year ago

download和docunet crop图片都相同，res不同(下载百度网盘预训练模型，执行python inference.py)，那辛苦提供一下docker文件

fh2019ustc commented 1 year ago

您好，这是docker文件链接：链接：https://pan.baidu.com/s/1Vaw0mnE60kEHHjgyXQTZ9w?pwd=9irc 提取码：9irc

另外，还请你check一下你的skimage库版本，我们上传云盘的版本用的是skimage库保存的图像，开源的代码用都是cv2保存图像（因为cv2比skimage快很多，中间更新过一次代码）。

awsssix commented 1 year ago

感谢，我再试试

awsssix commented 1 year ago

使用您提供的docker，运行如下命令

python inference.py --distorrted_path '0docunet_imgs/' --gsave_path './geo_rec_crop_cv2_docker/' test_imgs：'docunet/crop/1_1 copy.png'

还是不相同，有些像素相差1:

awsssix commented 1 year ago

不同的库读取方式可能相差1，但是用io还是False

fh2019ustc commented 1 year ago

有点意思了。你可以测一下这三个版本的性能吗（网盘的，cv2，skimage），我想看看区别。我们最近的ECCV paper你也可以做类似的对比，看看是不是也是不一样的 link。期待反馈~

awsssix commented 1 year ago

这三个版本的性能吗（网盘的，cv2，skimage），这个具体指什么呢？除了修改io保存，其他(模型、inference文件和代码)都是相同的吗，还有之前提供的结果是基于clone的repo、网盘下载的模型inference结果吗

fh2019ustc commented 1 year ago

因为在我这边是没问题的。所以我觉得你这几个版本的推理结果的performance应该没啥差别。你可以测测LD, SSIM, 以及OCR准确性。如果测了，可以给我一个反馈。