fh2019ustc / DocTr

The official code for “DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction”, ACM MM, Oral Paper, 2021.
Other
345 stars 48 forks source link

为什么推理结果图和网盘图片不一样 #16

Open awsssix opened 1 year ago

awsssix commented 1 year ago

使用百度网盘模型,运行inference.py得到几何矫正结果,为什么和网盘中Rectified_DocUNet_DocTr结果评估结果不一致,而且读取后图片元素也不相等 图片

fh2019ustc commented 1 year ago

image

您好,我今天又确认一下,是没问题的。 以下是的torch版本和cv2版本信息: image

如果你还是复现不出来呢,我直接提供一个docker吧

awsssix commented 1 year ago

安装相同环境还是不一致,可以先提供一张docunet测试图吗,看一下测试图片是否相同

fh2019ustc commented 1 year ago

链接:https://pan.baidu.com/s/1M274U3TcqUZ3eYNIyWkHKg?pwd=jheh 提取码:jheh

此外,是否需要我提供docker文件?您也可以邮件联系我,我再给你现场演示一下。

awsssix commented 1 year ago

download和docunet crop图片都相同,res不同(下载百度网盘预训练模型,执行python inference.py),那辛苦提供一下docker文件

图片
fh2019ustc commented 1 year ago

您好,这是docker文件链接: 链接:https://pan.baidu.com/s/1Vaw0mnE60kEHHjgyXQTZ9w?pwd=9irc 提取码:9irc

另外,还请你check一下你的skimage库版本,我们上传云盘的版本用的是skimage库保存的图像, 开源的代码用都是cv2保存图像(因为cv2比skimage快很多,中间更新过一次代码)。 image image

awsssix commented 1 year ago

感谢,我再试试

awsssix commented 1 year ago

使用您提供的docker,运行如下命令

图片

python inference.py --distorrted_path '0docunet_imgs/' --gsave_path './geo_rec_crop_cv2_docker/' test_imgs:'docunet/crop/1_1 copy.png'

还是不相同,有些像素相差1:

图片
awsssix commented 1 year ago

图片 不同的库读取方式可能相差1,但是用io还是False

图片 图片
fh2019ustc commented 1 year ago

有点意思了。你可以测一下这三个版本的性能吗(网盘的,cv2,skimage),我想看看区别。 我们最近的ECCV paper你也可以做类似的对比,看看是不是也是不一样的 link。 期待反馈~

awsssix commented 1 year ago

这三个版本的性能吗(网盘的,cv2,skimage),这个具体指什么呢? 除了修改io保存,其他(模型、inference文件和代码)都是相同的吗,还有之前提供的结果是基于clone的repo、网盘下载的模型inference结果吗

fh2019ustc commented 1 year ago

因为在我这边是没问题的。所以我觉得你这几个版本的推理结果的performance应该没啥差别。你可以测测LD, SSIM, 以及OCR准确性。如果测了,可以给我一个反馈。