FudanVI / FudanOCR

A toolbox of scene text super-resolution and recognition
361 stars 61 forks source link

测试过程中的YOUR_MODEL应该是什么,请举个例子 #12

Open zhuxyme opened 3 years ago

zhuxyme commented 3 years ago

CUDA_VISIBLE_DEVICES=GPU_NUM python main.py --batch_size=16 --STN --exp_name EXP_NAME --text_focus --resume YOUR_MODEL --test --test_data_dir ./dataset/mydata/test 作者您好,请问这个YOUR_MODEL 具体应该填啥,我试了很多次都没有成功运行

JingyeChen commented 3 years ago

YOUR_MODEL 是预训练模型的绝对路径

zhuxyme commented 3 years ago

谢谢大佬! 我用你给出的模型进行测试,easy,medium,hard在CRNN下的识别率分别为0.5738,0.4564,0.347,和你论文中的有些不同。psnr和ssim也比你论文中的低一些。 ![Uploading 屏幕截图 2021-09-09 111219.jpg…]()

JingyeChen commented 3 years ago

详见 issue #11 ,你可以看一下依赖库的版本是否正确,另外你可以看一下readme里上传的log文件

zhuxyme commented 3 years ago

谢谢。 请问可以将ASTER和MORAN方式进行recognize的代码和模型也提供一下吗,我们准备引用你们的文章

JingyeChen commented 3 years ago

感谢引用我们的工作 ASTER与MORAN的模型文件与代码在以下链接可以找到 https://github.com/ayumiymk/aster.pytorch https://github.com/Canjie-Luo/MORAN_v2 我们是写脚本测试的,即训练完TBSRN后将生成的图片打包成lmdb,再送到这两个识别模型测试识别结果

Lz-2019317 commented 3 years ago

感谢引用我们的工作 ASTER与MORAN的模型文件与代码在以下链接可以找到 https://github.com/ayumiymk/aster.pytorch https://github.com/Canjie-Luo/MORAN_v2 我们是写脚本测试的,即训练完TBSRN后将生成的图片打包成lmdb,再送到这两个识别模型测试识别结果

那怎么输出生成的图片

JingyeChen commented 3 years ago

super_resolution.py的第268行代码

images_lr = images_lr.to(self.device) images_hr = images_hr.to(self.device) sr_beigin = time.time() images_sr = model(images_lr) 你需要可视化的话,把images_sr先转成PIL格式,再使用save函数保存到相应路径即可

最近事情比较多,没来得及更新,你可以先尝试一下 :D

zhuxyme commented 3 years ago

感谢引用我们的工作 ASTER与MORAN的模型文件与代码在以下链接可以找到 https://github.com/ayumiymk/aster.pytorch https://github.com/Canjie-Luo/MORAN_v2 我们是写脚本测试的,即训练完TBSRN后将生成的图片打包成lmdb,再送到这两个识别模型测试识别结果

那怎么输出生成的图片

请问可以提供测试图片对应的label吗。我自己将生成的图片转换成了mdb,但是没有对应的标签

JingyeChen commented 3 years ago

您指的是TextZoom的测试图片嘛 TextZoom测试部分的lmdb数据集已经包含图片的label的

kanika02 commented 3 years ago

感谢引用我们的工作 ASTER与MORAN的模型文件与代码在以下链接可以找到 https://github.com/ayumiymk/aster.pytorch https://github.com/Canjie-Luo/MORAN_v2 我们是写脚本测试的,即训练完TBSRN后将生成的图片打包成lmdb,再送到这两个识别模型测试识别结果

那怎么输出生成的图片

嘿,你得到输出图像了吗?请帮助我使用该代码生成输出图像。