Datasets - Githubissues

FudanVI / benchmarking-chinese-text-recognition

This repository contains datasets and baselines for benchmarking Chinese text recognition.

MIT License

439 stars 53 forks source link

Open lyc728 opened 2 years ago

lyc728 commented 2 years ago

你好，制作的lmdb数据加载只能加载一个文件吗？我数据集分布很杂，在多个文件夹下，不好合并，有没有好的办法，谢谢!

JingyeChen commented 2 years ago

您好，可以使用这个API torch.utils.data.ConcatDataset([dataset1, dataset2, ...])

lyc728 commented 2 years ago

text_input[i][j + 1] = alp2num[label[i][j]]

KeyError: '₂' 这个报错是什么情况呢？

hyangyu commented 2 years ago

text_input[i][j + 1] = alp2num[label[i][j]]
KeyError: '₂' 这个报错是什么情况呢？

您好，您使用的额外的数据么？如果您使用的是额外的数据集进行的测试，那么是您测试的数据集中的该字符不在我们benchmark统计的alphabet中。

lyc728 commented 2 years ago

有没有办法直接跳过这张图片对应字符

JingyeChen commented 2 years ago

可以的，请在lmdbDataset类修改，感谢您

lyc728 commented 2 years ago

你好，为什么训练1个epoch花了21分钟，验证花了1个小时44分钟，是进行写入记录错误的行文本导致耗时久吗？可以优化吗？

hyangyu commented 2 years ago

你好，为什么训练1个epoch花了21分钟，验证花了1个小时44分钟，是进行写入记录错误的行文本导致耗时久吗？可以优化吗？

训练的时候是并行的，但是测试是串行的；且中文数据集上平均长度较长。所以验证阶段的耗时较长。

lyc728 commented 2 years ago

这个感觉训练1周都训不完，得优化一下啊大哥

lyc728 commented 2 years ago

你好，关于你说的除了输出准确度，还有编辑距离，但是代码中并没有体现