RapidAI / RapidOCR

📄 Awesome OCR multiple programing languages toolkits based on ONNXRuntime, OpenVINO and PaddlePaddle.
https://rapidai.github.io/RapidOCRDocs
Apache License 2.0
3.11k stars 370 forks source link

图片中较小的文字时,使用upscale再识别,有助于提升准确率 #249

Open SWHL opened 3 weeks ago

SWHL commented 3 weeks ago

另外用了这段时间发现对于手机电脑截屏、漫画、电影内嵌字幕这类图片中较小的文字时,使用upscale再识别准确率有提升(可以先裁剪再upscale)。不过这个自己去整合应用就行了,有兴趣提高准确率的人可以去试试看。例如实际应用漫画翻译manga-image-translator中的参数--upscaler {waifu2x,esrgan,4xultrasharp}。

210 电影字幕就是这种情况。

Originally posted by @nzm001 in https://github.com/RapidAI/RapidOCR/issues/223#issuecomment-2414650154

nissansz commented 6 days ago

一般pdf文档用300dpi,还是600识别准确率高?