personqianduixue / comap_crawler_2023

美赛爬虫,2022美赛获奖证书爬虫,2023美赛获奖证书爬虫,2024美赛获奖证书爬虫
45 stars 6 forks source link

pdf2text.py运行结果返回为空 #2

Open Master286 opened 1 year ago

Master286 commented 1 year ago

请问作者我这pdf2text.py文件运行后,tesseract OCR扫描结果似乎都是空的 请问这是什么情况造成的呀 image tesseractocr都没经过训练 image

personqianduixue commented 1 year ago

可能是版本问题?不过我已经爬完了,你只需要运行analysis.ipynb分析你自己的数据即可