Open onlyJinx opened 1 year ago
mark, 这些看起来很清晰的图片内有玄机,识别不了
Train model with at least 50K captcha, you will get 99% Acc.
@pheman @marutichintan 用pytesseract的话正确率非常高,可能仅仅需要对验证码进行简单的OCR,但是ddddocr却做不到,或者说是ddddocr是对图片做了其他预处理再OCR反而产生了干扰?
这个图片好像就是黑色作为目标字体, 可以给图像做下处理
import matplotlib.pyplot as plt
import numpy as np
image_path = '215980454-7bca3a8f-ba8d-4cd2-9343-ced18ded98be.png'
mat = plt.imread(image_path)
ax1 = plt.subplot(121)
ax1.imshow(mat)
display(mat.shape)
# display(mat2)
# 过滤非字符黑色像素
mat3 = np.where(mat[:, :, 1] > 0.6, 1, 0)
display(mat3.shape)
# display(mat3)
ax2 = plt.subplot(122)
ax2.imshow(mat3, cmap='gray')
可以得到如下的效果
如图,图片来源于rarbg的人机验证,我获取了十张图,只有第0,7,8三张图识别正确,其余都错了,想问下这种怎么提高识别率?