sml2h3 / ddddocr

带带弟弟 通用验证码识别OCR pypi版
https://ddddocr.com
MIT License
9.17k stars 1.67k forks source link

识别效果不好的图收集 #24

Closed sml2h3 closed 1 year ago

sml2h3 commented 2 years ago

在这里可以把你觉得识别效果不好的图片发在这里。 希望贴3张以上原图,可以包含原图链接。

progromyang commented 2 years ago

Dumped MEM_05D5A128_00000E80 APS7N5TXGLE`E${`P~IHPAQ

xiaozhan0806 commented 2 years ago

b8e4a5b3-8fbd-484c-9c12-f4a7fd0e871b 3f944e6c-c161-455d-81e0-47356f912c44

xiaozhan0806 commented 2 years ago

麻烦看看这个地址的验证码,谢谢 https://cas.jdair.net/captcha.htm?.tmp=0.6527627102557132

xiaozhan0806 commented 2 years ago

还有这个中文的,谢谢https://www.tianjin-air.com/air/api/uc/v1/profile/profile/authenticaiton/captchas

xiaozhan0806 commented 2 years ago

QQ图片20220106134055

dongchengtao commented 2 years ago

image image image 这个地址 http://biguo100.com/core/Code.asp?rd=5a7TS4GzwK 感谢

void285 commented 2 years ago

这一批目前识别的正确率应该低于10%,不知能否改善? 一共46个,已用正确的验证码命名,不过人眼识别率也不高,命名可能不正确。 captchar-alphs.zip

预览样品: XQWR CXDT WFHN

TokimekiMemorial commented 2 years ago

这批验证码成功率只有50%上下,不知道能否改善,感谢大佬 img.zip

jager-Man commented 2 years ago

4 1 2 3 识别位数为5位或者错误

ewwerpm commented 2 years ago

大佬,用ocr = ddddocr.DdddOcr(old=True) 识别率80%,用ocr = ddddocr.DdddOcr() ,识别率只有45%。如何提高识别率啊?

链接:https://pan.baidu.com/s/1kJdt6hvXciY7yJJCE78OPw 提取码:clog

ewwerpm commented 2 years ago

我识别不出来的原因,大部分是被验证码前面的干扰线迷惑了。多加了个字母或数字,导致结果不对

ewwerpm commented 2 years ago

图片

Hecate2 commented 2 years ago

https://www.internationalsaimoe.com/captcha

Ecalose commented 2 years ago

中文字符的识别率貌似并不高 misc (1) misc misc

benson-singapore commented 2 years ago

vietcombank_202202251144224363924510 vietcombank_202202251145099399686812 vietcombank_202202251216007130383806 vietcombank_202202251216256205062854 vietcombank_202202251217463492377106 vietcombank_202202251218097504958420

haha-chen commented 2 years ago

getVerify1 getVerify2 getVerify3 verify_code verify_code2 谢谢大佬

vD1S commented 2 years ago

这种验证码百分百失败,都是返回单字母 d

15-43-43 15-43-07 15-43-16 15-43-21 15-43-29 15-43-34 15-43-40 15-44-07 15-44-13 15-44-18 15-44-25 15-44-34

echo918 commented 2 years ago

image code code 感谢大佬。

HeartBlade commented 2 years ago

3 http://app.stbjy.cn/xsesc/checkcode.asp?t=1650332028605

6029识别成60Z9 PS:能否指定识别的字符内容?比如只识别数字

s348268281 commented 2 years ago

2022-04-20 PMBR识别成pmsr image

S-kewen commented 2 years ago

https://ptlogin.4399.com/ptlogin/captcha.do?captchaId=11

希望能出一个教程,可以自己训练自己的model(针对开发者)

petitchamp commented 2 years ago

您好, 我遇到一个需要区分大小写的验证码,成功率不高,有时候比较明显的大小写,比如大写Q会识别成q,A识别成a

有时候还会识别出中文

captcha1 captcha captcha3 captcha cfPf5

kerlomz commented 2 years ago

您好, 我遇到一个需要区分大小写的验证码,成功率不高,有时候比较明显的大小写,比如大写Q会识别成q,A识别成a

有时候还会识别出中文

captcha1 captcha captcha3 captcha cfPf5

ddddocr目前的训练样本没有区分大小写,建议采集标注样本发给作者以后集成进去

kerlomz commented 2 years ago

您好, 我遇到一个需要区分大小写的验证码,成功率不高,有时候比较明显的大小写,比如大写Q会识别成q,A识别成a

有时候还会识别出中文

captcha1 captcha captcha3 captcha cfPf5

或者附上原图的链接,方便作者采集

kerlomz commented 2 years ago

这种验证码百分百失败,都是返回单字母 d

15-43-43 15-43-07 15-43-16 15-43-21 15-43-29 15-43-34 15-43-40 15-44-07 15-44-13 15-44-18 15-44-25 15-44-34

图片是透明的话,自己添加一个白色背景即可

bluesky2030 commented 2 years ago

百分之99失败,地址 https://bbs.6994.cn/misc.php?mod=seccode&update=28965&idhash=cSi9aaw6

zys645 commented 2 years ago

https://account.hpool.in/api/user/verificationcode?session=inKmowPdCkvBsvvBCzqbJdN0WDc4GrMA 这个失败率很高

286844626 commented 2 years ago

可以支持识别符号么 链接:https://pan.baidu.com/s/1FGr06CLOrTT62Py2pvdw8w 提取码:59ix 1 2 0

doyoman commented 2 years ago

第一张图使用old模型可以识别,其余图全部识别错误;使用新模型以下图全部识别不出来 1 2 3 4 5 6 7 8 9

ewwerpm commented 2 years ago

我用dddd识别,识别率只有80%。 用我自己的模型,识别率达到99.6%。 如果大家 有兴趣,可以把图片发给我,我帮你们训练识别。1437399109@qq.com

ewwerpm commented 2 years ago

第一张图使用old模型可以识别,其余图全部识别错误;使用新模型以下图全部识别不出来 1 2 3 4 5 6 7 8 9

我用dddd识别,识别率只有80%。 用我自己的模型,识别率达到99.6%。 如果大家 有兴趣,可以把图片发给我,我帮你们训练识别。1437399109@qq.com

Dragon-qing commented 1 year ago

agzc dhdx cyph rxyc xxec

RyanLoil commented 1 year ago
1 2 3 4 5 6

主要是运算符和问号识别错了

sml2h3 commented 1 year ago

麻烦看看这个地址的验证码,谢谢 https://cas.jdair.net/captcha.htm?.tmp=0.6527627102557132

这个没法打开

mddon2010 commented 10 months ago

1 3 2

https://macaoapply.singlewindow.gd.cn/#/user/userLogin

不能準確地分析大小寫

lsylsy2 commented 6 months ago

1696834806 3301 1696834810 2289 1696834981 0421 1696904886 1619 1696916390 842 1696904893 4168 对有1/7/4的验证码准确度都偏低

inertance commented 5 months ago

from io import BytesIO import ddddocr import requests from PIL import Image

CAPTCHA_URL = "https://m.ghzq.com.cn/pro/ImageServlet?key="

s = requests.session() s.headers = { "Accept": "application/json, text/plain, /", "Accept-Encoding": "gzip, deflate, br", "Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8", "Connection": "keep-alive", "Content-Type": "application/x-www-form-urlencoded;charset=UTF-8", "Host": "m.ghzq.com.cn", "Origin": "https://jy.ghzq.com.cn", "Referer": "https://jy.ghzq.com.cn/", "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Safari/537.36" }

vcode = s.post("https://m.ghzq.com.cn/pro/ESBServlet?command=tradeapi.getcodekey").json() key = vcode["key"] captcha_url = CAPTCHA_URL + key captcha_bytes = s.get(captcha_url).content captcha_img = Image.open(BytesIO(captcha_bytes)) captcha_img.show()

orc = ddddocr.DdddOcr(beta=True) captcha_num = orc.classification(captcha_img) print(captcha_num) 识别不出运算符号

Ronghefeng commented 3 months ago

055 083 098 这类图片,因为存在中文,或者运算符导致无法正确识别,识别率几乎为0