[原创][原创]卷起来,通用验证码识别python库开源

发表于: 2022-1-4 14:35 7027

[原创][原创]卷起来,通用验证码识别python库开源

sml2h3

2022-1-4 14:35

7027

带带弟弟OCR通用验证码识别SDK免费开源版

今天ddddocr又更新啦！

当前版本为1.3.1

想必很多做验证码的新手，一定头疼碰到点选类型的图像，做样本费时费力，神经网络不会写，训练设备太昂贵，模型效果又不好。

市场上常见的点选类验证码图片如下图所示

Test

那么今天，他来了，ddddocr带着重磅更新大摇大摆的走来了。

简介

ddddocr是由sml2h3开发的专为验证码厂商进行对自家新版本验证码难易强度进行验证的一个python库，其由作者与kerlomz共同合作完成，通过大批量生成随机数据后进行深度网络训练，本身并非针对任何一家验证码厂商而制作，本库使用效果完全靠玄学，可能可以识别，可能不能识别。

ddddocr奉行着开箱即用、最简依赖的理念，尽量减少用户的配置和使用成本，希望给每一位测试者带来舒适的体验

项目地址：点我传送

更新说明

本次更新其实分为两部分，其中有一部分是在1.2.0版本就已经更新了，但是在这里还是有必要提一下的。

第一部分 OCR识别部分

在1.2.0开始，ddddocr的识别部分进行了一次beta更新，主要更新在于网络结构主体的升级，其训练数据并没有发生过多的改变，所以理论上在识别结果上，原先可能识别效果的很好的图形在1.2.0上有一小部分概率会有一定程度的下降，也有可能原本识别不好的图形在1.2.0之后效果却变得特别好。
测试代码：

import ddddocr
 
ocr = ddddocr.DdddOcr()
 
with open("test.jpg", 'rb') as f:
    image = f.read()
 
res = ocr.classification(image)
print(res)

由于事实上确实在一些图片上老版本的模型识别效果比新模型好，特地这次更新把老模型也加入进去了，通过在初始化ddddocr的时候使用old参数即可快速切换老模型

import ddddocr
 
ocr = ddddocr.DdddOcr(old=True)
 
with open("test.jpg", 'rb') as f:
    image = f.read()
 
res = ocr.classification(image)
print(res)

OCR部分应该已经有很多人做了测试，在这里就放一部分网友的测试图片。

Test
Test
Test
Test
Test
Test
Test
Test
Test
Test
Test
Test
等等更多图片等你测试哟~

第二部分目标检测部分

在本次1.3.0的更新中，目标检测部分隆重登场！
目标检测部分同样也是由大量随机合成数据训练而成，对于现在已有的点选验证码图片或者未知的验证码图片都有可能具备一定的识别能力，适用于文字点选和图标点选。
简单来说，对于点选类的验证码，可以快速的检测出图片上的文字或者图标。

import ddddocr
import cv2
 
det = ddddocr.DdddOcr(det=True)
 
with open("test.jpg", 'rb') as f:
    image = f.read()
 
poses = det.detection(image)
print(poses)
 
im = cv2.imread("test.jpg")
 
for box in poses:
    x1, y1, x2, y2 = box
    im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)
 
cv2.imwrite("result.jpg", im)

举些例子：

Test
Test
Test
Test
Test
Test
Test

以上只是目前我能找到的点选验证码图片，做了一个简单的测试。

安装

环境支持

python <= 3.9

Windows/Linux/Macos..

暂时不支持Macbook M1(X)，M1(X)用户需要自己编译onnxruntime才可以使用

安装命令

pip install ddddocr

以上命令将自动安装符合自己电脑环境的最新ddddocr

交流群（加我好友拉你进群）

Test

[培训]内核驱动高级班，冲击BAT一流互联网大厂工作，每周日13:00-18:00直播授课

收藏・14

免费・5

支持

最新回复 (6)
0xEA 雪币： 3098 活跃值： (4222) 能力值： ( LV2，RANK：10 ) 在线值：发帖 4 回帖 88 粉丝 1 关注私信	0xEA 2 楼 nb 2022-1-8 14:20 0
obaby 雪币： 14983 活跃值： (5290) 能力值： ( LV15，RANK：880 ) 在线值：发帖 53 回帖 646 粉丝 82 关注私信	obaby 20 3 楼这个厉害~~膜拜 2022-1-8 14:45 0
gamehack 雪币： 6209 活跃值： (5645) 能力值： ( LV5，RANK：65 ) 在线值：发帖 5 回帖 430 粉丝 18 关注私信	gamehack 4 楼看起来很牛B,感谢分享! 2022-1-8 14:46 0
严启真雪币： 9613 活跃值： (1670) 能力值： ( LV2，RANK：15 ) 在线值：发帖 4 回帖 214 粉丝 2 关注私信	严启真 5 楼兄弟，一句话，免费不? 2022-1-9 09:14 0
sml2h3 雪币： 69 活跃值： (249) 能力值： ( LV2，RANK：10 ) 在线值：发帖 1 回帖 2 粉丝 2 关注私信	sml2h3 6 楼严启真兄弟，一句话，免费不? 那指定免费啊 2022-2-27 14:10 0
夜的静night 雪币： 786 活跃值： (1621) 能力值： ( LV2，RANK：10 ) 在线值：发帖 3 回帖 76 粉丝 1 关注私信	夜的静night 7 楼 server2012 上部署总是提示CV模块不存在有没有好办法。 2022-2-27 16:07 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

sml2h3

发帖

回帖

RANK

关注

私信

他的文章

[原创][原创]卷起来,通用验证码识别python库开源 7028

关于我们

联系我们

企业服务

看雪公众号

最新回复 (6)
0xEA 雪币： 3098 活跃值： (4222) 能力值： ( LV2，RANK：10 ) 在线值：发帖 4 回帖 88 粉丝 1 关注私信	0xEA 2 楼 nb 2022-1-8 14:20 0
obaby 雪币： 14983 活跃值： (5290) 能力值： ( LV15，RANK：880 ) 在线值：发帖 53 回帖 646 粉丝 82 关注私信	obaby 20 3 楼这个厉害~~膜拜 2022-1-8 14:45 0
gamehack 雪币： 6209 活跃值： (5645) 能力值： ( LV5，RANK：65 ) 在线值：发帖 5 回帖 430 粉丝 18 关注私信	gamehack 4 楼看起来很牛B,感谢分享! 2022-1-8 14:46 0
严启真雪币： 9613 活跃值： (1670) 能力值： ( LV2，RANK：15 ) 在线值：发帖 4 回帖 214 粉丝 2 关注私信	严启真 5 楼兄弟，一句话，免费不? 2022-1-9 09:14 0
sml2h3 雪币： 69 活跃值： (249) 能力值： ( LV2，RANK：10 ) 在线值：发帖 1 回帖 2 粉丝 2 关注私信	sml2h3 6 楼严启真兄弟，一句话，免费不? 那指定免费啊 2022-2-27 14:10 0
夜的静night 雪币： 786 活跃值： (1621) 能力值： ( LV2，RANK：10 ) 在线值：发帖 3 回帖 76 粉丝 1 关注私信	夜的静night 7 楼 server2012 上部署总是提示CV模块不存在有没有好办法。 2022-2-27 16:07 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复