小伙伴们平时登录各种网站看着各种各样的验证码,是不是会好奇到底是怎么实现的呢?

实际上呢里面用到了很多OCR识别的概念,TJ君之前看到一个不错的项目,浅显易懂,那么今天TJ君就要和大家来分享这个Python通用验证码识别模块,SDK免费开源版,带带弟弟,也称ddddocr

非常有趣的名字,目前呢ddddocr已经更新到了1.4.3版本。

ddddocr是由sml2h3开发的专为验证码厂商进行对自家新版本验证码难易强度进行验证的一个python库,其通过大批量生成随机数据后进行深度网络训练,本身并非针对任何一家验证码厂商而制作。

ddddocr奉行着开箱即用、最简依赖的理念,尽量减少用户的配置和使用成本,争取让每一个小伙伴都用的舒适。

从1.2.0版本开始,ddddocr的识别部分进行了一次beta更新,主要更新在于网络结构主体的升级,其训练数据并没有发生过多的改变,所以理论上在识别结果上,原先可能识别效果的很好的图形在1.2.0上有一小部分概率会有一定程度的下降,也有可能原本识别不好的图形在1.2.0之后效果却变得特别好。不过OCR识别嘛,TJ君一直觉得有点玄学的影子在里面。

1f9d20862c0e2fa6a445a35a73acab27.png

然后在1.3.0版本中,ddddocr增加了目标检测部分, 目标检测部分同样也是由大量随机合成数据训练而成,对于现在已有的点选验证码图片或者未知的验证码图片都有可能具备一定的识别能力,适用于文字点选和图标点选。简单来说,对于点选类的验证码,可以快速的检测出图片上的文字或者图标。

f53410b3d46eb2c25cf2dd26962ab2c8.png

等到了1.4.0版本,又新增了两种滑块识别算法,算法非深度神经网络实现,仅使用opencv和PIL完成。实现了拖来拽一些图片模块的实现。

4bcd1f41da2ba14065b1469652cad98d.png

然后就是目前最新的1.4.3版本,这个版本升级的主要原因是为了dddd_trainer 的开源进行适配,使dddd_trainer 训练出的模型可以直接无缝导入到ddddocr里面来使用。

对验证码感兴趣的小伙伴,不妨来试一试哦:

另外,我们将之前发过的各种项目及工具进行了整理,收录到了GitHub项目,欢迎各位小伙伴光临Star,地址如下:https://github.com/Wechat-TJ/TJ-WORLD-FORU

点击下方卡片,关注公众号“TJ君

回复“dddd2022”,获取仓库地址

关注我,每天了解一个牛x、好用、有趣的东东

往期推荐

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐