- 浏览: 278735 次
文章分类
- 全部博客 (276)
- burp+hydra暴力破解 (1)
- kali linux工具集 (6)
- kali (59)
- linux (54)
- password (14)
- web (63)
- 渗透测试 (50)
- windows (40)
- metasploit (9)
- 信息收集 (32)
- burp suit (4)
- 安全审计 (9)
- https://github.com/secretsquirrel/the-backdoor-factory (0)
- nmap (4)
- arachni (2)
- 工具 (5)
- sql (3)
- 网络 (2)
- 后渗透测试 (10)
- 内网 (5)
- 无线 (2)
- C (3)
- bios (1)
- RoR (12)
- mongodb (1)
- linxu (1)
- gdb (1)
- linux,虚拟化 (1)
- python (4)
最新评论
参考:
http://code.google.com/p/tesseract-ocr/
https://stackoverflow.com/questions/2363490/limit-characters-tesseract-is-looking-for
http://resources.infosecinstitute.com/case-study-cracking-online-banking-captcha-login-using-python/
1. 安装:
2. 预先处理图片,代码片段:
3. 使用tesseract命令识别图片:
4. 限制Tesseract搜索的字符
1)在tessdata/configs文件夹中创建一个新的配置文件
2)在配置文件中添加如下:
3. 使用新建的配置文件调用tessdata命令。
5. 训练Tesseract识图能力
参考文章:
http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract2
http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3
http://code.google.com/p/tesseract-ocr/
https://stackoverflow.com/questions/2363490/limit-characters-tesseract-is-looking-for
http://resources.infosecinstitute.com/case-study-cracking-online-banking-captcha-login-using-python/
1. 安装:
apt-get install tesseract-ocr
2. 预先处理图片,代码片段:
from PIL import Image import os import time
def crack(cap_name): img = Image.open(cap_name+'.JPEG') img = img.convert("RGB") pixdata = img.load() for y in xrange(img.size[1]): for x in xrange(img.size[0]): if pixdata[x, y][0] < 90: pixdata[x, y] = (0, 0, 0, 255) for y in xrange(img.size[1]): for x in xrange(img.size[0]): if pixdata[x, y][1] < 136: pixdata[x, y] = (0, 0, 0, 255) for y in xrange(img.size[1]): for x in xrange(img.size[0]): if pixdata[x, y][2] > 0: pixdata[x, y] = (255, 255, 255, 255) ext = ".tif" img.save(cap_name + ext)
3. 使用tesseract命令识别图片:
tesseract imagename outbase [-l lang] [-psm N] [configfile ...]
引用
0 = Orientation and script detection (OSD) only.
1 = Automatic page segmentation with OSD.
2 = Automatic page segmentation, but no OSD, or OCR
3 = Fully automatic page segmentation, but no OSD. (Default)
4 = Assume a single column of text of variable sizes.
5 = Assume a single uniform block of vertically aligned text.
6 = Assume a single uniform block of text.
7 = Treat the image as a single text line.
8 = Treat the image as a single word.
9 = Treat the image as a single word in a circle.
10 = Treat the image as a single character.
1 = Automatic page segmentation with OSD.
2 = Automatic page segmentation, but no OSD, or OCR
3 = Fully automatic page segmentation, but no OSD. (Default)
4 = Assume a single column of text of variable sizes.
5 = Assume a single uniform block of vertically aligned text.
6 = Assume a single uniform block of text.
7 = Treat the image as a single text line.
8 = Treat the image as a single word.
9 = Treat the image as a single word in a circle.
10 = Treat the image as a single character.
4. 限制Tesseract搜索的字符
1)在tessdata/configs文件夹中创建一个新的配置文件
2)在配置文件中添加如下:
引用
tessedit_char_whitelist abcdefghijklmnopqrstuvwxyz
3. 使用新建的配置文件调用tessdata命令。
5. 训练Tesseract识图能力
参考文章:
http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract2
http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3
发表评论
-
kali 2.0 broadcom wifi connection
2015-12-12 16:28 418引用apt-get install -y linux-head ... -
kali2.0中国源
2015-09-27 01:42 424#中科大kali源 deb http://mirrors.us ... -
linux 安装scrapy
2015-09-07 13:06 569由于scrapy对python3支持不是很好,所以使用pyth ... -
nginx reverse proxy cofinguration
2015-08-28 15:18 397based on our case, we need to h ... -
wpscan
2015-08-01 10:39 406https://www.digitalocean.com/co ... -
arachni-web-ui使用
2015-06-10 01:04 2120最近在玩儿arachni,想试试arachni-ui-web, ... -
linux dd命令
2015-06-06 14:29 347dd if=/dev/hda of=disk.mbr coun ... -
HACKING NODEJS AND MONGODB
2015-06-04 23:52 314http://blog.websecurify.com/201 ... -
php object inject
2015-05-29 00:45 318解释: http://securitycafe.ro/2015 ... -
[转]Forcing XXE Reflection through Server Error Messages
2015-05-19 01:10 417原文地址:https://blog.netspi.com/fo ... -
CVE-2011-2461
2015-03-31 01:19 391http://blog.nibblesec.org/2015/ ... -
[译]从配置错误的web server中dump git数据
2015-03-26 01:07 541原文地址:https://blog.netspi.com/du ... -
[转]Microsoft Access sqli
2015-03-18 00:57 405https://milo2012.wordpress.com/ ... -
[转]sqlmap注入Microsoft Access
2015-03-18 00:49 1558https://github.com/sqlmapprojec ... -
Wine中使用MinGW
2015-03-17 00:49 627原文:http://null-byte.wonderhowto ... -
crossdomain.xml
2015-03-12 01:23 623参考: https://hackerone.com/repor ... -
[译]使用wireshark解密TLS浏览器流量
2015-03-12 00:57 4032原文地址:https://jimshaver.net/2015 ... -
xxe方法
2015-02-01 18:32 820原文地址:http://www.christian-schne ... -
owasp zed--Web Sockets
2015-01-31 01:16 612http://digi.ninja/blog/zap_web_ ... -
memcached
2015-01-25 01:56 0http://www.sensepost.com/blog/4 ...
相关推荐
python利用Tesseract识别验证码的方法示例
tesseractOCR 验证码解析组件~
Lab3 基于Python图像处理与Tesseract识别验证码.zip
做自动化的时候,经常需要识别验证码,此文过tesseract识别登录验证码
node-tesseract demo用 node.js 调用 node-tesseract 和 graphicsmagick 包实现验证码识别安装npm install gmnpm install node-tesseract 执行执行 node index 即可看到结果。相关文章
C#调用Tesseract3.0.2识别验证码所需要的组件,包括引用的一些DLL,以及字符识别包
本篇文章主要介绍了Python+Selenium+PIL+Tesseract自动识别验证码进行一键登录,具有一定的参考价值,有兴趣的可以了解下
tesseract-ocr 验证码识别 32位 最新版 4.1 tesseract-ocr 验证码识别 32位 最新版 4.1 tesseract-ocr 验证码识别 32位 最新版 4.1 tesseract-ocr 验证码识别 32位 最新版 4.1
tesseract.net 4.0 配英文识别库 eng.traineddata osd.traineddata 实现内存图像bitmap的直接识别,无需保存成图片再识别 增加 中值法去噪点 颜色反转 去杂点 二值化 灰度处理 等简单的图像处理 对简单的验证码识别...
资源包括Java代码以及引用包、tesseract安装包和使用说明
4. 如果出现input source noset情况,原因是我的test类下的图片放在了E:\workspace\tesseract\second_test.png。自己在这个目录下建一个就这样的图片就可以了。 5. 当然拥有Jmeter就不需要经过第4步了。
使用tesseract工具,进行orc光学字符,识别文字及登陆验证码。
利用tesseract-ocr3.01识别验证码
无论是是自动化登录还是爬虫,总绕不开验证码,这次就来谈谈python中光学识别验证码模块tesserocr和pytesseract。tesserocr和pytesseract是Python的一个OCR识别库,但其实是对tesseract做的一层Python API封装,...
主要介绍了Python实现基于PIL和tesseract的验证码识别功能,结合实例形式分析了Python使用PIL与tesseract进行验证码识别操作的具体技巧与相关注意事项,需要的朋友可以参考下
JAVA智能验证码识别,可训练提高识别率,带干扰线的也可以识别到,绝对可用
验证码识别,tesseract-ocr-setup-3.02.02.exe和pytesseract用于验证码识别
python 20、爬虫 10-1_分布式爬虫案例、机器视觉与tesseract、验证码识别_Day10_am.mp4
tesseract-ocr 验证码识别 64位 最新版 4.1 tesseract-ocr 验证码识别 64位 最新版 4.1 tesseract-ocr 验证码识别 64位 最新版 4.1
本资源是图像识别内含源码和环境搭建教程,模型识别准确率高,可以直接运行,创作不易欢迎交流学习