http://code.google.com/p/tesseract-ocr/downloads/detail?name=chi_sim.traineddata.gz
- 浏览: 149920 次
- 性别:
- 来自: 五指山
最新评论
-
dengdonglin888:
qq_30221445 写道你好 请问这种数据能解吗 < ...
Simple XML -
qq_30221445:
你好 请问这种数据能解吗 <request> ...
Simple XML -
画个逗号给明天qu:
画个逗号给明天qu 写道
Android上传文件到服务器 -
画个逗号给明天qu:
...
Android上传文件到服务器 -
alranger:
我在jsp页面加上这一段代码后,问题还是存在。
解决Ext在ie9报错:不支持extjs对象的“createContextualFragment属性或方法”
相关推荐
基于Tesseract-OCR实现自动扫描识别手机号.zip,基于Tesseract-OCR实现自动扫描识别手机号
支持androidx。旧版在1.0分支。 训练数据放在res/raw目录下,需要识别其他语言可另行下载替换。...(可以手动调节大小的扫描框) 数字识别对于手写体识别效率不高,主要是训练包问题。有需求可自行训练。
中文语言包包含了汉字的识别数据,使得Tesseract-OCR能够准确地识别中文文本。 以下是对Tesseract-OCR安装包和中文语言包下载资源的描述: Tesseract-OCR是一个功能强大的开源OCR工具,它支持100多种语言的文字识别...
Android 基于Tesseract-OCR实现自动扫描识别手机号
图像识别 iOS,Tesseract-OCR-iOS githut代码。ORC(Optical character recognition)技术是指代用机器或电子的方式将扫描的图片,照片或手写输入转换为机器编码的文字. 课题本身是一个很研究性的课题,包含着很多如...
光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。OCR技术非常专业,一般多是印刷、打印行业的从业人员使用,可以快速的将纸质资料...
光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程. Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内...
OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程。对于图形验证码来说,它们都是一些不规则的字符,这些字符确实是由字符稍加扭曲变换得到的内容。
光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。OCR技术非常专业,一般多是印刷、打印行业的从业人员使用,可以快速的将纸质资料...
IDCardOCR_China, 基于tesseract,实现摄像头扫描识别中国二代身份证
Tesseract是一个OCR库(OCR是英文Optical Character Recognition的缩写),它用来对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程,Tesseract是目前公认最优秀,识别相对精准的OCR库。...
1-整体流程演示 2-文档轮廓提取 3-原始与变换坐标计算 4-透视变换结果 5-tesseract-ocr安装配置 6-文档扫描识别效果 课件源码
功能包括: - 从磁盘、扫描设备、剪贴板和屏幕截图导入 PDF 文档和图像 - 一次性处理多个图像和文档 - 手动或自动识别区域定义 - 识别为纯文本或 hOCR 文档 - 识别的文本直接显示在旁边图像 - 对识别的文本进行后...
基于OPENCV和tesseract的中文扫描票据OCR识别源码+全部数据(毕业设计).zip已获导师认可并高分通过的毕业设计项目,代码完整,该资源代码都是经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!...
功能包括:-从磁盘,扫描设备,剪贴板和屏幕快照导入PDF文档和图像-一次性处理多个图像和文档-手动或自动识别区域定义-识别为纯文本或hOCR文档-直接在旁边显示可识别的文本图像-后处理可识别的文本,包括拼写检查-...
将pdf按页拆分成多个小的pdf,并可将pdf转换成jpeg图片,同时具有OCR文字识别功能,可提取pdf和图片中的内容,内置图片识别区域设置。
可识别的文字直接显示在图片旁边 对已识别的文本进行后处理,包括拼写检查 从hOCR文档生成PDF文档 安装: 来源:从下载 Windows :从下载 Fedora :可从 Debian :可从 Ubuntu :可从 OpenSUSE :可从 ArchLinux :...
使用Springboot构建的支持中英文图片文字识别网站,运行网站需要下载并安装tesseract-ocr-w64-setup-v5.0.0.20190623.exe安装包。
该项目旨在使用光学字符识别从扫描的图像PDF中提取表格。 安装要求 Tesseract OCR sudo apt-get install tesseract-ocr 影像魔术师 sudo apt-get install imagemagick PDF实用程序 sudo apt-get install poppler-...