最新推荐
-
创建SQlite数据库小工具v1.0绿色版 编程开发 / 385KB
-
FameView组态软件管理器7.6.11官方版 编程开发 / 64M
-
-
暗巷APK反编译多功能工具箱v1.1绿色版 编程开发 / 17.1M
-
精品推荐
-
JAVA API 1.7文档 编程开发 / 51.3M
查看 -
Oracle服务小助手v2.0绿色版 编程开发 / 900KB
查看 -
创建SQlite数据库小工具v1.0绿色版 编程开发 / 385KB
查看 -
微信开发者工具v1.05.2111300官方版 编程开发 / 126.1M
查看 -
MicroDraw图形控件V5.0官方版 编程开发 / 19.5M
查看
本类排行
详情介绍
借助jTessBoxEditor软件,可以提高Tesseract-OCR文本识别的准确性。通过jTessBoxEditor的不断训练,Tesseract-OCR文本识别的准确率得到了很大的提高。
借助jTessBoxEditor软件,可以提高Tesseract-OCR文本识别的准确性。通过jTessBoxEditor的不断训练,Tesseract-OCR文本识别的准确率得到了很大的提高。
指示
jTessBoxEditor的运行环境是JAVA虚拟机,是teeesseract智能图像识别软件的训练框架。无需安装,直接解压即可。不过必须提前安装一个jar包jdk-8u101-windows-x64虚拟机。
用jTessBoxEditor自动训练3500常用汉字
打开jTessBoxEditor图形界面
(1) 单击TIFF/BoxGenerator 按钮
(2)复制3500个汉字到空白处
(3)选择文件夹:(随便命名一个文件夹,我的是在F盘)
(4)命名(随意命名,比如我的是哈哈)
(5)选择自己的医学训练字体(比如我的是宋朝9pt)
(6)然后点击Generate按钮生成tif和box文件
(7) 单击训练器按钮
(8)打开之前创建的文件夹
(9)语言需要重命名(改成和步骤4一样的名字,我的是哈哈)
(10)选择已有箱的列车
(11)然后点击运行
(12)成功后: