赛酷OCR是集文字识别、表格识别、公式识别于一体的办公软件,可直接识别扫描仪、数码相机、一体化机、拍照手机扫描的各类文档图像或PDF,并对识别结果进行版面重构,适用于公务员、企业白领、教师学生、科研人员等对文档的文档自动录入。
赛酷OCR功能介绍
§ 精确的版面自动分析、倾斜的文档自动校正;
§ 文字、表格、公式、图像的自动测定及识别;
§ 中英文简繁体识别,识别速度6000字/分钟,正确率99.5%;
§ 支持多种图像文件格式(BMP、JPG、TIF、多页TIF、PDF等);
§ 支持TWAIN扫描驱动,可自动调用系统已安装的扫描仪进行扫描识别;
§ 支持识别结果版面重构,文字、表格、公式、图像一键进入WORD;
§ 支持MATHTYPE,识别的数学公式既可直接编辑修改,亦可在WORD中编辑修改;
§ 可自主设定识别区域,设定竖版、单栏、图像、表格、公式局部定义;
§ 可去除印章,图像修正(擦除、连线、图像平衡);
§ 支持批处理识别;
§ 操作简洁方便,人性化操作界面,快速上手;
赛酷OCR使用教程
把图片转换成文字
(1)打开图像(例如打开SAMPLES里的文档照片1.JPG)
(2)点识别(打开的图像将被识别到软件的下部窗口)
(3)点插入(识别的文档将被插入到WORD中)
一:打开原图
二:点校正(原图像倾斜,需要校正)
三:点布局
四:点识别
五:点插入(插入word文档)
六:进入word后的结果
使用扫描仪扫描图像识别
在软件菜单里点“文件/选择扫描仪”,选择已安装的扫描仪,再点工具条中大扫描按钮,出现扫描窗口,
设置分辨率为300DPI,灰度图像或彩色图像模式,点扫描按钮,可将纸质文档扫入到软件中。“设置分辨率为
300DPI,灰度图像或彩色图像模式”非常重要,不适当的设置,会严重影响识别结果。
表格识别
如图像中含有表格,点布局按钮,可看到表格线(青色的线)被测定,如有表格线与文字粘连,则应将粘连的部分切割开,如有
断线,可用工具中的画笔把断线连上。
公式识别
(1)安装好mathtype后首先要启动word,然后选择相信mathtype的宏
(2)在赛酷文档秘书中的设置里,其他选项中,点恢复mathtype默认初始设置
(3)要设置windows的默认输入方法为英文
用户圈选公式区域后,出现红色区域框,在区域内单击右键,弹出菜单,左键单击“公式”,区域框变成绿色,
即完成一个公式的选定 。以此类推,可以把文档中所有公式都选定后进行识别。