随着全国各行业的档案、图书、资料的扫描和识别工作的疯狂开展,纸质材料数字化加工的效率和质量问题日益突显。传统方式下文字识别要么效率太低,要么质量太差(批量文字识别后的双层PDF电子档案)。而本系统正是为了解决这个难题而专门设计,在人工干预的情况下实现几秒钟内完成一页文字识别,而识别的准确程度趋于99%,更适合于带有手写签名、盖章档案图像的文字识别应用。适用于大规模的数据著录团队的生产加工工作。同时,软件具备数据库的存储能力,适合于日常零散材料的收集、归档等档案管理工作。
主要解决如下问题:
A、简单化零散文件材料收集、管理、转换和查询过程。
B、简化了电子档案产生的复杂工艺,一个人就可以完成所有档案数字化加工过程。
C、简化了计算机软件专业性强、制作工艺复杂、文字识别准确度不可控的双层PDF文件数据的制作过程。
D、解决扫描图像的人工文字识别效率低,程序自动识别准确度不高、不可控的问题。
面向的客户全体:
1、负责日常大量零散文件资料收集、整理,但编制人员较少的企事业单位用户。
2、档案专业知识不多,但又负责本单位的档案管理工作的人员。
3、有大量的学术资料要进行编研,文字著录工作量较大的公职人员或学者。
4、大规模的图书资料扫描、识别的数字化加工企业(工厂)用户。
软件特点:
1、使用关系型数据库中的表集,来存储软件系统中的应用数据。
2、集成条目著录、图像扫描处理、文字识别处理、双层PDF文件转换合成于一体。
3、采用扫描图像的掩码图像优化、处理的方式,来提高文字识别的准确度,使用识别准确度可控。
4、提供大量的专用的图像处理方法,来提高扫描原图与掩码图像的处理质量和效率。
5、将干部档案图像高清处理方法,完美的应用到掩码图像“去红章、去签名、去表格线”加工过程中,使其覆盖处文字部分可被识别。
6、提供制作的双层PDF文件显示“文本层”识别文字功能,使用户可以直观的比对图像文字和识别文本,来判断文字识别的准确程度和效果。
7、提供掩码图像文字写入功能,对于无法识别的文字可以人工写入。
8、提供扫描图像“自检”过程,使其产生的电子档案图像更加符合国家标准。
9、提供大量的多线程处理过程,来降低管理人员的工作量。
10、扫描产生的原始图像及掩码图像,采用图像加密的方式存储于系统之中,防止图像非法复制与传播。
11、支持微软的Window 32/64位主流操作系统。