慧眼识珠
档案数字化成果及电子档案校验系统
国家5A级项目成果
研发背景
随着信息化建设进程加速推进,全国大部分地方档案馆已由传统纸质档案保管过渡到依靠计算机系统化管理时代。
各地档案馆也已由单套制向双套制接收快速迈进,档案馆面临前所未有的结构化数据接收压力。 由于缺乏专业的检测平台,只能被迫采取少部分抽检的方式,从而导致对接收数据存在检验不全面、不真实及较高批量接收后的质量风险。
该平台的诞生,彻底的改变了人为主观对验收结果的判断,以系统全检代替人工抽验,实现数量接收准确无误,质量接收零风险。
产品特点
系统介绍
产品优势
利用AI智能技术,结合档案行业标准,定向开发合规审查产品,更贴合档案馆使用需求;
根据各级单位不同需求、不同标准可以自行设定审查参数,高度灵活便捷;
审查流程自动化,更高效,全面提升数据审查效率;
数据审查更全面(污点、黑边、倾斜度、重复页、空白页、装订孔、目录格式等),一次性审查,自动输出审查报告;
全面审查数据合规性,规避传统抽查方式的不全面、不准确性;
可全面反映不合格数据系统日志,方便整改工作的开展,无需人工全面自查整改,费时费力;
解决方案
激扬研发了基于AI的全自动影像识别技术的《电子档案校验系统》,可对多种类证件、名片、通用文档、通用表单识别进行精准识别,准确率超过99%;根据业务需要提取相关归档字段,提高查档效率。
数据质量问题解决策略
01.质量检查
02.质量控制
03.全面质量管理
04.数据积累
05.数据管理
06.数据治理
校验策略
系统自动校验
对校验文件进行备份后,通过逆向追溯进行逐一排查
系统辅助校验
对校验文件进行备份后,通过逆向追溯进行逐一排查
人工辅助校验
对校验文件进行备份后,通过逆向追溯进行逐一排查
档案修正策略
功能模块
数据预处理系统
支持excel文件上传著录数据,或直接连接数据库导入数据。可挂接pdf影像文件。
数据分析系统
通过四性检测对著录数据与影像数据的完整性、准确性、规范性等方面进行校验。对影像文件的图片黑边、倾斜角度等问题进行识别。根据多种不同的策略模板,对著录文件的数据合法性进行校验。
自动校正系统
通过系统自动校验,将部分可以由系统自行处理纠正的数据按全宗、目录的方式进行自动处理,并标识出来,以供用户检验。对有黑边、倾斜的影像文件进行自动处理。
辅助确认系统
通过影像对比、著录数据修改功能模块,由人工对系统识别出的著录与影像文件进行进一步确认与验证。
精确定位筛查系统
在完成前四个步骤的基础上,通过粘贴电子标签,同时对档案实体、著录数据和电子档案进一步进行人工校对,重点是错别字和其它系统无法自动判定的错误的筛查处理。
人工修正系统
激扬采取“查的人不改,改的人不查”的策略,确保查改分离,相互验证。由修正角色对人工辅助校验系统和精确定位筛查系统确定的错误进行修正、补充扫描和其它处理。
多轮质检系统
通过即时的、高强度的三轮质检,确保查到的错误全部修正正确。
校验报告系统
按照全宗分别统计汇总相关校验过程和结果信息,以动态图形界面和生成书面报告的形式,形成检校成果,对数据成果进行鉴定。