按图索骥
基于版式及语义分析的数据自动结构化服务
传统档案信息著录主要依赖人工进行,效率低、准确率不高;由于投入大、耗时长,部分纸质档案甚至未进行数字化和著录处理。查准、查全率低,给档案的利用带来巨大的不便。传统档案著录主要存在以下几个问题:
信息
档案案卷质量不高、编目工作不规范、数据采集标准不统一。
技术
数据规划不合理、数据生产无质量保护措施、系统没有数据质量评价模块。
流程
数据生产流程不合理、数据检查流程不完善,数据再生产流程不规范。
解决方案
激扬提供纸质档案和电子档案的全生命周期管理,并研发了基于AI的全自动影像识别技术的《数据结构化系统》,采用人工智能算法,可对多种类证件、名片、通用文档、通用表单进行精准的版式识别并生成著录与卷内数据,准确率超过97%;根据业务需要提取相关归档字段,从而实现数据自动比对及档案自动编目,有效提升输档效率及准确性。
应用情况
系统广泛应用于太仓、张家港、常熟、昆山等自然资源和规划局的不动产登记档案数字化项目,实现案卷目录、卷内目录的全自动提取,大幅提升了数据准确性。
助力南京国土资源局溧水分局于2011年以江苏省全行业最高分119.5分的成绩通过了“特一级”达标升级验收,并于2016年通过“5A数字档案室”达标验收。
张家港市档案局也在使用了《电子档案校验系统》后,顺利通过了国家示范档案馆的测评。