来源:内蒙古档案
2024年11月29日,内蒙古自治区档案馆与江苏联著实业股份有限公司共同承担的国家档案局科技项目——《机器辅助人工提升档案开放审核效率的方法研究》顺利通过专家组的评审验收。
在项目研究过程中,课题组完成了档案语义特征识别库及敏感信息库建设,开发了一套包含开放可信度智能评估功能的档案开放审核系统,提出开放可信度计算结果的同时,系统也可提供机器判断意见作为人工审核的参考依据。课题组通过两组实验证明在机器辅助下大幅提升人工审核效率和开放可信度算法的可靠性。实验以2个全宗总计22011件档案为实验对象,对于同样的开放审核任务,采用传统的人工审核方式耗时13天完成,采用机器辅助人工审核的方式耗时4.5天完成,节省了8.5天,速度提升近3倍。将机器判断的具备开放特征档案的可信度排序结果与实际人工复核结果进行吻合度对比实验,高可信度的吻合度为95.46%,中可信度的吻合度为40.49%,低可信度的吻合度为2.62%。本实验结果显示:可信度越高的档案,被开放的几率越高,可信度越低的档案,被开放的几率也就越低,可信度的高低与档案可开放的概率密切相关。将课题的研究成果应用于实践工作中,有利于将开放审核工作人员从繁重的工作中解脱出来,利用机器辅助判断,将绝大部分的精力留给“应开尽开”的档案,全面提高档案开放审核的工作质量。
国家档案局专家组认为:一、该项目如期实现预设目标。该项目围绕档案开放审核工作中的实际问题,运用数据处理、语义分析等人工智能技术,建立新型的具备自动识别开放特征及可信度智能评估功能的档案开放审核系统,构建语义特征识别库及敏感信息库,开展对比实验应用研究,验证了机器辅助人工审核的效率提升情况及可信度算法的可靠性,完成科技项目任务书规定内容,实现了预期目标。二、该项目具有一定的创新性。该项目创新档案全文语义解析技术,引入全要素、量化的语义分析方法,建立双循环高效精进作业机制。项目创新开放审核工作思路,建立基于开放档案特征的语义特征识别库,作出包含“延期开放”及“开放”的双重特征判断,提出开放可信度排序,有效提升开放审核效率和准确性。在内蒙古自治区等综合档案馆馆藏近百万件档案开放审核工作得以实际应用,具有较好的创新性和实用性。三、该项目具有较为扎实的实证基础。该项目完成的两项对比实验验证,在保证开放审核质量和稳定性的情况下,系统可有效提高开放审核工作效率,特别对延期开放档案占比较少的全宗仍需大量人工审核的情况给出了切实可行的解决方案,具有较好的成果效益和应用前景。课题承担单位联合申请并获得《一种基于OCR的档案文本数据处理方法及系统》授权发明专利。四、该项目过程管理符合规范。项目提供的计划任务书、工作报告、研究报告、查新报告、应用证明等材料齐全、完整,符合验收要求。五、该项目成果有待进一步深化。建议继续深化研究,持续优化提升语义特征识别库及敏感信息库内容,提高开放可信度计算准确度,拓展系统应用范围,进一步扩大项目成果的推广应用。
课题组表示,项目验收通过并不代表项目结束,根据国家档案局专家组意见,将进一步对语义特征识别库及敏感信息库持续优化,基于本课题研究成果,继续利用先进的人工智能技术,在档案编研、智能查询、密件识别等场景深入研究,为持续提升档案服务水平贡献更多科技力量。