广泛应用新一代信息技术,加快全面数字转型和智能升级,是时代所需。去年年底,内蒙古自治区档案馆利用人工智能领域先进技术,推出基于语义工程的档案智能查询系统,帮助利用者快速准确找到目标档案,大幅提高模糊信息下的查档效率和精准度,得到利用者的广泛好评。这是自治区档案馆贯彻落实习近平总书记对档案工作重要批示精神,紧贴人民群众现实需求,完善档案查询利用平台功能的具体体现。 自治区档案馆馆藏档案逾600万件,涵盖历史档案、民生档案、文书档案等多个种类,档案起止年代跨度近400年。馆内原本采用的基于关键词的档案检索方式在查档时必须通过全宗号、文件题名、档号等字段进行检索,且不支持全文检索。特别是在目标档案原件为手写或电子化时未生成双层PDF文件的情况下,若档案题名中不含关键词,而查档者又没有精确掌握全宗号、文件题名、档号,那么即使查档者明知档案所含的关键词,仍然很可能一无所获。过去面对这样的情况,自治区档案馆工作人员往往只能动用“人海战术”进行逐页翻找。 档案智能查询系统 为切实提升查档效率和精准度,自治区档案馆在整合档案资源的基础上,以档案查询智能化为突破口,引入人工智能领域的前沿技术——语义工程,利用该技术赋予机器的自然语言理解能力辅助档案查询,推进数字档案信息文档智能语义搜索服务。该系统在提高查档率和准确率方面拥有四大优势,即支持全文检索、支持手写检索、不依赖关键词检索、机器提炼线索,再利用线索快速找到所需文档,可通过深度分析文章语义以及文章和问题之间的联系,精准获悉用户指令,快速找到目标文件,解决了传统检索方式要求关键词与原文完全一致的痛点问题。 现在,来到自治区档案馆的查档者只需输入自己有印象的所需档案的相关词汇(只要全文中出现过即可),就能快速定位目标档案。此外,在不确定归档时间的情况下,该系统还可通过模糊线索全库匹配定位目标文件。如,输入档案所属单位名称,就能迅速找到所有涉及该单位的文件,极大地提升了查档准确率。针对历史档案和年代较久远的民生档案,该系统可利用自主研发的OCR技术,识别包含潦草笔迹在内的各类软硬笔手写体,破解手写档案开发利用难题,提升识别率和精准度。 原载于《中国档案报》2022年7月21日 总第3859期 第一版 来源:国家档案局官网
公司动态
Company Dynamics
了解我们的最新资讯动态