合合信息智能文字识别产品通过中国信通院智能文档处理系统评估

2023-07-06 10:35 互联网

近几年，全球数字经济进入高速发展的阶段，人工智能技术的应用场景也在不断拓展，出现了较多技术参差不齐、安全风险不明的AI产品。对此，中国信息通信研究院（以下简称“中国信通院”）构建了“可信AI”评测体系，并落实到人工智能的技术、产品和应用中。

近期，合合信息智能文字识别产品通过“可信AI”——智能文档处理系统评估工作，并获得“5级”评定。据悉，“5级”为该模块最高评定等级。评估结果显示，合合信息智能文档处理产品在通用能力及AI核心能力方面均表现优异。

智能文档处理（IDP）技术能够从多格式文档的半结构化/非结构化数据中高效捕捉、提取和处理关键信息，大幅节省文件处理时间。这项技术是“可信AI”近两年新增的评测项目之一，使用场景和潜在应用场景都非常广泛。

首先在通用能力方面，合合信息表格文字识别技术覆盖了图片、PDF格式文档中多种类的表格识别需求，在信息抽取、表格文字识别、版面分析等文档处理的难点上均获得5分评分。

基于分治思想，合合信息利用语义分割、角点回归等技术方案还原有线表，在财报相关表格识别测试中识别单元格结构准确率高于98%；无线表识别采用自研序列模型、规则匹配等方案预测表格逻辑顺序从而构建物理框架，保证了区域内容的完整性，检测准确率也显著提升。

合合信息最新研发的版面分析与文档还原技术将文档图像按照文本、图形、公式、表格等不同类型内容切分区域，并分析之间的逻辑关系，精准判定文档中的文字位置、字体、大小和排版方式，从而在各类版式复杂的图片文档中准确获取关键信息。

其次，合合信息智能文字识别产品在NLP领域的文本分类、知识图谱领域的实体识别、关系抽取及OCR领域的字符识别、文本行识别等AI核心能力方面均获得5分评分，并在文本生成、事件抽取等高阶处理能力中表现突出，准确率、召回率、F1值等指标得到较高评分。

此外，合合信息也在积极构建人工智能技术的安全屏障，与中国信通院、中国图象图形学学会、中国科学技术大学等知名学术机构联合编制《文档图像篡改检测标准》，助力人工智能技术的发展和产业的健康成长。

（免责声明：本文转载自其它媒体，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。请读者仅做参考，并请自行承担全部责任。）