打开APP

合合信息智能文字识别产品通过中国信通院智能文档处理系统评估

2023-07-06 10:35 互联网

近几年,全球数字经济进入高速发展的阶段,人工智能技术的应用场景也在不断拓展,出现了较多技术参差不齐、安全风险不明的AI产品。对此,中国信息通信研究院(以下简称“中国信通院”)构建了“可信AI”评测体系,并落实到人工智能的技术、产品和应用中。

近期,合合信息智能文字识别产品通过“可信AI”——智能文档处理系统评估工作,并获得“5级”评定。据悉,“5级”为该模块最 高评定等级。评估结果显示,合合信息智能文档处理产品在通用能力及AI核心能力方面均表现优异。

智能文档处理(IDP)技术能够从多格式文档的半结构化/非结构化数据中高效捕捉、提取和处理关键信息,大幅节省文件处理时间。这项技术是“可信AI”近两年新增的评测项目之一,使用场景和潜在应用场景都非常广泛。

首先在通用能力方面,合合信息表格文字识别技术覆盖了图片、PDF格式文档中多种类的表格识别需求,在信息抽取、表格文字识别、版面分析等文档处理的难点上均获得5分评分。

基于分治思想,合合信息利用语义分割、角点回归等技术方案还原有线表,在财报相关表格识别测试中识别单元格结构准确率高于98%;无线表识别采用自研序列模型、规则匹配等方案预测表格逻辑顺序从而构建物理框架,保证了区域内容的完整性,检测准确率也显著提升。

合合信息最新研发的版面分析与文档还原技术将文档图像按照文本、图形、公式、表格等不同类型内容切分区域,并分析之间的逻辑关系,精准判定文档中的文字位置、字体、大小和排版方式,从而在各类版式复杂的图片文档中准确获取关键信息。

其次,合合信息智能文字识别产品在NLP领域的文本分类、知识图谱领域的实体识别、关系抽取及OCR领域的字符识别、文本行识别等AI核心能力方面均获得5分评分,并在文本生成、事件抽取等高阶处理能力中表现突出,准确率、召回率、F1值等指标得到较高评分。

此外,合合信息也在积极构建人工智能技术的安全屏障,与中国信通院、中国图象图形学学会、中国科学技术大学等知名学术机构联合编制《文档图像篡改检测标准》,助力人工智能技术的发展和产业的健康成长。

(免责声明:本文转载自其它媒体,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。请读者仅做参考,并请自行承担全部责任。)

相关资讯

【声明:本页面数据来源于公开收集,未经核实,仅供展示和参考。本页面展示的数据信息不代表投资界观点,本页面数据不构成任何对于投资的建议。特别提示:投资有风险,决策请谨慎。】