共话智能文档处理技术未来丨合合信息应邀出席第十二届中国智能产业高峰论坛

2023-10-10 09:10 互联网

近日，为期两天的2023第十二届中国智能产业高峰论坛（CIIS 2023）在江西南昌顺利举行。大会期间，中国人工智能学会（CAI）模式识别专委会与合合信息共同承办了《多模态大模型与文档图像智能理解》专题论坛，来自清华大学、华中科技大学、复旦大学、百度、科大讯飞、合合信息等研究机构和企业的技术专家，围绕行业焦点议题展开探讨。

作为一家在人工智能及大数据领域深耕十余年之久的“老兵”，合合信息基于自主研发的智能文字识别及商业大数据核心技术，为全球用户和多元行业客户提供数字化、智能化的产品及服务，主要产品包括面向C端用户的扫描全能王APP、名片全能王APP、启信宝APP及相关小程序，以及面向B端客户的基础技术服务、标准化服务和场景化解决方案的业务服务。

专题论坛上，合合信息智能技术平台事业部副总经理、高级工程师丁凯博士在《文档图像预训练模型的探索与思考》分享中指出，在互联网语料“见底”之日逐渐逼近之时，电子书成为了大模型训练的新“燃料”，而电子书很多是由文档图像组成的，文档图像识别分析与智能理解技术可以将大量的文档图像转化为具有丰富格式信息的文本，为大模型提供更丰富更高质量的训练语料，解决大模型训练的“token荒”的问题。

文档图像技术作为起步较早、发展较为成熟的人工智能技术领域，当前仍存在着文档图像质量退化严重、文字检测及版面分析困难、非限定条件文字识别率低、结构化智能理解能力差等亟待解决的问题。丁凯认为，文档图像处理技术在推动大模型技术发展的同时，大模型的小样本学习能力、多任务能力、智能涌现能力对于文档图像处理问题的解决具有重要的研究价值。

“在已有的学术研究中，文档图像专有大模型在更复杂的文档理解问题上存在天然的短板，而一些多模态大模型已经表现出了从含有表格、图片等多重元素的文档中提取关键信息进行分析，理解内容的潜力。”丁凯表示，研究人员可以基于现有的领域做更好的融合，开辟新的研究方向。

此外，大模型蓬勃生长的背面，大量经过人工、生成式AI篡改合成的图片被用于散播谣言、经济诈骗，利用AI进行图像伪造和篡改行为已成为一个严重的安全挑战。丁凯表示，合合信息智能文档处理技术覆盖了图像预处理、解析识别到AI安全等文档图像处理全生命周期，在端到端提升文件处理效率、准确率的同时，有效保障用户及企业数据安全。这一系列技术的突破对于打击欺诈行为具有重要意义，将为数字时代的社会发展和公众利益做出贡献。

打开投资界APP 阅读全文

（免责声明：本文转载自其它媒体，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。请读者仅做参考，并请自行承担全部责任。）

共话智能文档处理技术未来丨合合信息应邀出席第十二届中国智能产业高峰论坛

相关资讯