金山办公联合华科发布多模态模型MonkeyOCR v1.5 登顶OCR综合性能榜首

admin 新闻资讯 2

11月25日下午,金山办公举办AI协同办公大会,旗下WPS 365不仅对智能文档库AI Docs、数字员工两大AI核心产品进行焕新升级,更推出AI中台、团队空间等新产品。与此同时,金山办公联合华科发布的MonkeyOCR v1.5在全球权威文档解析评测榜单OmniDocBench V1.5中拿下93.01分的成绩,获得综合性能全球第一。

金山办公联合华科发布多模态模型MonkeyOCR v1.5 登顶OCR综合性能榜首-第1张图片-安信龙年版

MonkeyOCR v1.5再次突破多模态文档解析性能上限

经过多年技术积累,WPS 365的自研算法已具备国内领先的文档解析能力,能够精准识别PDF文档中的图片、表格等信息,大幅提升问答精度。特别是在表格解析方面,该算法的表格结构还原的准确率高达95%,显著领先于业界水平。

在上述国际权威测评榜单中,金山办公与华中科技大学联合发布多模态文档解析模型 MonkeyOCR v1.5在通用文档解析能力上全面超越 PaddleOCR-VL、MinerU2.5、DeepseekOCR 等主流方案,复杂表格解析准确率首次突破90%,标志着我国智能文档处理技术迈入新阶段。

“90%的复杂表格解析率不是终点,而是行业标准的新起点。” 金山办公AI研发总监刘强表示,该模型已实现文本、表格、公式、图像的全类型解析,输出格式支持 Markdown、HTML、Json文本等多种形态,可直接对接企业OA系统与科研工具。在实际应用中,高校科研人员借助其批量解析论文,将20篇文献的数据整理时间从2天压缩至5分钟。

作为协同办公的核心支撑技术,文档解析长期面临复杂表格识别、跨页结构重建、嵌入式图像干扰等行业痛点。传统OCR系统在处理多层嵌套表格、跨页单元格时精度不足,而端到端模型又存在效率瓶颈。MonkeyOCR v1.5通过创新的两阶段架构以及针对嵌入图像、跨页表格的专用模块,成功破解这一难题。

金山办公联合华科发布多模态模型MonkeyOCR v1.5 登顶OCR综合性能榜首-第2张图片-安信龙年版

金山词霸VS国内外产品

此外,翻译能力在协同办公中是打破语言壁垒、保障协作效率的关键支撑,直接影响信息传递与团队配合质量。金山办公在“图片翻译”方面迎来新的突破。例如,当用户在金山词霸中使用“拍照翻译”功能,无论是手写文稿、印刷文件,还是异形排版文件,小词都能够快速扫描识别,并精准翻译。

据悉,“图片翻译”功能将在金山办公的各类产品中陆续上线,其底层技术依托于金山办公自主研发的翻译模型。该模型在中英翻译质量方面超越了国内外的头部产品,处于领先地位。此外,金山办公已将翻译模型接入到WPS 365产品中,借助“国际化”战略,金山办公正着力将服务中国组织级用户的产品及定制化能力推向全球市场。

标签: 科技 中国 ai

上一篇阿里吴嘉首谈千问:AI助手比拼的是智力水平

下一篇当前分类已是最新一篇

抱歉,评论功能暂时关闭!