中国数智化转型网 人工智能资讯 每日人工智能资讯|百度文心发布PaddleOCR-VL-1.6:准确率破96.33%刷新文档解析SOTA

每日人工智能资讯|百度文心发布PaddleOCR-VL-1.6:准确率破96.33%刷新文档解析SOTA

百度正式发布文心大模型衍生模型PaddleOCR-VL-1.6,在OmniDocBench v1.6权威评测中以96.33%的准确率超越Gemini-3-Pro、GPT-5.2及GLM-OCR等国内外主流大模型,刷新业界SOTA,综合性能荣登全球第一。这一发布标志着多模态大模型在复杂文档理解与真实场景解析能力上取得了重要突破。数智化转型网www.szhzxw.cn

作为文心大模型多模态能力的核心组成部分,PaddleOCR基于文心大模型训练,目前支持超100种语言识别,用户覆盖全球170多个国家和地区。本次升级的PaddleOCR-VL-1.6在保持0.9B轻量化架构的前提下,通过模型驱动的数据构建机制与渐进式训练优化,显著提升了在表格、古籍、生僻字、印章及图表识别等复杂场景下的核心识别能力。数智化转型网www.szhzxw.cn

在面向真实复杂场景的Real5-OmniDocBench评测中,该模型凭借93.19%的总指标同样保持领先,攻克了扫描件、弯折、屏幕拍照、光照变化及倾斜文档等业界公认的解析痛点。数智化转型网www.szhzxw.cn

由于延续了前代架构,企业和开发者可实现无需额外适配的平滑迁移。目前,PaddleOCR在GitHub上的Star数已突破79.2K,超越谷歌Tesseract OCR,成为全球最受迎的开源OCR项目。新模型现已上线官网并开源代码与权重。在当前大模型向多模态深度演进的趋势下,PaddleOCR-VL-1.6不仅为文档数字化提供了更高效的产业级解决方案,也将进一步加速AI在复杂多模态场景下的落地进程。数智化转型网www.szhzxw.cn

若您对人工智能感兴趣,可添加数智化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数智化转型网小助手思思(17757154048,微信同号)

思思微信二维码

若您为人工智能服务商,可添加数智化转型网小助手Nora,加入人工智能行业交流群。

Nora微信二维码

若您为人工智能创业者,可添加数智化转型网社群主理人Carina,加入人工智能创业交流群。

Carina微信二维码

声明:本文来自数智化转型网,版权归作者所有。文章内容仅代表作者独立观点,不代表数智化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

底部图片
免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。https://www.szhzxw.cn/122025.html
0
标签:
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部