中国数智化转型网 人工智能资讯 每日人工智能资讯|腾讯混元等联合发布首个古文字OCR评测基准 Chronicles-OCR

每日人工智能资讯|腾讯混元等联合发布首个古文字OCR评测基准 Chronicles-OCR

5月18日,腾讯混元、SSV数字文化实验室及SSV技术架构部联合安阳师范学院甲骨文信息处理重点实验室、中科院信工所、南开大学,正式发布了业界首个覆盖“七体之变”完整演化轨迹的中国古文字识别评测基准Chronicles-OCR。该基准的推出,旨在精准衡量多模态大语言模型(VLLM)在面对横跨三千年的汉字视觉分布漂移时的感知能力,推动数字人文领域的底层技术突破。数智化转型网www.szhzxw.cn

该数据集由领域专家多层级交叉标注,包含2,800张严格平衡的高质量图像。针对古早字体(甲骨、金文、篆书)与成熟字体(隶、楷、行、草)的特性,项目组设计了阶段自适应标注范式,并设立跨时代字符检测、细粒度古字识别、古文转写和字体分类四大核心任务,实现了视觉感知与语义推理的解耦评测。

在对GPT-5、Gemini3.1Pro、Claude Opus4.7等28个主流大模型的评测中,基准揭示了当前行业多模态能力的短板:在古早字体上,端到端检测任务由于缺乏现代版式先验而导致主流模型全军覆没;在细粒度识别中,最高准确率仅为27.1%;而在字体分类任务中,模型倾向于识别载体纹理而非微观笔画。值得注意的是,实验表明开启推理(Reasoning)模式反而会放大感知不确定性,导致表现下降。

此次 Chronicles-OCR 的开源发布,不仅量化了顶尖商用模型与古文字实际研究需求之间的技术鸿沟,也为学术界和工业界明确了微观感知优化的技术路径。让大模型从“识字”走向“读史”,将成为多模态大模型攻克长尾垂直场景、传承文化遗产的关键一步。数智化转型网www.szhzxw.cn

若您对人工智能感兴趣,可添加数智化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数智化转型网小助手思思(17757154048,微信同号)

思思微信二维码

若您为人工智能服务商,可添加数智化转型网小助手Nora,加入人工智能行业交流群。

Nora微信二维码

若您为人工智能创业者,可添加数智化转型网社群主理人Carina,加入人工智能创业交流群。

Carina微信二维码

声明:本文来自数智化转型网,版权归作者所有。文章内容仅代表作者独立观点,不代表数智化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

底部图片
免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。https://www.szhzxw.cn/120066.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部