数智化转型网szhzxw.cn 人工智能资讯 ​人工智能资讯|IBM 推出 Granite-Docling-258M 模型,助力文件转换技术新突破

​人工智能资讯|IBM 推出 Granite-Docling-258M 模型,助力文件转换技术新突破

近日,IBM 正式发布了一款名为 Granite-Docling-258M 的轻量级视觉语言 AI 模型。该模型专为文件转换设计,具备强大的多语言支持,包括中文、阿拉伯语和日语,旨在提升文档处理的效率和准确性。Granite-Docling-258M 的参数量为2.58亿,是一款专为文档表格处理而优化的模型。

与传统的 OCR 软件相比,Granite-Docling-258M 在识别准确度上有显著提升。其输出结果不仅能够完整保留原始文档的版面结构,还能有效识别表格、数学公式、列表和代码块等多种元素。这一新技术的核心在于 IBM Research 开发的 DocTags,这是一套通用文件结构标记语言,能够精确描述页面元素的类型、位置和阅读顺序。

Granite-Docling-258M 在文档转换的过程中,首先识别文档中的各个元素,然后再执行 OCR 识别。这种方法使得内容的提取和输出更加高效和准确。完成转换后,用户可以将内容导出为 Markdown、JSON、HTML 等多种格式,满足不同的使用需求。此外,IBM 还计划将 DocTags 词汇表纳入 Granite 的分词器和训练流程,以进一步提升模型的性能。

目前,Granite-Docling-258M 还未达到企业级的应用水平,但 IBM 表示,他们将持续扩展语言的覆盖范围,并提升模型的可靠性。未来,IBM 还将致力于增强 DocTags 与 IBM watsonx.ai 模型的兼容性,确保技术的全面应用。

这款新模型的发布,无疑为文档处理领域带来了新的技术选择,也为相关行业的效率提升提供了强有力的支持。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)萍水

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。https://www.szhzxw.cn/94398.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部