中国数智化转型网 人工智能资讯 每日人工智能资讯|Ideogram4.0开源发布:93亿参数打造最强文字生成AI,DesignArena全球第四

每日人工智能资讯|Ideogram4.0开源发布:93亿参数打造最强文字生成AI,DesignArena全球第四

AI 图像生成平台 Ideogram 于6月3日正式发布开放权重文生图模型 Ideogram4.0。根据官方公布的基准测试结果,该模型已成为当前性能领先的开源图像生成模型之一,并在文字生成与版式控制能力方面实现显著提升。数智化转型网www.szhzxw.cn

Ideogram4.0核心规模达到93亿参数(9.3B),采用近年来主流开源模型普遍使用的单流(Single-Stream)架构设计,让文本 Token 与图像 Token 在统一的自注意力序列中进行联合建模,从而提升文本与视觉内容之间的协同生成能力。同时,模型将设计可控性作为核心目标,在训练和推理阶段均强化了布局、排版和视觉元素控制能力。数智化转型网www.szhzxw.cn

在技术架构上,Ideogram4.0由 Qwen3-VL-8B-Instruct 文本编码器、34层可训练单流扩散 Transformer(DiT)、Euler Flow Matching采样器以及冻结的KL自动编码器组成。这一组合使模型能够兼顾图像质量、文本理解和生成效率。数智化转型网www.szhzxw.cn

官方展示的案例显示,Ideogram4.0可生成人物、场景、商业设计、海报和品牌视觉等多种类型图片。其中,文字渲染能力成为本次升级最大亮点。相比传统文生图模型经常出现文字错乱、拼写错误等问题,Ideogram4.0能够更准确地在图像中呈现长文本内容,对于海报设计、商品展示图、封面制作以及社交媒体营销素材等场景具有较高实用价值。数智化转型网www.szhzxw.cn

为了增强版式控制能力,Ideogram在训练过程中引入了对象与文本边界框(Bounding Box)数据,使模型能够理解图像元素之间的空间关系。同时结合结构化JSON字幕数据进行训练,用户可以通过提示词更精准地控制对象位置、文本布局以及整体排版结构,实现更接近专业设计工具的创作体验。数智化转型网www.szhzxw.cn

在第三方评测方面,DesignArena最新榜单显示,Ideogram4.0已超越Nano Banana Pro,位列全球第四。DesignArena采用隐藏模型身份后由人工评审对生成结果进行盲测打分,因此能够较好反映真实用户对图像质量和视觉表现力的主观评价。数智化转型网www.szhzxw.cn

随着开源图像生成模型竞争持续升温,Ideogram4.0凭借领先的文字生成能力和设计可控性,正在成为海报制作、品牌营销和视觉内容创作领域值得关注的新选择。数智化转型网www.szhzxw.cn

地址:https://github.com/ideogram-oss/ideogram4

若您对人工智能感兴趣,可添加数智化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数智化转型网小助手思思(17757154048,微信同号)

思思微信二维码

若您为人工智能服务商,可添加数智化转型网小助手Nora,加入人工智能行业交流群。

Nora微信二维码

若您为人工智能创业者,可添加数智化转型网社群主理人Carina,加入人工智能创业交流群。

Carina微信二维码

声明:本文来自数智化转型网,版权归作者所有。文章内容仅代表作者独立观点,不代表数智化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

底部图片
免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。https://www.szhzxw.cn/122112.html
0
标签:
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部