智谱正式宣布联合华为开源新一代图像生成模型GLM-Image。该模型最大的突破在于,它是首个在国产芯片算力底座上完成从数据预处理到大规模训练全流程的 SOTA(州级水平)多模态模型 。
GLM-Image采用了创新的“自回归 + 扩散解码器”混合架构,成功实现了图像生成与语言模型的深度融合。这一架构设计让模型在处理“知识密集型”生成任务时表现优异,能够精准理解全局指令并刻画局部细节,有效解决了海报排版、PPT制作及复杂科普图生成等长期困扰 AI 绘画的难题。
GLM-Image 支持在单个模型中同时进行文本到图像和图像到图像的生成。
- 文本转图像:根据文本描述生成高细节图像,在信息密集的场景中表现尤为出色。
- 图像到图像:支持多种任务,包括图像编辑、风格迁移、多主体一致性以及人物和物体的身份保留生成。字化转型网www.szhzxw.cn
在技术指标上,GLM-Image展现了极强的中文理解与渲染能力。在多项复杂视觉文本生成榜单中,它均位列开源模型第一,尤其擅长处理极具挑战性的汉字生成任务。此外,该模型原生支持从1024到2048尺寸的任意比例图像生成,无需额外训练即可自适应多种分辨率。
目前,GLM-Image已在GitHub和Hugging Face等平台全面开源。为了降低使用门槛,其 API 调用价格低至每张图0.1元,智谱方面表示,未来还将推出经过速度优化后的新版本,进一步提升商用性价比。
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
