数智化转型网szhzxw.cn 人工智能资讯 人工智能资讯|小红书与复旦大学合作,开源InstanceAssemble:实现AI图像生成中的精准布局控制

人工智能资讯|小红书与复旦大学合作,开源InstanceAssemble:实现AI图像生成中的精准布局控制

最近,小红书与复旦大学联合发布了他们在布局到图像生成领域的最新研究成果——InstanceAssemble。该技术旨在解决AI绘画中长期存在的“布局难度”问题,通过创新机制实现从简单到复杂场景的精准图像生成。据报道,相关论文已被顶级人工智能大会NeurIPS 2025接受。

在当前的人工智能绘画领域,尽管“文本转图像”生成技术已趋成熟,但人工智能常常难以根据用户定义的空间约束(如边界框或分割遮罩)准确放置对象,常导致对齐不一致或语义断层。InstanceAssemble的出现标志着AI绘画进入了一个新阶段——“精准构图”。该技术基于主流扩散变换器架构,其核心是“实例组装注意力”机制。数字化转型网www.szhzxw.cn

使用该工具时,用户只需提供每个物体的具体位置(边界框)和内容描述,AI即可生成符合指定区域要求的图像内容。无论是仅有少量对象的简单场景,还是密集实例的复杂场景,InstanceAssemble都能保持高布局精度和语义一致性。

值得注意的是,InstanceAssemble采用了轻量级适配方案。它不需要重新训练整个大型模型,只需少量额外参数以适应现有模型。例如,适应稳定扩散3介质需要约3.46%的额外参数,而适应Flux.1模型则需低至0.84%。

为了更好地评估技术性能,研究团队还发布了一个名为“Denselayout”的基准数据集,包含9万个实例和新的评估指标。目前,InstanceAssemble已在GitHub开源,开发者可以下载代码和预训练模型。预计它将在设计、广告和内容创作等行业中发挥重要作用。数字化转型网www.szhzxw.cn

若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

此图片的alt属性为空;文件名为image-82.png

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

此图片的alt属性为空;文件名为image-83.png

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

此图片的alt属性为空;文件名为image-84.png

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

此图片的alt属性为空;文件名为image-12.png

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。https://www.szhzxw.cn/104870.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部