最近,小红书与复旦大学联合发布了他们在布局到图像生成领域的最新研究成果——InstanceAssemble。该技术旨在解决AI绘画中长期存在的“布局难度”问题,通过创新机制实现从简单到复杂场景的精准图像生成。据报道,相关论文已被顶级人工智能大会NeurIPS 2025接受。
在当前的人工智能绘画领域,尽管“文本转图像”生成技术已趋成熟,但人工智能常常难以根据用户定义的空间约束(如边界框或分割遮罩)准确放置对象,常导致对齐不一致或语义断层。InstanceAssemble的出现标志着AI绘画进入了一个新阶段——“精准构图”。该技术基于主流扩散变换器架构,其核心是“实例组装注意力”机制。数字化转型网www.szhzxw.cn
使用该工具时,用户只需提供每个物体的具体位置(边界框)和内容描述,AI即可生成符合指定区域要求的图像内容。无论是仅有少量对象的简单场景,还是密集实例的复杂场景,InstanceAssemble都能保持高布局精度和语义一致性。
值得注意的是,InstanceAssemble采用了轻量级适配方案。它不需要重新训练整个大型模型,只需少量额外参数以适应现有模型。例如,适应稳定扩散3介质需要约3.46%的额外参数,而适应Flux.1模型则需低至0.84%。
为了更好地评估技术性能,研究团队还发布了一个名为“Denselayout”的基准数据集,包含9万个实例和新的评估指标。目前,InstanceAssemble已在GitHub开源,开发者可以下载代码和预训练模型。预计它将在设计、广告和内容创作等行业中发挥重要作用。数字化转型网www.szhzxw.cn
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
