随着AI图像生成进入“专业级”领域,Adobe正在通过全面升级重新定义创意工作流程。10月29日,Adobe正式发布了其最新一代图像生成模型——Firefly Image5,并同步引入了多项突破性功能:原生400万像素输出、分层提示编辑、自定义艺术风格模型、AI语音和音乐生成,将图像、视频和音频完全集成到一个AI创作循环中。
Image5:从“足够”到“专业级”的飞跃
相较于之前仅支持 100 万像素原生生成(需要后期处理达到 400 万像素)的版本,Firefly Image5 可以直接生成高达 400 万像素(约 2240×1792)的高质量图像,细节清晰度和色彩表现力显着提升。特别是在角色渲染方面,Adobe优化了面部结构、身体比例和光照逻辑,大大减少了“AI手变形”等常见问题,使其更接近专业插画和商业摄影标准。
更具革命性的特点是其分层编辑能力:模型自动将图像中的不同对象识别为单独的图层,允许用户通过自然语言指令(如“将帽子换成红色”或“放大背景建筑”)或传统工具(旋转、缩放)来精确调整单个元素,同时系统智能地保持场景的整体光照一致性和细节完整性, 真正做到“所想即所得”的无损编辑。
创作者专用AI:个人风格模型一键训练
为了满足专业艺术家对风格一致性的高需求,Adobe 引入了自定义模型功能(封闭测试版)。用户只需拖放他们的插图、照片或草图,系统就会根据这些资产训练个性化的图像生成模型,确保输出内容完全符合他们的艺术语言。这种能力将大大提高品牌视觉、角色设计、IP开发等场景的工作效率,让AI真正成为“数字学徒”。
多模态创作平台:图像+视频+音频一体化
新的 Firefly 网站已重组为多模态创作中心:
统一的提示框,支持图片和视频生成无缝切换;
模型选择器集成了 Adobe 自研模型以及 OpenAI、Google、Runway、Topaz 和 Flux 等第三方引擎;
主页汇总了个人文件、历史生成记录以及对 Creative Cloud 应用程序的快速访问;
视频工具现在包括时间线和分层编辑(私人测试版),朝着专业级的 AI 视频工作流程迈进。
在音频方面,Firefly 现在支持通过 AI 提示生成完整的配乐和画外音旁白。底层技术采用 ElevenLabs 语音模型,并引入“词云式提示”功能——用户可以通过点击关键词快速构建复杂的指令,降低创作的准入门槛。
迈向“下一代创作者”:打破传统工作流程限制
Adobe 生成式 AI 副总裁 Alexandru Costin 表示,Firefly 的目标用户是“GenAI 原生创作者”——那些不受传统软件逻辑束缚,更喜欢在整个过程中深度融合 AI 的人。因此,Firefly 成功地摆脱了 Photoshop 等经典工具的交互习惯,大胆地重新配置界面和功能,打造出更直观、适合 AI 时代的创作体验。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
