数智化转型网szhzxw.cn 人工智能资讯 昆仑万维开源「Skywork UniPic 2.0」模型

昆仑万维开源「Skywork UniPic 2.0」模型

昆仑万维集团在SkyWork AI技术发布周的第三天,宣布正式开源其最新研发的「Skywork UniPic2.0」模型。这一统一多模态模型的发布,标志着多模态人工智能领域的又一次重大突破。Skywork UniPic2.0是一个面向统一多模态建模的高效训练和推理框架,它通过生成和编辑模块的轻量化,以及多模态理解模型的联合训练,构建了理解、生图、编辑一体化的核心能力,旨在实现“高效、高质、统一”的多模态生成模型。数字化转型网www.szhzxw.cn

Skywork UniPic2.0由三个核心模块组成:生图编辑、统一模型能力和生图编辑后训练。该模型基于SD3.5-Medium架构,将原本只支持文本输入的模型改进为同时接受文本和图像输入,扩展了生图能力至生图和编辑双能力。通过冻结生图编辑模块,多模态模型Qwen2.5-VL-7B,Pre-Train连接器来构建出理解生成编辑一体化能力,再通过连接器和生图编辑模块一起联合微调,实现最终的一体化理解、生图、编辑模型。数字化转型网www.szhzxw.cn

Skywork UniPic2.0的发布,不仅为开发者与研究者提供了一个全面开源的平台,包括模型权重、推理代码、强化策略等,而且其生成模块基于2B参数的SD3.5-Medium架构训练,生图和编辑指标超越了具有更大参数量的其他模型。此外,该模型引入了强化学习,基于Flow-GRPO首创渐进式双任务强化策略,有效提升了模型对复杂指令的理解能力与图像生成和编辑的一致性。数字化转型网www.szhzxw.cn

项目主页:

https://unipic-v2.github.io/

技术报告:

https://github.com/SkyworkAI/UniPic/blob/main/UniPic-2/assets/pdf/UNIPIC2.pdf

GitHub地址:

https://github.com/SkyworkAI/UniPic/tree/main/UniPic-2数字化转型网www.szhzxw.cn

HuggingFace Gradio:

https://huggingface.co/spaces/Skywork/UniPic2-Metaquery

HuggingFace Model: 数字化转型网www.szhzxw.cn

https://huggingface.co/Skywork/UniPic2-SD3.5M-Kontext-2B; https://huggingface.co/Skywork/UniPic2-Metaquery-9B

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)鲍勃

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。http://www.szhzxw.cn/89553.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部