数智化转型网szhzxw.cn 人工智能资讯 人工智能资讯|阿里通义千问推出Qwen3-VL轻量级模型:4B和8B参数版本性能逼近此前72B旗舰

人工智能资讯|阿里通义千问推出Qwen3-VL轻量级模型:4B和8B参数版本性能逼近此前72B旗舰

阿里巴巴通义千问团队近日发布了Qwen3-VL系列的两款轻量级模型——4B和8B参数版本。Qwen3-VL系列于上月首次亮相,是通义千问迄今推出的能力最强的视觉语言模型家族。此次新增的小参数版本旨在降低部署门槛,同时保持强劲的性能表现。数字化转型网(www.szhzxw.cn)

新发布的模型包含4B和8B两种参数规模,每种规模均提供Instruct(指令遵循)和Thinking(思维链推理)两个版本,为开发者提供了更灵活的选择空间。从功能定位来看,这两款模型在保持完整能力的前提下显著压缩了体积。数字化转型网(www.szhzxw.cn)

在技术实现上,新模型达成了三个核心目标。首先是大幅降低了硬件资源要求,参数规模的缩减使得显存占用明显减少,让开发者能够在更多类型的消费级和边缘设备上部署运行。其次,尽管模型尺寸大幅缩小,但完整继承了Qwen3-VL系列的所有核心能力,包括多模态理解、长文本处理和复杂推理等功能模块。

从性能表现来看,这两款轻量级模型在多项权威基准测试中展现出超越同等规模竞品的实力。在STEM学科问答、视觉问答(VQA)、光学字符识别(OCR)、视频理解以及Agent任务等场景中,4B和8B模型不仅超过了Google Gemini2.5Flash Lite和OpenAI GPT-5Nano等同类轻量级模型,在部分任务上甚至能够接近半年前发布的72B参数旗舰模型Qwen2.5-VL-72B的水平。

这一发布标志着大模型”小型化”趋势的又一进展。通过模型压缩和优化技术,开发团队在保持能力完整性的前提下实现了参数量与计算成本的大幅削减,为视觉语言模型在移动端、物联网设备等资源受限场景的应用铺平了道路。对于需要在本地部署或对推理成本敏感的企业用户而言,这两款新模型提供了更具性价比的解决方案。数字化转型网(www.szhzxw.cn

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)Nick

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。http://www.szhzxw.cn/98166.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部