最近,艾伦人工智能研究所(AI2)发布了一个名为Molmo2的新开源视频语言模型。这一系列新模型及相关训练数据展示了该非营利组织对开源的坚定承诺,这在企业希望控制模型使用的商业环境中是一个显著优势。数字化转型网www.szhzxw.cn
Molmo2 包含多个不同版本,包括基于阿里巴巴 Qwen3 语言模型的 Molmo2-4B 和 Molmo2-8B,以及基于 AI2Olmo 语言模型的完全开源版本 Molmo2-O-7B。除了模型外,AI2还引入了九个新数据集,包括多图像和视频输入的长格式质量保证数据集,以及一个开放的视频指向与跟踪数据集。
Molmo2的一个显著特点是其增强的功能性。根据AI2的介绍,Molmo2-O-7B是一个透明模型,允许用户进行端到端的研究和定制。这意味着用户可以完全访问视觉语言模型及其语言学习模型(LLM),从而更灵活地调整模型以满足特定需求。数字化转型网www.szhzxw.cn
Molmo2模型允许用户就图片或视频提问,并能根据视频中识别的模式进行推理。AI2感知推理与交互研究负责人Ranjay Krishna表示,这些模型不仅能提供答案,还能清晰指示某些事件发生的时间和空间。此外,Molmo2还具备生成描述性字幕、追踪物体数量以及检测长视频序列中的罕见事件的能力。
用户可以在Hugging Face和Ai2Playground上使用Molmo2,后者是AI2提供的平台,用户可以体验各种工具和模型。此次发布凸显了 AI2 对开源的承诺。分析师Bradley Shimmin指出,发布与该模型相关的数据和权重对企业至关重要,尤其是在数据主权的背景下。
Molmo系列中的模型参数相对较小(40亿或80亿参数),对许多企业来说更具成本效益。Shimmin强调,企业逐渐意识到模型规模并非唯一关键因素,训练数据的透明度和责任感同样重要。
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
