Mistral重磅推出Voxtral：开源AI音频模型的新时代来临！-数智化转型网szhzxw.cn

随着人工智能技术的飞速发展，语音正迅速成为我们与机器沟通的主要方式。法国初创企业 Mistral 近日正式发布了其首个开源音频模型 ——Voxtral，旨在打破大型企业封闭系统的垄断，为开发者提供一个更灵活且经济的替代方案。

Mistral 宣称 Voxtral 是首个能够在实际应用中提供 “真正可用的语音智能” 的开源模型。这意味着，开发者不再需要在低成本的开源系统和高效但封闭的解决方案之间做艰难选择。Voxtral 以其 “不到一半价格” 的优势，为企业提供了一个更加经济的选择。

据 Mistral 介绍，Voxtral 可以转录长达30分钟的音频。由于其基于大型语言模型 Mistral Small3.1，用户能够理解最长可达40分钟的音频内容。用户不仅可以提出与音频内容相关的问题，还能生成摘要，甚至将语音指令转化为实时操作，如调用 API 或执行特定功能。此外，Voxtral 还具备多语言支持，能够理解和转录英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语和意大利语等多种语言。

Mistral 提供了两种 “语音理解模型” 的变体。首先是 Voxtral Small，拥有240亿个参数，适用于生产级部署，并与 ElevenLabs Scribe、GPT-4o-mini 和 Gemini2.5Flash 等竞争。其次是 Voxtral Mini，具有30亿个参数，适用于本地和边缘部署。还有一个超经济版的3亿参数模型，称为 Voxtral Mini Transcribe，专为转录场景优化，其性能承诺超越 OpenAI 的 Whisper，价格却不到其一半。

用户可以通过 Hugging Face 免费下载 Voxtral 的 API，或在 Mistral 的聊天机器人 Le Chat 中进行测试。根据公司的说法，API 的集成费用从每分钟0.001美元起。此次发布恰逢 Mistral 一个月前推出的推理模型 Magistral，这些模型通过逐步解决问题来提高可靠性。

作为欧洲顶尖的人工智能公司之一，Mistral 一直以来积极推动开源 AI 模型的发展。值得一提的是，近期有消息称 Mistral 正在与投资者洽谈，计划筹集高达10亿美元的资金，其中包括阿布扎比的 MGX 基金。

声明：本文来自网络，版权归作者所有。文章内容仅代表作者独立观点，不代表数字化转型网立场，转载目的在于传递更多信息。如有侵权，请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网（www.szhzxw.cn）转载而成，来源于网络；编辑/翻译：数字化转型网（Professionalism Achieves Leadership 专业造就领导者）鲍勃

Mistral重磅推出Voxtral：开源AI音频模型的新时代来临！

人工智能资讯|静安区AI黑马杀入全国前五！迈富时凭智能体中台3.0跻身《2025中国AI智能体百强》第四

主数据管理理论与实践

人工智能应用案例|零售行业——ThredUp使用人工智能记住客户的喜好

《关于规范中央企业采购管理工作的指导意见》有关说明

关于印发《2020年省工业和信息化厅党风廉政建设工作要点》的通知

联系我们

微信扫一扫关注我们

迷路森林5小时，ChatGPT成救星！AI导航的真实案例！

Kimi K2短篇小说创意写作夺冠，超越o3-Pro展现AI文学新高度

相关推荐

联系我们

微信扫一扫关注我们