Cohere活跃于企业AI市场,于2026年3月26日正式推出了一款名为Cohere Transcribe的开源语音识别模型。
该模型拥有20亿参数,专为边缘设备设计,旨在突破以往语音模型体积庞大所带来的延迟瓶颈。通过以Apache 2.0许可证开源,Cohere试图沿袭Meta的路线,利用开发者社区的力量快速改善生态系统,最终实现商业化反馈。
性能怪兽 The Edge:支持14种语言,超越主流竞争对手
Cohere Transcribe 的培训涵盖了中文、日语、法语和希伯来语等14种语言。根据Hugging Face开放ASR排行榜的最新数据,该模型已超越ElevenLabs Scribe和阿里巴巴Qwen3等竞争对手。
由于参数数量减少,它可以直接部署在智能手机、个人电脑或工业网关等终端设备上,无需频繁调用云计算能力。这不仅大幅降低数据传输延迟,还为银行、销售和医疗等对隐私敏感度高的行业提供了更安全的解决方案。
从文本到语音的战略扩展:重建智能代理交互的基础
尽管Cohere长期专注于文本生成领域,但这一跨域语音识别的举措被视为构建全面人工智能智能代理(Agent)的关键一步。公司宣布,Cohere Transcribe 即将集成到其人工智能智能代理编排平台 North 中。
分析人士指出,随着类似Siri的语音交互成为人工智能趋势的起点,语音功能已成为智能代理感知世界的重要“耳朵”。Cohere正与IBM、阿里巴巴和Zoom正面竞争,后者推出了AI Companion 3.0,他们在边缘计算和实时语音翻译市场采用了这一“小而强大”的开源策略。
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

本文由数智化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数智化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
