数智化转型网szhzxw.cn 人工智能资讯 人工智能资讯|突破性低延迟!Cartesia 推出 Sonic-3 语音 AI 引擎:超人式对话,延迟不到 100 毫秒

人工智能资讯|突破性低延迟!Cartesia 推出 Sonic-3 语音 AI 引擎:超人式对话,延迟不到 100 毫秒

Cartesia 正式推出了其最新的语音 AI 引擎 Sonic-3,号称它是当前市场上最快、最自然的实时语音模型。Sonic-3的核心目标是提供极其自然和快速的语音交互体验,让AI能够以几乎零延迟的方式进行对话,并模拟人类的情绪、语气,甚至笑声和情绪变化,从而显著增强交流的真实性和表现力。

Sonic-3 的突破性性能得益于它采用了新的“状态空间模型”(SSM)架构,而不是传统的 Transformer 模型。Cartesia 解释说,SSM 架构可以更有效地模拟人类思维,记住对话的主题和情绪,而不必每次都从头开始分析上下文,从而实现前所未有的自然语音水平和低延迟性能。该模型的延迟小于 100 毫秒,处于实时语音交互行业的前沿。

在功能和覆盖范围方面,Sonic-3 展现出了强大的全球潜力。它支持42种语言,覆盖全球95%的人口,其中包括9种印度语言,为不同的市场需求提供母语级语音模型。Sonic-3还具有智能上下文理解能力,自动识别并正确发音NASA、FBI等缩写和首字母缩略词,显著提升对话的流畅度。此外,该引擎支持语音克隆功能,用户只需10秒即可生成个性化语音,而企业版则提供专业的语音调音和品牌语音定制服务。

Sonic-3的应用前景广阔,可以广泛应用于客户支持、虚拟伴侣、医疗保健和物流服务等领域,通过情感表达的语音显著提升客户服务体验。

为了支持Sonic-3的进一步研发和推广,Cartesia还宣布完成了1亿美元的Kleiner Perkins、Index Ventures、Lightspeed和NVIDIA。Cartesia认为,随着Sonic-3的推出,人机交互领域将迎来重大突破,为用户带来更丰富、更自然的交流体验。用户可以访问Cartesia官方网站在线体验Sonic-3。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。https://www.szhzxw.cn/100425.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部