人工智能资讯|NVIDIA 发布 PersonaPlex-7B-v1：一款重新定义实时语音交互的全双工黑科技-数智化转型网szhzxw.cn

NVIDIA研究团队正式发布了一款名为PersonaPlex-7B-v1的全双工语音对语音对话模型。该模型彻底打破了传统AI语音助手“听一次，回应一次”的僵化模式，旨在实现更自然、更贴近人际互动的对话体验。

与以往需要多阶段的架构不同，如ASR（语音转文本）、LLM（大型语言模型）和TTS（文本转语音），PersonaPlex采用单一的Transformer架构来完成语音理解和生成的全部过程。AIbase发现这种“端到端”设计显著降低了响应延迟，使AI能够处理自然中断、重叠语音和即时反馈。简单来说，这就像真实的人际对话;AI在说话时会持续倾听，即使用户突然打断，也能迅速做出反应。

此外，该模型在个性化控制方面表现出色。通过“语音+文本”双重指导，用户不仅定义AI的角色背景，还精确控制其语气和语调。AIbase了解到，NVIDIA在训练过程中将大量真实通话数据与合成场景结合起来，使模型在严格遵守行业商业规则的同时，具备自然语言习惯。当前评估结果显示，PersonaPlex-7B-v1在对话流畅度和任务完成率方面优于大多数开源和闭源系统。

若您对人工智能感兴趣，可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商，可联系数字化转型网小助手思思（17757154048，微信同号）