人工智能资讯|字节火山引擎发布豆包·语音播客模型和豆包・实时语音模型-数智化转型网szhzxw.cn

字节跳动火山引擎发布了两款全新的豆包语音大模型，旨在提升语音识别和语音生成的智能水平。这两款模型分别是豆包・语音播客模型和豆包・实时语音模型，均在多项技术指标上实现了显著的突破。

豆包・语音播客模型

根据官方介绍，只需输入一句话、网页链接、长文本或文档，语音播客模型即可快速搜索学习，生成播客脚本后创作出来;模型可秒级生成双人对话式播客作品，效果自然，具有互相附和、插话、犹豫等播客节奏;自带的深度搜索功能可生成跟进热点话题的播客内容。

豆包・实时语音模型:即刻沟通，无缝交流

豆包・实时语音模型则专注于实时语音识别与生成，广泛应用于在线会议、教育培训等场景。其主要功能包括:

豆包・实时语音模型对企业客户开放使用。该模型支持自然语言高级指令控制，具备唱歌表演、声线模仿、方言演绎等多种能力，语气、用语、思考方式等拟人感大幅提升，能随时打断与主动搭话。

随着这两款豆包语音大模型的上线，字节跳动火山引擎在语音技术领域的布局进一步深化。无论是在播客内容创作，还是实时语音交流方面，这两款模型都展现了极大的应用潜力和市场前景。未来，火山引擎将继续致力于技术创新，不断推动语音交互的发展，助力智能时代的到来。

声明：本文来自网络，版权归作者所有。文章内容仅代表作者独立观点，不代表数字化转型网立场，转载目的在于传递更多信息。如有侵权，请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网（www.szhzxw.cn）转载而成，来源于网络；编辑/翻译：数字化转型网（Professionalism Achieves Leadership 专业造就领导者）默然

人工智能资讯|字节火山引擎发布豆包·语音播客模型和豆包・实时语音模型