谷歌最近发布了 Gemini 2.5 Flash 原生音频的更新,显著提升了其语音助手的功能。该版本旨在更好地处理复杂的工作流程,提高用户指令执行的准确性,使对话更加自然流畅。根据谷歌反馈,新版本将对开发者指令的遵从率从84%提升至90%,显示语音助手在理解和执行用户请求方面取得了显著进步。
此次更新还显著提升了多步对话的质量。用户与语音助手互动时将体验到更顺畅的沟通。这一改进使助理能够更好地应对复杂的问题和任务,提供更高效的服务体验。数字化转型网www.szhzxw.cn
谷歌还透露,更新后的音频模型在ComplexFuncBench基准测试中实现了71.5%的功能调用准确率,而OpenAI的gpt-realtime测试则为66.5%。不过需要注意的是,谷歌可能没有在测试中使用最新版本的OpenAI。数字化转型网www.szhzxw.cn
该更新已在Google AI Studio、Vertex AI、Gemini Live和Search Live中提供,Google Cloud用户也开始使用这项新技术。开发者可以通过Gemini API测试该模型,进一步探索其潜力。
这次更新不仅仅是功能改进;这也体现了谷歌在人工智能领域不断进步的决心和努力,为用户提供更优质的体验。
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
