阿里通义Fun-ASR语音模型升级垂直领域识别率跃升超15%-数智化转型网szhzxw.cn

阿里通义正式推出新一代端到端语音识别大模型Fun-ASR，该模型通过强化上下文感知与高精度转写能力，在家装、保险等垂直行业场景中实现语音识别准确率超15%的突破性提升。实测数据显示，保险行业准确率较前代提升18%，家装、畜牧等领域增幅达15%-20%。数字化转型网www.szhzxw.cn

作为大语言模型驱动的语音识别算法，Fun-ASR采用自研语音算法与Qwen3监督微调技术，结合前沿模型架构与文本模态对齐技术，在保持语言处理优势的同时，集成RAG检索增强方案，支持超1000个自定义热词导入。该功能可自动匹配音频中的领域热词、历史文档及上下文记录，显著优化特定场景下的关键词识别效果。数字化转型网www.szhzxw.cn

针对语音识别中的噪声干扰、语种混淆及生成幻觉等痛点，研发团队创新性引入强化学习（RL）技术，通过动态优化策略减少识别误差，系统稳定性与可靠性获实质性提升。值得关注的是，模型在四川话、粤语、闽南语等方言识别中表现优于同类产品，同时适应远场拾音、近场降噪等复杂声学环境，覆盖会议室、工位、超市、户外等多元场景。数字化转型网www.szhzxw.cn

训练数据层面，Fun-ASR基于上亿小时音频数据构建，深度融合互联网、科技、畜牧、汽车等十余个领域的专业术语库。这一数据优势使其在垂直行业识别中展现出显著优势，例如在畜牧行业可精准识别牲畜叫声与环境噪声中的关键指令。数字化转型网www.szhzxw.cn

阿里通义技术团队表示，Fun-ASR的进化标志着语音识别技术从通用场景向专业化、场景化深度渗透。随着模型在更多行业落地，其动态热词更新与多模态交互能力将进一步推动语音交互效率革新。数字化转型网www.szhzxw.cn

声明：本文来自网络，版权归作者所有。文章内容仅代表作者独立观点，不代表数字化转型网立场，转载目的在于传递更多信息。如有侵权，请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网（www.szhzxw.cn）转载而成，来源于网络；编辑/翻译：数字化转型网（Professionalism Achieves Leadership 专业造就领导者）鲍勃

阿里通义Fun-ASR语音模型升级垂直领域识别率跃升超15%

中共中央国务院关于实施就业优先战略促进高质量充分就业的意见

每日人工智能资讯|人类学习范式登场！Deep Machine Intelligence 发布 PhysBrain 1.0：赋予机器人物理常识

每日人工智能资讯|你能在水下听周杰伦的歌吗？杭州公司推出AI音乐护目镜，增强现实曲目进入场景专业化时代

人工智能资讯|阿里腾头哥自研AI芯片振武810E发布

汽车出海如何再攀高峰？两会代表委员有话说

联系我们

微信扫一扫关注我们

Meta陷入史上最大AI训练数据侵权案！2396部影片非法使用，面临3.59亿美元天价索赔

AWS CEO：用 AI 取代初级员工是 “最愚蠢的想法”

相关推荐

联系我们

微信扫一扫关注我们