人工智能资讯|阿里通义推出 Qwen3-ASR-Toolkit，实现音视频转录新突破-数智化转型网szhzxw.cn

近日，阿里通义 Qwen 团队发布了一款名为 Qwen3-ASR-Toolkit 的开源 Python 命令行工具。这款工具旨在为用户提供更为便捷的音视频转录服务，特别是在音频时长方面，突破了 Qwen3-ASR-Flash API 的三分钟限制，能够实现小时级的快速转录。这一新工具的推出，无疑为需要进行大规模音频转录的用户提供了强有力的支持。

Qwen3-ASR-Flash 是通义千问系列中最新的语音识别模型，经过海量多模态数据及千万小时规模的自动语音识别（ASR）数据训练而成。它的强大性能为用户提供了高准确率的语音识别能力，使得长时间的音频和视频内容可以被有效转录成文本，极大地提升了工作效率。

Qwen3-ASR-Toolkit 采用了智能静音切分技术（VAD），确保转录过程中句子的完整性。同时，该工具能够自动将任意采样率的音频文件重采样为16kHz 单声道，以提高处理效果。此外，它还支持多线程并行上传分片的功能，这一特性显著缩短了总耗时，使得用户在使用过程中体验更加流畅。

在支持的媒体格式方面，Qwen3-ASR-Toolkit 基于 FFmpeg，几乎涵盖了所有主流音频和视频格式，包括 mp4、mov、mkv、mp3、wav、m4a 等，这使得用户在进行音视频转录时，能够更加灵活地选择文件类型，无需担心格式兼容问题。

声明：本文来自网络，版权归作者所有。文章内容仅代表作者独立观点，不代表数字化转型网立场，转载目的在于传递更多信息。如有侵权，请联系我们。

本文由数字化转型网（www.szhzxw.cn）转载而成，来源于网络；编辑/翻译：数字化转型网（Professionalism Achieves Leadership 专业造就领导者）萍水

人工智能资讯|阿里通义推出 Qwen3-ASR-Toolkit，实现音视频转录新突破

中国新能源汽车出海目的地有哪些？

网络协同制造模式是怎样的？

福建省人民政府关于印发福建省打赢蓝天保卫战三年行动计划实施方案的通知

浅谈数据质量管理

企业数字化转型面临哪些挑战？

联系我们

微信扫一扫关注我们

人工智能资讯|谷歌AI搜索模式杀入西班牙语市场：全球扩张加速，直面ChatGPT竞争白热化

人工智能资讯|奔驰携手字节跳动，共同推出搭载豆包大模型的全新纯电 CLA

相关推荐

联系我们

微信扫一扫关注我们