数智化转型网szhzxw.cn 人工智能资讯 人工智能资讯|蚂蚁百灵团队全新开源高性能思考模型 Ring-flash-2.0

人工智能资讯|蚂蚁百灵团队全新开源高性能思考模型 Ring-flash-2.0

蚂蚁百灵大模型团队近日宣布,正式开源其最新的高性能思考模型 ——Ring-flash-2.0。这款模型是在 Ling-flash-2.0-base 基础上经过深度优化而成,标志着人工智能领域的一次重大进步。Ring-flash-2.0的总参数达到100亿,但在每次推理时,仅激活其中6.1亿,这种高效的激活机制为模型提供了强大的计算能力,同时也节省了大量资源。

从团队的介绍来看,Ring-flash-2.0在多个高难度基准测试中表现出色,包括数学竞赛、代码生成以及逻辑推理等。其性能不仅超越了同类的40亿参数模型,甚至能够与更大规模的开源稀疏模型(MoE)以及一些闭源的高性能思考模型 API 相媲美,显示出其卓越的竞争力。

为了全面提升 Ring-flash-2.0的模型能力,蚂蚁百灵团队设计了一套创新的两阶段强化学习(RL)训练流程。首先,通过轻量化的 Long-CoT(长序列链式思考)SFT(有监督微调),使 Ling-flash-2.0-base 模型能够掌握多种思考方式。接着,采用可验证奖励的 RLVR(强化学习可验证奖励)训练,持续激发模型的推理潜能。最后,加入了强化学习人类反馈(RLHF)阶段,以增强模型的通用能力。

值得一提的是,Ring-flash-2.0的模型权重、强化学习训练方案和数据配方都将完全开源,为广大开发者和研究者提供了宝贵的资源。感兴趣的用户可以在 Hugging Face 和 ModelScope 上获取相关资料,开始探索这款强大的模型。

随着 AI 技术的不断发展,Ring-flash-2.0无疑为未来的智能应用开辟了新的可能,期待它在各个领域的广泛应用和更进一步的突破!

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)萍水

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。http://www.szhzxw.cn/96177.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部