StepZenith 于 3 月 4 日正式宣布,继 Step3.5Flash 模型开源后,进一步实现了 Agent 基础模型的全栈开源,并向全球开发者提供预训练权重(Base)、中训练权重(Midtrain)及配套的 Steptron 训练框架。
作为专为代理场景设计的模型,Step3.5Flash采用稀疏的MoE架构,总参数数为1960亿。通过优化仅在推断时激活约110亿个参数,实现了极高的能效比。在单请求代码任务中,其推理速度可达350 TPS。凭借出色的复杂推理能力和长链任务处理能力,该模型现在具备在推理深度方面挑战顶级闭源模型的能力。
目前,Step3.5Flash 活跃于开源社区,其在 Hugging Face 上的下载量超过 30 万次,并在 OpenRouter Trending 上排名第一。在著名的开源项目OpenClaw中,被称为“小龙虾”,该模型因其在速度、稳定性和代理兼容性方面的显著优势,已攀升至全球使用量第二。
这种全栈开源不仅丰富了开源大模型生态系统的多样性,还为开发者提供了更灵活、更透明的底层支持,用于构建高性能代理,标志着国内大型模型在平衡模型性能与推理成本方面的重要突破。
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

本文由数智化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数智化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
