Stepfun 正式发布了其最新的开源基础模型——Step3.5Flash。该模型专为智能体场景设计,具备强大的推理能力和超快响应速度,旨在为开发者提供更智能、更稳定且更具成本效益的“智能体大脑”。
作为一款高度针对性的轻量化模型,Step3.5Flash在多维度上取得了突破:
- 超高速:推理速度可达每秒350 TPS(令牌数),尤其擅长代码相关任务。
- 性能可与闭源模型媲美:在核心代理应用场景和数理逻辑任务中,其性能可与主流闭源大型模型相媲美。
- 长链任务稳定性:具备处理复杂长逻辑链任务的稳定性,并高效处理256K的超长上下文。
技术架构:效率与深度的平衡
Step3.5Flash采用先进的稀疏专家混合(MoE)架构,总参数数为1960亿,但每个令牌仅激活约110亿个参数。为进一步提升效率,模型引入了MTP-3技术,能够同时预测3个令牌,效率翻倍。此外,通过将滑动窗口与全局注意力结合,模型能够准确捕捉长文本中的关键点,显著降低计算成本。
跨场景的真实测试:从代码到边缘云协作
在实际应用演示中,Step3.5Flash展示了多种功能:
- 智能编程:它能够仅凭文本描述,基于WebGL2.0引擎自动编写并输出高性能可视化平台。
- 复杂计算:无需外部工具,它能快速完成诸如算术序列求和和乘积等复杂数学作。
- 边缘云协作:作为“基于云的大脑”,它可以将用户模糊的需求(如跨平台价格比较)拆解为具体的搜索和爬取子任务,大大简化了本地执行端的难度,确保结果的可靠性。
目前,Step3.5Flash 已在主流平台上完全可用,包括 GitHub、HuggingFace 和 OpenRouter。为了降低本地部署的门槛,Stepfun 专门优化了该模型在个人工作站(如 NVIDIA DGX 和 Apple M4Max)上的性能。此外,公司已宣布启动Step4模型的培训,并邀请全球开发者共同定义下一代代理基础模型。
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数智化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数智化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
