人工智能资讯|Step Zenith Step 3.5 闪存发布：一款为代理设计的轻量级开源模型-数智化转型网szhzxw.cn

Stepfun 正式发布了其最新的开源基础模型——Step3.5Flash。该模型专为智能体场景设计，具备强大的推理能力和超快响应速度，旨在为开发者提供更智能、更稳定且更具成本效益的“智能体大脑”。

作为一款高度针对性的轻量化模型，Step3.5Flash在多维度上取得了突破：

超高速：推理速度可达每秒350 TPS（令牌数），尤其擅长代码相关任务。
性能可与闭源模型媲美：在核心代理应用场景和数理逻辑任务中，其性能可与主流闭源大型模型相媲美。
长链任务稳定性：具备处理复杂长逻辑链任务的稳定性，并高效处理256K的超长上下文。

技术架构：效率与深度的平衡

Step3.5Flash采用先进的稀疏专家混合（MoE）架构，总参数数为1960亿，但每个令牌仅激活约110亿个参数。为进一步提升效率，模型引入了MTP-3技术，能够同时预测3个令牌，效率翻倍。此外，通过将滑动窗口与全局注意力结合，模型能够准确捕捉长文本中的关键点，显著降低计算成本。

跨场景的真实测试：从代码到边缘云协作

在实际应用演示中，Step3.5Flash展示了多种功能：

智能编程：它能够仅凭文本描述，基于WebGL2.0引擎自动编写并输出高性能可视化平台。
复杂计算：无需外部工具，它能快速完成诸如算术序列求和和乘积等复杂数学作。
边缘云协作：作为“基于云的大脑”，它可以将用户模糊的需求（如跨平台价格比较）拆解为具体的搜索和爬取子任务，大大简化了本地执行端的难度，确保结果的可靠性。

目前，Step3.5Flash 已在主流平台上完全可用，包括 GitHub、HuggingFace 和 OpenRouter。为了降低本地部署的门槛，Stepfun 专门优化了该模型在个人工作站（如 NVIDIA DGX 和 Apple M4Max）上的性能。此外，公司已宣布启动Step4模型的培训，并邀请全球开发者共同定义下一代代理基础模型。

若您对人工智能感兴趣，可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商，可联系数字化转型网小助手思思（17757154048，微信同号）