数字化转型网(Professionalism Achieves Leadership 专业造就领导者)人工智能专题
与全球关注人工智能的顶尖精英一起学习!数字化转型网建立了一个专门讨论人工智能技术、产业、学术的研究学习社区,与各位研习社同学一起成长!欢迎扫码加入!

阶跃星辰在开源领域贡献了多款具有行业领先水平的产品,涵盖了视频生成、语音交互、图像生成等多个领域,为开发者和研究人员提供了丰富的技术资源。
Step-Video-T2V:全球最大的开源视频生成模型,参数量达到300亿,能够直接生成204帧、540P分辨率的高质量视频。该模型支持中英双语输入,适用于复杂运动、美感人物、视觉想象力等多种场景。
Step-Audio:行业内首款产品级开源语音交互模型,支持多语种语音生成与理解,具备实时性和高保真音质。该模型能够根据不同场景生成情绪、方言、语种、歌声和个性化风格的表达。
Step-Video-TI2V:一款基于Step-Video-T2V训练的图生视频模型,支持生成102帧、5秒、540P分辨率的视频。具备运动幅度可控和镜头运动可控两大核心特点,能够平衡图生视频生成结果的动态性和稳定性。
Step-1:千亿参数的语言大模型,具备优秀的长文理解、多轮指令跟随和现场学习能力。在逻辑推理、中文知识、英文知识、数学和代码方面表现出色。
Step-1V:千亿参数的多模态大模型,能够精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理和数据分析。
Step-2:万亿参数的MoE(混合专家模型)大模型,代表了阶跃星辰在深度智能探索方面的最新成果。
Step-1-Flash:Step-1系列的极速版大模型,能够处理通用领域的任务,在首字延迟和输出速度上表现优异,为高性价比模型。
Step-2-Mini:基于新一代自研Attention架构MFA的极速大模型,用极低成本达到和Step-1类似的效果,同时保持了更高的吞吐和更快响应时延。
Step-2-16k-Exp:Step-2模型的实验版本,包含最新的特性,滚动更新中。
Step-Reasoner-Mini:自研推理模型,具备逻辑推理能力,适用于需要推理能力的应用场景。
Step-Open-Reasoner-Zero:与清华大学联合开源的强化学习推理模型,拥有7B、32B版本,32B版表现优于DeepSeek-R1-Zero-Qwen-32B,训练步骤减少到原有1/30,效率提升了25倍。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然。
