针对复杂智能体任务中的上下文扩展瓶颈,M3在底层自主研发了稀疏注意力架构(MSA),相比传统方案实现更精确的KV分块与算子层优化,计算速度较同类开源方案提升4倍以上;在1M上下文下,其每Token计算量仅为上代模型的二分之一十分之一,预填与解码阶段分别实现超9倍和15倍的加速。
在原生百万亿量级交错数据的混合训练下,M3的语义空间高度融合,在SWE-Bench Pro等软件工程及多模态权威评测中超越GPT-5.5和Gemini3.1Pro。在极限任务实测中,M3展现出极强的长线程自主规划力,不仅历时12小时自主复现ICLR顶级论文实验,更在无参考代码下连续运行24小时、调用工具近两千次,将Hopper架构上的FP8矩阵乘硬件利用率从7.6%提升至71.3%,并在开放式PostTrainBench中自主调度模型完成“数据-训练-迭代”全流程。数智化转型网www.szhzxw.cn
伴随M3发布,专为长程复杂协作设计的MiniMax Code智能体产品与极具价格竞争力的Token Plan及API服务也同步上线,并承诺在10天内开源模型权重。MiniMax M3的推出不仅打破了前沿多模态与长上下文技术由海外闭源模型垄断的格局,更以全要素开源的形式重塑了国内开发者生态的性价比边界。
若您对人工智能感兴趣,可添加数智化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数智化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数智化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数智化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自数智化转型网,版权归作者所有。文章内容仅代表作者独立观点,不代表数智化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

本文由数智化转型网(www.szhzxw.cn)转载,编辑/翻译:数智化转型网(Professionalism Achieves Leadership 专业造就领导者)白龙
