人工智能初创公司Inception Labs最近宣布发布Mercury2,这不仅是一款高性能推理模型,更代表了其底层架构上的一次大胆“范式转变”。
该模型完全放弃了当前流行的Transformer架构,转而采用基于扩散的模型生成文本,旨在突破传统大型模型的性能瓶颈。
与传统的逐个生成代币(字符)的模型不同,Mercury2更像是一个经验丰富的编辑器。它不再一次生成一个字符,而是可以同时对多个文本块进行全局优化和重写。这种并行处理逻辑使Mercury2在处理复杂逻辑推理任务时展现出显著的速度优势。
根据 AIbase 获得的测试数据,在 NVIDIA Blackwell GPU 驱动下,Mercury2 的生成速度达到惊人的 1009 个令牌每秒。在端到端延迟测试中,该模型响应时间仅为1.7秒,比谷歌的Gemini3Flash快八倍多,远超Anthropic的Claude Haiku4.5。尽管速度极快,其质量仍能与当前顶级轻量级推理模型竞争,尤其是在权威推理基准测试如GPQA Diamond和AIME中。
在商业战略方面,Inception Labs采用了高度竞争的价格计划,投入和产出成本仅为类似竞争对手的四分之一。目前,Mercury2 已正式开放 API 接口,并支持 128,000 个令牌的超长上下文和工具调用函数。对于追求极限响应速度的语音助手、搜索系统和编程工具来说,这种“非常规”的扩散推理模型无疑为其提供了极具吸引力的新选择。
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数智化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数智化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
