Google DeepMind 正式发布了 Gemini 3.1 Flash-Lite 预览版,标志着 Gemini 3 系列中最快且最具成本效益的成员的到来。作为Gemini 2.5 Flash-Lite的版本,新型号保持超过360个令牌的速度和平均5.1秒的响应时间,同时实现了显著的智能飞跃。根据人工智能分析指数监测,该模型得分上升了12分,达到34分,并且在 Arena.ai 排行榜上表现出强烈的人类偏好竞争力,Elo得分为1432。
在多模态能力和科学推理等核心维度上,Gemini 3.1 Flash-Lite表现异常出色,GPQA钻石测试得分为86.9%,MMMU-Pro基准测试准确率为76.8%。其性能已超过Claude Opus 4.6和Kimi K2.5等重型机型。值得注意的是,该模型允许开发者自定义思维的“深度”,使其能够灵活适应从简单的自动化转换到复杂的界面构建等多种场景。
然而,性能和速度的双重提升也伴随着显著的成本调整。Gemini 3.1 Flash-Lite 一百万输入代币的价格已提高至 0.25 美元,输出价格从 0.40 美元大幅上涨至 1.50 美元,几乎是之前成本的三倍。
这种定价策略反映了模型提供者在平衡快速推断与高精度逻辑时面临的成本压力。随着该模型在Google AI Studio和Vertex AI上测试,轻量级模型市场正从简单的“低价竞争”向“高性能逻辑可及性”的新阶段过渡。
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

本文由数智化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数智化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
