据CSDN和稀土掘金发布的2026年5月AI大模型全景报告,在综合基准测试中,国产模型表现亮眼,Kimi K2.6(月之暗面)以94.3分登顶榜首,DeepSeek V4以93.8分紧随其后,OpenAI GPT-5以93.5分排名第三,Claude 4 Opus(Anthropic)以93.1分排名第四。
前六名还包括Google的Gemini Ultra 3.0(92.7分)和阿里Qwen3-235B(92.4分)。排名靠前的15个模型在各项基准测试中性能差距仅3个百分点,竞争极为激烈。
国产模型在数学推理、长上下文和中文处理方面优势明显,Kimi K2.5在TaxEval v2税务评估准确率达74.2%,超越OpenAI和Anthropic旗下所有模型。中国AI日均词元调用量已突破140万亿,较年初增长超40%,规模化落地持续加速。
端侧AI也成为趋势,小米MiMo-V2.5正式开源,支持手机端本地运行百亿参数大模型,降低对云端算力依赖。
来源:CSDN(原文链接)
