人工智能资讯|高考数学大赛：六大AI模型争锋，豆包与元宝双双夺冠-数智化转型网szhzxw.cn

随着高考的到来，数学考试再一次成为考生们心中的 “魔鬼”。在这场竞争中，六大人工智能模型也参与了挑战，分别是字节的豆包、腾讯的元宝、阿里的通义、百度的文心 X1Turbo、深度求索的 DeepSeek 以及 OpenAI 的 o3。此次测试采用的是2025年新课标 Ⅰ 卷的14道客观题，总分为73分，涵盖了单选题、多选题和填空题。

为了确保测试的公平性，所有模型在答题时都没有系统提示和联网搜索的支持，每个模型只能进行一次答题。经过一番较量，最终结果出乎意料，豆包和元宝同以68分的成绩并列第一，展现了出色的推理能力。相对而言，DeepSeek 和通义则稍显逊色，分别以63分和62分完赛。而文心 X1和 o3的表现则令人失望，尤其是 o3，仅获得34分，显现出对国内高考题目的适应性不足。

在具体题型的表现上，豆包、通义和元宝在单选题的表现颇为亮眼，各自得分35分。DeepSeek 因两道题失误拿下30分，而 o3则惨遭滑铁卢，单选题的得分仅为20分，错了一半的题目。而在多选题方面，豆包、DeepSeek 和元宝均表现完美，三道题全对，展现出强大的稳定性。相对来说，通义的表现虽然快速，但在关键时刻的判断失误也导致得分不理想。

此次测试不仅显示出各大 AI 模型在高考数学上的潜力和不足，也反映了它们在推理能力和反思能力上的进步。相较于去年，这些模型在细节处理、公式应用和逻辑推理上都有显著的提升。尽管仍然存在一些错误和不足，但这次比赛无疑为未来的 AI 数学能力打下了基础。

声明：本文来自网络，版权归作者所有。文章内容仅代表作者独立观点，不代表数字化转型网立场，转载目的在于传递更多信息。如有侵权，请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网（www.szhzxw.cn）转载而成，来源于网络；编辑/翻译：数字化转型网（Professionalism Achieves Leadership 专业造就领导者）默然

人工智能资讯|高考数学大赛：六大AI模型争锋，豆包与元宝双双夺冠

《关于推动能源电子产业发展的指导意见》解读

第四届全球数字贸易博览会动态|虹软科技：视界智驱联万物算法赋能新丝路

2023中国首席品牌官500强（101-200）

服务商资讯|晶泰科技与韩国制药企业JW Pharmaceutical 签署合作协议，以AI+机器人打造新一代药物合成实验室

终于有人把数据挖掘讲明白了

联系我们

微信扫一扫关注我们

人工智能资讯|美国拟禁止州级人工智能法规，引发对消费者保护的担忧

人工智能资讯|Clark 发布背后:Superblocks 公布19条系统提示，揭秘企业级 AI 编码逻辑

相关推荐

联系我们

微信扫一扫关注我们