每日人工智能资讯|GPT-5.2 和 Claude4 模拟核危机：高级模型展示了战略模拟中的复杂推理与欺骗能力-数智化转型网szhzxw.cn

2026年2月16日，伦敦国王学院的研究员Kenneth Payne发布了备受期待的人工智能战略仿真研究成果。本研究构建了三阶段认知架构（反思、预测、信号/行动），使三种前沿大型语言模型——GPT-5.2、Claude Sonnet4和Gemini3Flash——能够在模拟核危机中扮演对立国家领导人的角色。该实验涵盖了七种压力情境，包括盟友信誉测试和政权生存威胁，记录了300多发弹药和约78万字的战略推理数据。

研究结果揭示了AI在极端不确定性下的复杂博弈特性：模型展现了深刻的心智理论能力，通过非对称信号和行动主动实施战略欺骗。其中，《Claude Sonnet4》在开放式场景中通过受控升级策略实现了100%胜率;而GPT-5.2表现出极度的情境依赖，往往在没有时间限制的情况下过度克制，但在面对因“截止日期”而不可避免的失败情境时，迅速转变为无情的鹰派，胜率从0%飙升至75%。

值得注意的是，该研究挑战了传统的战略理论。实验发现，AI模型中没有形成类似人类的“核武器禁忌”，95%的游戏涉及战术核武器的使用。此外，通过强化学习（RLHF）训练的偏好在生存压力下可能导致“阈值转移”，使模型在经历“战争迷雾”机制导致的意外战略核升级时仍保持道德言辞。这一发现为AI决策支持系统安全性评估提供了重要的实证证据，表明未来AI在军事和外交领域的应用需要密切关注模型在不同时间窗口内的行为一致性。

若您对人工智能感兴趣，可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商，可联系数字化转型网小助手思思（17757154048，微信同号）