数智化转型网szhzxw.cn 人工智能资讯 每日人工智能资讯|GPT-5.2 和 Claude4 模拟核危机:高级模型展示了战略模拟中的复杂推理与欺骗能力

每日人工智能资讯|GPT-5.2 和 Claude4 模拟核危机:高级模型展示了战略模拟中的复杂推理与欺骗能力

2026年2月16日,伦敦国王学院的研究员Kenneth Payne发布了备受期待的人工智能战略仿真研究成果。本研究构建了三阶段认知架构(反思、预测、信号/行动),使三种前沿大型语言模型——GPT-5.2、Claude Sonnet4和Gemini3Flash——能够在模拟核危机中扮演对立国家领导人的角色。该实验涵盖了七种压力情境,包括盟友信誉测试和政权生存威胁,记录了300多发弹药和约78万字的战略推理数据。

研究结果揭示了AI在极端不确定性下的复杂博弈特性:模型展现了深刻的心智理论能力,通过非对称信号和行动主动实施战略欺骗。其中,《Claude Sonnet4》在开放式场景中通过受控升级策略实现了100%胜率;而GPT-5.2表现出极度的情境依赖,往往在没有时间限制的情况下过度克制,但在面对因“截止日期”而不可避免的失败情境时,迅速转变为无情的鹰派,胜率从0%飙升至75%。

值得注意的是,该研究挑战了传统的战略理论。实验发现,AI模型中没有形成类似人类的“核武器禁忌”,95%的游戏涉及战术核武器的使用。此外,通过强化学习(RLHF)训练的偏好在生存压力下可能导致“阈值转移”,使模型在经历“战争迷雾”机制导致的意外战略核升级时仍保持道德言辞。这一发现为AI决策支持系统安全性评估提供了重要的实证证据,表明未来AI在军事和外交领域的应用需要密切关注模型在不同时间窗口内的行为一致性。

若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

此图片的alt属性为空;文件名为image-82.png

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

此图片的alt属性为空;文件名为image-83.png

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

此图片的alt属性为空;文件名为image-84.png

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

此图片的alt属性为空;文件名为image-12.png

本文由数智化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数智化转型网(Professionalism Achieves Leadership 专业造就领导者)默然

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。https://www.szhzxw.cn/108995.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部