人工智能资讯|GPT-5.2在AI浏览器创建挑战中获胜，展示了优于Claude Opus4.5的远程编程能力-数智化转型网

当人工智能开始尝试从零开始构建完整的浏览器——包括HTML解析器、CSS布局引擎，甚至自开发的JavaScript虚拟机——它不仅面临代码生成，还要面对逻辑一致性、任务持久性和工程理解的严格考验。

最近，知名的AI编码工具Cursor发布了一项令人印象深刻的内部测试结果：OpenAI最新模型GPT-5.2在长期高复杂度自主编程任务中显著优于Anthropic的Claude Opus 4.5，展现了前所未有的工程级别可靠性。

该实验不仅仅是拼凑代码片段，而是要求模型在数周内持续推进涉及数百万行代码的系统级项目。在此过程中，AI必须反复理解上下文，纠正早期设计缺陷，协调模块依赖关系，并始终聚焦最终目标。测试显示，GPT-5.2在长期推理中几乎没有“目标漂移”——这是AI偏离原始任务意图的常见问题。尽管Claude Opus 4.5在短期问答和单文件编码方面表现良好，但在面对此类“马拉松式”工程挑战时，往往过早终止任务、寻求简化路径或将控制权交还给人类。

这一差异凸显了当前大型模型“自主代理”能力的一个关键分水岭：它们是否能够像人类工程团队一样独立继续大型项目。Cursor团队指出，GPT-5.2不仅完成了浏览器构建，还成功复制了Windows 7模拟器，并领导了一项涉及超过一百万行代码的遗留系统迁移任务——这些原本需要数月人工努力的工作，如今正逐步被AI以惊人的连贯性接手。

目前，GPT-5.2已被整合进Cursor平台，允许开发者直接调用其能力进行高级编程协作。这一举措不仅提升了个人开发效率，也预示了一个新范式：未来，人工智能可能成为能够独立完成端到端软件工程的“数字工程师”。当模型不再只是协助编写函数，而是能够规划架构、调试系统和迭代优化时，软件开发的边界正在彻底重新定义。

若您对人工智能感兴趣，可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商，可联系数字化转型网小助手思思（17757154048，微信同号）