据普华永道调查显示,79%的组织已在生产环境中部署了某种形式的AI代理,96%计划进一步扩展。然而,一份来自拥有6年企业基础设施自动化经验工程师的最新报告指出,AI代理正在悄无声息地产生大量未被追踪的混沌工程故障。
与传统人类工程师执行的混沌工程实验不同,AI代理在触发操作前不会评估系统当前的「吸收容量」——即系统还能承受多少额外压力。当AI代理检测到异常并自动重启服务时,往往无法知晓共享连接池已处于87%饱和状态,或依赖数据库正在执行后台索引重建,最终触发「惊群效应」导致级联故障。
Gartner预测,到2028年33%的企业软件将包含代理式AI,但同时警告40%的相关项目将因风险管控不足而取消。AI事件数据库数据显示,2024至2025年间,AI相关事故报告增加了21%,但大多数组织尚无分类标准将AI代理行为标记为故障触发源,导致事后复盘时「代理」完全隐形。
行业专家呼吁建立「弹性预算」模型——将系统吸收容量视为实时可消费资源,而非静态阈值,以应对AI代理引入的新型风险。
来源:VentureBeat,2026年5月26日
