尽管OpenAI正在全力推广其下一代智能浏览器ChatGPT Atlas,但该公司的内部安全总监Dane Stuckey近日公开表达了对其潜在安全风险的担忧,引发了业界关注。
Stuckey 指出,Atlas 面临的主要挑战之一是“提示注入”攻击,该攻击尚未完全解决。这种类型的攻击巧妙地在网页、电子邮件或其他内容中嵌入恶意指令,以诱骗 AI 代理执行意外作。其影响不仅会干扰用户的购买行为,还会导致电子邮件内容或登录凭据等私人数据被盗。
他坦言,尽管OpenAI在Atlas中进行了大规模的安全测试,并引入了多种保护机制和新的模型训练方法,但“提示注入”仍然是一个难以在短期内完全消除的棘手开放问题。
为了降低风险,OpenAI在Atlas中部署了两项关键防御措施:第一种是“注销模式”,在必要时阻止AI代理对用户数据的访问,防止信息从源头泄露;二是“监控模式”,适用于敏感网站,需要用户在关键交互时进行人工确认和监督,以确保运营安全。
Stuckey 表示,该团队正在加速开发更多的保护功能和快速响应系统,以便在面临潜在攻击时立即进行干预和解决问题。“Atlas 的安全挑战不仅仅是技术问题,更是对人机协作新边界的考验,”他强调。
声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
