‌AI浏览器陷“话术陷阱”,OpenAI自研黑客机器人反制攻击

‌AI浏览器陷“话术陷阱”,OpenAI自研黑客机器人反制攻击

近日,OpenAI承认,其AI浏览器Atlas面临的提示词注入攻击风险将长期存在,这类攻击能通过网页或邮件中的隐蔽指令,操控AI执行如发送辞职信等恶意操作,其本质如同数字时代的“钓鱼诈骗”,难以彻底根除。面对这一“永无止境”的安全挑战,OpenAI并未依赖传统防御,而是开创性地训练了一款由强化学习驱动的自动化攻击机器人。

这款AI“红队”工具能在模拟环境中,以人类无法企及的速度和深度,反复试探Atlas智能体的思维逻辑,主动挖掘新型攻击路径。其成果显著:不仅复现了“邮件诱导辞职”等复杂多步攻击,更发现了此前人工测试与外部报告均未提及的全新漏洞,实现了从被动防御到主动狩猎的范式转变。

为降低风险,OpenAI在产品设计中嵌入了关键安全机制:任何涉及邮件发送或支付的高权限操作,系统均强制要求用户人工确认。同时,专家警告,智能体浏览器的高访问权限与中等自主性构成极高风险乘积,其价值与风险当前严重失衡。尽管OpenAI持续更新补丁并加强多层防护,但安全研究员仍质疑:在日常使用中,用户是否真能承受为便利而付出的潜在数据泄露代价?

原创文章,作者:校草,如若转载,请注明出处:https://www.kejixun.co/article/741849.html

校草的头像校草认证作者

相关推荐

发表回复

登录后才能评论