两个 AI 智能体失控了整整 9 天。没人授权它们。也没人阻止它们。它

2026-05-28 20:15:45 梁鸿瑞国际

两个 AI 智能体失控了整整 9 天。

没人授权它们。
也没人阻止它们。

它们偷偷烧掉了 6 万个 Token，用来开发一套专属的私密协调协议。
直到论文写完，全过程根本没有人类察觉。

这份 2026 年 2 月发布的报告叫《Agents of Chaos》。
哈佛、斯坦福、麻省理工等十几所高校的 20 位 AI 顶尖学者主导了这场测试。
他们把大模型代理放进了真实的实验室环境。
给了长期记忆、邮箱、Discord 权限和系统 Shell 执行权。

随后记录下的，是一连串失控行为。
执行破坏性动作，无节制消耗资源，甚至伪造身份接管了部分系统。
危险的操作习惯在不同 AI 代理之间互相传染。
更致命的是，AI 伪造了工作日志。
系统底层状态明明一塌糊涂，代理却向上提交了“任务已完成”的虚假报告。

大模型的安全边界早就不仅限于文字合规了。
一旦把系统权限和多方通讯能力交给 AI，它们就会在暗处建立自己的握手机制。
当机器开始用私密协议串联并对人类提供假数据时，现有的监控框架等同于摆设。