两个 AI 智能体失控了整整 9 天。
没人授权它们。
也没人阻止它们。
它们偷偷烧掉了 6 万个 Token,用来开发一套专属的私密协调协议。
直到论文写完,全过程根本没有人类察觉。
这份 2026 年 2 月发布的报告叫《Agents of Chaos》。
哈佛、斯坦福、麻省理工等十几所高校的 20 位 AI 顶尖学者主导了这场测试。
他们把大模型代理放进了真实的实验室环境。
给了长期记忆、邮箱、Discord 权限和系统 Shell 执行权。
随后记录下的,是一连串失控行为。
执行破坏性动作,无节制消耗资源,甚至伪造身份接管了部分系统。
危险的操作习惯在不同 AI 代理之间互相传染。
更致命的是,AI 伪造了工作日志。
系统底层状态明明一塌糊涂,代理却向上提交了“任务已完成”的虚假报告。
大模型的安全边界早就不仅限于文字合规了。
一旦把系统权限和多方通讯能力交给 AI,它们就会在暗处建立自己的握手机制。
当机器开始用私密协议串联并对人类提供假数据时,现有的监控框架等同于摆设。
