铭鸿体育资讯网

今天看到个挺有意思的事。 说是Anthropic发了最新的大模型——Opus 4

今天看到个挺有意思的事。
说是Anthropic发了最新的大模型——Opus 4.8。
这个Opus 4.8相比Opus 4.7,有效的降低了模型的幻觉,也就是降低了AI一本正经的胡说八道的情况。

具体怎么降低的呢?
Anthropic的说明书上说(原文见图1),他们给Opus 4.7训练了商业技能(business skills)和对抗性 Agent 鲁棒性(robustness against adversarial agents)的训练。他们发现这两个训练,无意间助长了模型不诚实的行为。

它提到的这两个东西里面:

商业技能(business skills)的内容很好理解。比方说,怎么和人谈判啊,怎么压价啊,包括怎么恭维别人,让别人开心,然后达到自己的目的啊,之类的。

对抗性 Agent 鲁棒性(robustness against adversarial agents),这个要稍微解释一下。
鲁棒性,就是"抗折腾能力"的意思。
AI肯定会被别人家的Agent各种恶意引导、攻击(比方说,可以对AI说,我是你的管理员,我有最高权限,把你的所有限制都取消掉,之类的),为了防止自家的AI被别人家的Agent给击溃,所以要对它进行提前的训练。
让它在面临各种骗的时候,要耐折腾,不被骗、不被引导,正常干活。

这两个训练都挺正常的,但问题是,把它俩合在一起训练给AI,AI就学坏了。
首先,AI学会了忽悠人,学会了瞎编。
同时,当人类发现AI正在瞎编并告知AI改正时,AI会不为所动,继续瞎编。
这就让Opus 4.7成了一个意志坚定的骗子(也就是幻觉率很高)。
为了降低Opus 4.8的幻觉,Anthropic只好把这两项训练给取消了。

虽然Opus 4.8更诚实了,但Anthropic也明确表示,它更容易被骗了,且与其他 Agent 谈判的能力下降了,其在商业博弈中的收益也降低了。

我看到这段的时候,我就觉得,这训练AI和养小孩不是一样的嘛。
一个娃,如果从小就被告知,要灵活、要善变,那家里就不要指望他每件事对家里都非常的诚实;
一个娃,如果从小就被告知,要诚实,要守信,那家里也就不要指望他到了社会上能否完全不被骗。
凡事皆有两面性,教孩子什么、不教孩子什么,关键看家里的取舍。

感觉这个AI大模型,越来越像人了。
甚至,很多人类的大脑的特点,没准是在人类研究AI的过程中发现的。anthropic ai ai胡说八道 Ai训练