更新的这个Claude mythos,这个是之前给NATO这类机构用的模型,现在开放民用版本了。阉割了网络安全/生物化学合成这类知识。实测了一下,长任务表现太惊人了,和其他模型有代差的。除了特别贵,开多agent跑研究任务,10分钟轻松烧掉1M的token,没什么别的毛病。这个程度,反倒没有公开炒作成AGI,说明后面还有没放出来的东西。各大机构内部实际在用的,大概率已经无限接近某种难以理解的东西了。
更新的这个Claude mythos,这个是之前给NATO这类机构用的模型,现在开放民用版本了。阉割了网络安全/生物化学合成这类知识。实测了一下,长任务表现太惊人了,和其他模型有代差的。除了特别贵,开多agent跑研究任务,10分钟轻松烧掉1M的token,没什么别的毛病。这个程度,反倒没有公开炒作成AGI,说明后面还有没放出来的东西。各大机构内部实际在用的,大概率已经无限接近某种难以理解的东西了。