铭鸿体育资讯网

前沿AI模型在企业IT战场上集体“翻车”！Claude Opus 4.7、GPT

2026-05-28 09:49:11 智研未来科技

前沿AI模型在企业IT战场上集体“翻车”！Claude Opus 4.7、GPT-5.5、Qwen3.7 Max齐刷刷跌破50%！

IBM与Artificial Analysis联合推出ITBench-AA，这是首个专注于企业级IT智能体的基准测试，首期聚焦Site Reliability Engineering（SRE）场景。测试基于Kubernetes真实事故响应，涉及日志、指标、追踪、依赖分析等多模态运维数据，要求智能体精准定位根因实体。结果显示：Claude Opus 4.7（47%）、GPT-5.5（46%）、Qwen3.7 Max（42%）等顶级前沿模型均未能达到50%及格线，暴露了当前AI Agent在复杂企业生产环境下的显著局限。

阅读：10 点赞：0

猜你喜欢

哈哈哈ai客服就负责气死客人

2026-05-23 生番茄记

标签：客服 ai 人工智能人工智能

朱自清的《荷塘月色》，被人塞进AI检测软件里跑了一圈。结果，屏幕上红灯大亮，报

朱自清的《荷塘月色》，被人塞进AI检测软件里跑了一圈。结果，屏幕上红灯大亮，报

2026-05-27 诗成北斗

标签： ai 朱自清人工智能

【马斯克甩出“王炸”！1.5万亿参数的Grok5来了，还要用“作弊码”掀翻AI

【马斯克甩出“王炸”！1.5万亿参数的Grok5来了，还要用“作弊码”掀翻AI

2026-05-27 渡势行

标签： ai grok 伊隆·马斯克编程人工智能

这个时代已经脱离不了AI了

2026-05-27 鲍信聊商业

标签： ai 煤老板互联网淘宝人工智能

电力，才是真正的长牛底层赛道全世界都在疯狂炒AI、算力、光模块，但所有人都

电力，才是真正的长牛底层赛道全世界都在疯狂炒AI、算力、光模块，但所有人都

2026-05-27 天春畅谈商业

标签： ai 德龙激光人工智能

AI冷调慵懒风 ai创作 ai写真

AI冷调慵懒风 ai创作 ai写真

2026-05-27 荣巨笑说小姐姐

标签： ai

算力革命背后，AI电力链才是真正的隐形王者！这3只票最有10倍潜力最近跟圈内

算力革命背后，AI电力链才是真正的隐形王者！这3只票最有10倍潜力最近跟圈内

2026-05-27 韭菜王

标签： ai 英伟达英诺赛科人工智能