GPT-5.6超预期：更低成本，更高智力【天风计算机缪欣君团队】重点关注：智谱、

GPT-5.6超预期：更低成本，更高智力【天风计算机缪欣君团队】

重点关注：智谱、minimax

1、能力端，GPT-5.6从单模型推理进一步走向多Agent推理，Harness编排能力显著提升。

GPT-5.6发布预览版本，旗舰模型Sol在编程、生物、网安等场景能力大幅提升，并在ExploitBench上打平Mythos Preview，而输出Token仅约为后者的1/3。Sol输入/输出定价仅为Fable 5的50%/60%，约为Mythos Preview的1/5和1/4，进一步体现“更贵的模型反而拥有更低的单位任务成本”。

2、迭代还在加速，今年看模型厂商同时在追求能力上限与商业效率

我们推测，GPT-5.6总参数量或在3T左右，Mythos或在10T左右。若判断成立，则OpenAI以相对大幅压缩的参数量和更低推理成本，实现了接近的等效智力，整体表现大超预期。从Opus 4系列参数收缩，到GPT-5.6智力密度提升，模型厂今年的核心方向不仅在单纯探索智力上限，也在升性价比的同时保持模型溢价。我们认为，只要模型迭代速度不放缓，杰文斯悖论就不会停止，持续看好模型突破推动AI产业TAM成长。同时，随着国产开源在下半年逐步进入可用，个别甚至进入好用范畴，看好国产模型演绎更陡峭成长曲线。

3、推理端，显式缓存断点进一步强化“以存储换算力”的趋势。

GPT-5.6新增显式缓存断点，缓存至少维持30分钟，写入按正常输入价格的1.25倍计费，后续读取享受90%折扣。随着模型能力提升、长程任务增多，模型厂商开始以更多KV Cache容量、更长驻留时间和更复杂调度，换取更少的Prefill计算、更低延迟和更高集群吞吐。稳定前缀越长、复用轮次越多，缓存收益越明显，有望持续改善长程任务毛利率，并利好高性能内存及高速互联需求。

联系人：缪欣君/刘鉴/李璞玉

铭鸿体育资讯网

GPT-5.6超预期：更低成本，更高智力【天风计算机缪欣君团队】重点关注：智谱、

热门分类