GPT-5.6超预期:更低成本,更高智力【天风计算机缪欣君团队】
重点关注:智谱、minimax
1、能力端,GPT-5.6从单模型推理进一步走向多Agent推理,Harness编排能力显著提升。
GPT-5.6发布预览版本,旗舰模型Sol在编程、生物、网安等场景能力大幅提升,并在ExploitBench上打平Mythos Preview,而输出Token仅约为后者的1/3。Sol输入/输出定价仅为Fable 5的50%/60%,约为Mythos Preview的1/5和1/4,进一步体现“更贵的模型反而拥有更低的单位任务成本”。
2、迭代还在加速,今年看模型厂商同时在追求能力上限与商业效率
我们推测,GPT-5.6总参数量或在3T左右,Mythos或在10T左右。若判断成立,则OpenAI以相对大幅压缩的参数量和更低推理成本,实现了接近的等效智力,整体表现大超预期。从Opus 4系列参数收缩,到GPT-5.6智力密度提升,模型厂今年的核心方向不仅在单纯探索智力上限,也在升性价比的同时保持模型溢价。我们认为,只要模型迭代速度不放缓,杰文斯悖论就不会停止,持续看好模型突破推动AI产业TAM成长。同时,随着国产开源在下半年逐步进入可用,个别甚至进入好用范畴,看好国产模型演绎更陡峭成长曲线。
3、推理端,显式缓存断点进一步强化“以存储换算力”的趋势。
GPT-5.6新增显式缓存断点,缓存至少维持30分钟,写入按正常输入价格的1.25倍计费,后续读取享受90%折扣。随着模型能力提升、长程任务增多,模型厂商开始以更多KV Cache容量、更长驻留时间和更复杂调度,换取更少的Prefill计算、更低延迟和更高集群吞吐。稳定前缀越长、复用轮次越多,缓存收益越明显,有望持续改善长程任务毛利率,并利好高性能内存及高速互联需求。
联系人:缪欣君/刘鉴/李璞玉