铭鸿体育资讯网

DeepSeek V4终于来了 上下文长度 1M,swe pro分数超了哈基米3

DeepSeek V4终于来了

上下文长度 1M,swe pro分数超了哈基米3.1,但是还是不如glm5.1,gpt5.4,属于中规中矩

“技术层面,V4采用全新注意力机制,结合DSA稀疏注意力,在大幅压缩计算和显存需求的同时,实现百万级超长上下文。DeepSeek表示,1M上下文将成为旗下所有官方服务的标配。”

但是其最重要的是图一的下面那行小字,说明DeepSeek V4 基于 华为昇腾芯片 训练和推理!下半年昇腾950芯片大上市后,Pro版还会巨幅降价

黄仁勋,你颤抖了吗?

烽火问鼎计划DeepSeekV4发布