DeepSeek-V4 Flash版和Pro版模型参数,参考V3的参数是671B
DeepSeek-V4-Pro with 1.6T parameters (49B 激活)DeepSeek-V4-Flash with 284B parameters (13B 激活)
但是实际感受下来V4-Flash版的思考模式能力已经超过V3.2思考模式,进步极大!
附图泪目了,什么叫世界顶级AI Lab,而不是一家AI商业公司
DeepSeek v4 百万上下文烽火问鼎计划

DeepSeek-V4 Flash版和Pro版模型参数,参考V3的参数是671B
DeepSeek-V4-Pro with 1.6T parameters (49B 激活)DeepSeek-V4-Flash with 284B parameters (13B 激活)
但是实际感受下来V4-Flash版的思考模式能力已经超过V3.2思考模式,进步极大!
附图泪目了,什么叫世界顶级AI Lab,而不是一家AI商业公司
DeepSeek v4 百万上下文烽火问鼎计划
