铭鸿体育资讯网

【微软MAI-Thinking-1:为什么大模型研发正在告别“撞大运”?】微软刚

【微软MAI-Thinking-1:为什么大模型研发正在告别“撞大运”?】

微软刚发布了MAI-Thinking-1的技术报告。这个35B活跃参数的MoE模型性能直逼Claude 4.6,但最值钱的不是模型,而是背后被称为“爬山机”的研发体系。

微软这篇报告直接戳破了业内两个流行的幻觉。

第一,别迷信“用小模型测数据配比”。业内常用几B的小模型做实验,以为效果好的配比直接放大就行。微软发现,在小模型上表现完美的STEM配比,一旦在大参数上过载训练,很快就会因为缺乏多样性被代码数据反超。这种“排名非不变性”说明,小尺度下的研究结论在高空飞行时全是噪音。

第二,智力不能靠“继承”。微软坚持不用外部模型蒸馏,也不用合成数据。拿别人的答案做蒸馏,模型看似聪明,实则脆弱、极难控制。

大模型的下半场是拼基础设施的鲁棒性。微软通过自研YOLO框架和Rocket异步RL系统,把极易崩溃的强化学习做成了确定性的工业流水线。

microsoft.ai/wp-content/uploads/2026/06/main_20260602_2.pdf