谁能想到,那个搞出 DeepSeek 的梁文锋,直接把桌子给掀了。他带人干了件最狂的事,花五个月把底层代码全迁到了华为昇腾上,彻底不要英伟达的 CUDA 了。难怪黄仁勋在采访里急得直跳脚,连 “芯片又不是浓缩铀” 这种话都喊出来了。
这事得从 AI 行业藏了十几年的 “潜规则” 说起。过去十多年,全球 AI 领域看似百花齐放,实则被英伟达一家牢牢攥在手里,尤其是高端算力和软件生态这两块,几乎是说一不二。
英伟达靠什么这么霸道?核心就是 CUDA— 一套只适配自家 GPU 的编程框架,从 2006 年推出到现在,十几年时间攒下了海量的代码库、开发工具和工程师习惯。全球超过 400 万 AI 开发者,日常工作都离不开 CUDA,久而久之,CUDA 就成了行业默认标准,别人想换条路走,难如登天。
更关键的是,英伟达在 AI 芯片市场的垄断程度,高到吓人。数据显示,它在全球数据中心 GPU 市场的占有率常年维持在 90% 以上,中国市场更是接近 100%。这种垄断带来的后果很直接:定价权全在英伟达手里,芯片价格居高不下,国内 AI 企业想做高端模型,只能高价买它的芯片,还得跟着它的规则走。
最憋屈的是,一旦美国出台出口管制,高端芯片直接断供,国内 AI 行业瞬间就面临 “无米下锅” 的困境。说白了,过去十几年,中国 AI 企业看似在飞速发展,实则一直被英伟达的生态 “卡脖子”,命脉握在别人手里。
梁文锋和 DeepSeek 的这次行动,之所以能掀起这么大波澜,核心就在于他们打破了这个持续十几年的僵局。很多人以为 “换芯片” 就是简单的硬件替换,其实根本不是。
从 CUDA 迁移到华为昇腾的 CANN 框架,本质上是一次 “全栈重构”— 底层代码、算子库、调度逻辑、优化方案,几乎所有核心部分都要从零重写。这就好比一栋已经盖好的高楼,地基和承重结构全要换掉,难度和工作量可想而知。
据行业知情人士透露,这次迁移工程极其浩大,团队几乎全员上阵,连续五个月高强度攻坚,连原定的模型发布都被迫推迟。最难的地方在于,CUDA 发展了十几年,各种优化技巧、成熟工具数不胜数,而国产昇腾生态起步晚,很多东西都要自己摸索。
但梁文锋偏不信邪,带着团队硬生生啃下了这块硬骨头,最终不仅完成了全量迁移,还实现了性能突破 —— 在昇腾平台上,DeepSeek V4 模型的推理速度达到了英伟达对华特供版芯片的 1.5 到 1.7 倍。更重要的是,这是全球首个在国产算力底座上完成训练与推理验证的万亿参数级模型,意义非同凡响。
这事的影响,远不止 DeepSeek 一家公司这么简单。对整个中国 AI 行业来说,这是一次 “破局” 的信号。过去国内不是没有企业尝试适配国产芯片,但大多只是 “浅尝辄止”,要么只适配部分模型,要么性能达不到商用标准,始终没法摆脱对 CUDA 的依赖。
而 DeepSeek 这次是 “连根拔起”,彻底告别 CUDA,证明了国产算力完全能支撑世界级大模型的运行,而且性价比更高 —— 华为昇腾芯片的价格只有英伟达高端芯片的三分之一到四分之一,性能却能达到一半左右,对企业来说成本压力大幅降低。
市场的反应最能说明问题。消息一出,寒武纪、摩尔线程、沐曦等国产芯片公司股价集体上涨 2% 到 7%,华为昇腾更是迎来了国内科技巨头的批量订单。九大国内云厂商第一时间推出适配 DeepSeek 的服务,国家超算互联网平台也快速上线相关推理功能,整个国产算力产业链瞬间被激活。这意味着,中国 AI 行业终于有了 “模型 + 芯片” 的自主闭环,不用再被别人掐着脖子发展。
而另一边,黄仁勋的焦虑完全藏不住了。在近期的多次采访中,他一改往日强势,频繁吐槽美国的芯片出口管制是 “失败的”“完全错误的”,直言这种做法是 “失败者心态”。他甚至无奈表示,“芯片又不是浓缩铀,中国自己能造”,
言外之意就是,再封锁下去,只会逼着中国把自主生态做起来,最后彻底失去中国市场。要知道,中国是全球最大的 AI 算力市场之一,也是英伟达最重要的收入来源之一,失去中国市场,对英伟达来说是难以承受的损失。
梁文锋为什么敢这么做?其实答案很简单 — 被逼出来的,也是看准了趋势。其一,美国的芯片管制越来越严,高端芯片断供是迟早的事,继续依赖英伟达,无异于把自己的命运交给别人;
其二,国产算力经过多年发展,已经具备了替代能力,华为昇腾的性能和稳定性,完全能满足大模型的需求。更重要的是,梁文锋看到了行业的痛点 —— 天下苦英伟达久矣,大家都想摆脱垄断,只是没人敢第一个站出来。而他,偏偏做了这个 “第一个吃螃蟹的人”。
