标签: GPU
人工智能三大支柱(算力芯片、通信网络、工业体系)的构成、作用和价值一、第一支
人工智能三大支柱(算力芯片、通信网络、工业体系)的构成、作用和价值一、第一支柱:算力芯片,AI的“发动机”。核心硬件通用GPU:英伟达A100/H100、AMDMI250,大模型训练主力,强并行计算。AI专用芯片(ASIC/NPU/DCU):华为昇腾、寒武纪、壁仞、海光,针对深度学习定制,能效更高、成本更低。FPGA:可编程,适合边缘低延迟推理(工业、自动驾驶)。存算一体/光计算芯片:前沿方向,解决“存储-计算”数据搬运瓶颈。核心作用提供原始算力:支撑大模型训练(如GPT-4需数万GPU)、推理(每天千亿次调用)。定义能效上限:决定AI能跑多快、多大模型、功耗多少(直接影响电费与成本)。构建算力集群:通过NVLink/InfiniBand互联,组成“超级大脑”,支撑分布式训练。一句话价值没有算力芯片,AI就是纸上谈兵;芯片的性能与供给,决定国家AI竞争力的底线。目前来看,美国在算力算法和芯片方面,略占优势,中国在迎头赶上。二、第二支柱:通信网络,AI的“血管”。构成(三层网络)数据中心内网(高速互联):InfiniBand、NVLink、400G/800G光模块,低延迟、高带宽,GPU间通信。骨干网/算力网络:5G和未来的6G基站网络、光纤、卫星互联网,连接智算中心、边缘节点、用户终端。边缘接入网:工业以太网、Wi-Fi7、物联网(IoT),设备端数据采集与实时控制。核心作用数据高速流通:海量训练数据、模型参数、推理请求在云-边-端实时传输。支撑云边端协同:大模型在云端训练,边缘实时推理(自动驾驶、工业质检),终端交互。保障低延迟高可靠:自动驾驶、远程医疗、工业控制等场景,毫秒级延迟是安全底线。目前的5G技术和未来的6G技术,是人工智能的支撑性基础技术。5G的研发和应用,中国走在世界的前列。6G的研发,目前中国又走在前列。一句话价值网络不通,算力无用;网络带宽与延迟,直接决定AI应用的可用性与体验。三、第三支柱:工业体系,AI的“骨骼与土壤”。构成(四大产业链)半导体制造:晶圆代工(台积电、中芯国际等)、光刻/刻蚀/沉积设备、先进封装(Chiplet),决定芯片能否量产。算力基建(智算中心AIDC):高密度服务器、液冷散热、高压供电、储能/绿电,大规模算力交付。算力的运算,需要消耗相应的电力,电力决定算力。得益于风电、光伏发电、水电和核电的大发展,从近3年发电量来看,中国的年发电量几乎是美国、印度、俄罗斯、日本、德国、法国和英国的总和。液冷散热、特高压供电、储能/绿电,还有在人形机器人中将电能转化为精准机械运动,也是中国的强项。整机与智能制造:AI服务器、工业机器人、智能产线,支撑算力硬件规模化生产与AI落地。软件与生态:操作系统、AI框架(TensorFlow/PyTorch)、编译器、行业解决方案,让硬件可用、模型可落地。核心作用硬件规模化供给:稳定、低成本生产GPU/NPU、服务器、光模块,支撑AI算力爆发式需求。工程化落地能力:把算法模型变成可量产、可运维、可迭代的产品(如工业质检、自动驾驶、无人机、无人艇、机器狗、战狼等)。得益于中国完整的工业体系和供应链,相对美国的产业空心化来说,中国人工智能产品的工程化、产品化、市场化和迭代能力都相对要好些。产业链安全自主:避免“卡脖子”,保障芯片、设备、软件的自主可控,支撑长期发展。一句话价值工业体系不强,AI只能“空中楼阁”;完整的产业链,是AI从实验室走向产业的根本保障。四、三者关系总结算力芯片是动力源,提供计算能力;通信网络是传输纽带,连接算力、数据与场景;工业体系是制造与工程底座,保障硬件量产与应用落地。三者缺一不可,共同构成AI产业的“硬支撑”,决定一个国家AI发展的上限与安全。
黄仁勋身家超过七千亿,上个月在台北,黄仁勋满头大汗走下台,没喝一口水,径直走向第
黄仁勋身家超过七千亿,上个月在台北,黄仁勋满头大汗走下台,没喝一口水,径直走向第一排一个穿素色衣服的中年女人。现场闪光灯没有停。那位中年女人正是黄仁勋的妻子LoriHuang。公开资料显示,LoriHuang与黄仁勋相识于OregonStateUniversity时期,两人结婚多年,一直保持低调。台上的光环属于英伟达创始人,台下的沉默属于家庭。台北活动的热度来自英伟达的现实地位。2023年,NVIDIA市值突破1万亿美元。2024年,市值超过2万亿美元。黄仁勋的财富数据来自福布斯与彭博亿万富翁指数,公开榜单可以查询。资本市场的狂热,让人容易忘记1990年代的紧张时刻。时间倒回1993年4月5日。黄仁勋与ChrisMalachowsky、CurtisPriem在加州圣何塞创立英伟达。创业地点是Denny’s餐厅。创始人背景并不神秘。黄仁勋1963年出生于台湾台南市,1984年毕业于OregonStateUniversity,1992年获得StanfordUniversity电机工程硕士学位。创业前在AdvancedMicroDevices与LSILogic工作。履历清晰,公开可查。1995年,英伟达推出NV1芯片。技术路线与微软DirectX不兼容,销量不理想。1997年前后,公司现金储备告急,进行裁员。黄仁勋在后来的采访中承认,那是最危险的阶段。员工减少,项目压缩,办公室气氛紧张。公司几乎走到尽头。没有外界想象的从容,只有账面数字不断逼近红线。1999年1月22日,英伟达在纳斯达克上市。同年发布GeForce256,被称为第一款GPU。产品成功后,公司局面改变。上市时间与产品发布都在公开市场记录中可以查询。那几年,黄仁勋几乎住在公司。LoriHuang承担家庭事务。公开资料显示,两人育有两个孩子。没有高调曝光,只有日常维持。2006年,英伟达发布CUDA并行计算平台。GPU开始进入科研与高性能计算领域。2012年,AlexNet在ImageNet竞赛中使用GPU训练取得突破,深度学习开始依赖英伟达芯片。技术路线转向并非偶然,而是多年积累的结果。每一个节点都有公开论文和产业报道支撑。2022年之后,生成式人工智能推动A100、H100等芯片需求激增。2023年财报显示英伟达营收大幅增长。资本市场反馈迅速。财富数据飙升只是结果,过程记录在上市公司公告里。台北那一幕只是生活的切片。台上是全球半导体产业的焦点人物,台下是共同走过三十年的伴侣。黄仁勋在公开场合多次提到家庭支持的重要性。海明威写过一句话:“世界击碎了每一个人,而在碎裂处,有些人变得更强。”创业早期的挫折并未消失,只是被后来的成功覆盖。现场观众看到的是当下的荣耀,却未必了解1997年的裁员名单,也未必记得1999年上市当天的紧张。黄仁勋走向LoriHuang的动作很自然,仿佛提醒自己起点在哪里。财富数字会变动,股价会波动,技术路线会调整,只有时间线不会撒谎。英伟达从图形芯片走向AI算力核心,用了三十多年。那段路程没有神话,只有节点与决策。至于未来会走向何处,没有人提前写好答案。
800元淘来的“工业废铁”,竟成了被窝里的四路PC游戏服务器 四台性能羸弱的
800元淘来的“工业废铁”,竟成了被窝里的四路PC游戏服务器四台性能羸弱的设备,两台手机加一块平板再加一台没有独显的老旧笔记本,此刻竟同时流畅运行着四个独立的电脑游戏。带起这个家庭迷你网吧的不是某款游戏显卡,而是一块连视频输出接口都没有的计算卡。2026年5月中旬,一位硬件博主在二手市场花800元淘回这张卡,用Docker容器化方案成功跑通了单卡四路PC游戏串流。新华三XG310,当年官方售价19999元的企业级服务器GPU卡,如今在二手市场以不到原价二十分之一的价格流通着。一张从没打算卖给普通消费者的工业产品,凭什么成了硬核玩家的折腾神器?拆开这块铁疙瘩,四个独立的GPU核心直接焊在板上,代号SG1。它们与英特尔初代独显DG1的底层架构完全一致,本质上都是11代酷睿处理器里96个执行单元核显的独立化版本,四个凑在一起组成384个执行单元。每个核心配8GBLPDDR4x显存,整卡总容量32GB,满载功耗150瓦,纯被动散热,没有风扇也没有任何显示接口,标准的服务器基因。更致命的是通信通道,表面上是PCIe3.0x16总线,底层四颗GPU的物理带宽却被卡死在PCIe1.0x1,单向只有约250MB/s。这种配置跑任何需要往显存里灌大贴图的PC游戏,几秒钟就能把总线撑爆。这张卡真正的使命是给云游戏平台服务。2020年11月英特尔发布信息显示,一个搭载XG310的双卡服务器系统就能支持超过100个安卓云游戏并发用户。腾讯仙游云游戏平台是最早的客户之一,双卡服务器能同时跑超过100个游戏实例,《王者荣耀》《和平精英》《传说对决》等主流产品全部通过测试。2021年11月腾讯云GPU云服务器上线渲染型GI1机型,搭载的就是XG310加速卡,适用于安卓云游戏和视频转码处理。游戏在服务器端渲染完成,画面直接压成低码率视频流推送出去,250MB/s的带宽在这种场景下完全够用。串流正是普通用户破解这张卡的唯一出路。游戏画面在显存里渲染完成后直接调用SG1内置的QSV媒体引擎进行硬件压缩,据H3C官方用户指南显示该卡支持AVC、HEVC、VP9等多种格式的硬件编解码。数据以低码率视频流的形式通过网络推送到手机、平板等终端,Moonlight客户端只需解码一路1080P60帧画面,整个流程完美绕过PCIe带宽的限制。实测中3D游戏如《极乐迪斯科》中高画质能跑到30到40帧,大部分2D游戏流畅运行在60帧。把服务器丢在机房,抱着手机窝在被窝里推PC游戏,噪音全隔离在外面,这种体验确实有股说不清的吸引力。XG310最擅长的领域其实是高密度影音转码,单个SG1核心就能轻松应对多路4K视频的硬件转码任务,四个核心带来的是四倍并发能力。受限于11代底层架构,媒体引擎只支持AV1解码不支持硬件编码。至于门槛,被动散热要改风道,驱动要手动修改GRUB参数,8PIN独立供电一个不能少,32GB显存看着诱人但跑不动AI模型。2026年云游戏市场规模持续增长,各大平台的技术路线早已升级到更先进的GPU方案,这张卡在商用领域已基本完成历史使命。但对愿意折腾的人来说,花800元把一块工业废铁变成被窝里的四路游戏服务器,这事本身就比结果更有意思。
目前AI人工智能的逻辑已经从当初的训练堆GPU转向重CPU叙事,全球算力格局正在
目前AI人工智能的逻辑已经从当初的训练堆GPU转向重CPU叙事,全球算力格局正在经历一场颠覆性重构。Intel、AMD、ARM数据中心业务营收同比暴涨,服务器CPU渠道价格持续上行,交期拉长至半年,大厂资本开支史诗级上调,一场由控制面革命、供需长缺、国产替代三重驱动的CPU超级周期或许已经开启。我应该说是比较早关注到英特尔的这个老将回春的,对于CEO陈立武所提到的CPU与GPU的配比为1:8,现在是1:4,我认为未来会走向接近1:1,这句话应该说是当天就引起重视,并时隔多年后重新杀回英特尔的。在A股中重中之重提到过与CPU核心相关的海光信息和龙芯中科,后来又加上中国长城。对于过去的AI芯片,半导体,光芯片,光模块,PCB,我的知识面是能够覆盖的,我可以坚定不移地从自己的认知层面去阐述,但对于CPU,我坦言知识储备还不够,所以周末还在恶补。资本市场板块的走势从来都不在K线的指标上,而在于产业趋势。段永平曾说看K线指标做投资必死无疑,我非常赞同这句话。既然CPU的风烟已起,不管后面如何叙事,先搭上造梦者便车才是王道。重点观察CPU四大金刚:海光信息,龙芯中科,中国长城,澜起科技的表现。
一文速览CPUGPUNPUTPU
一文速览CPUGPUNPUTPU
看罢此图,深感老马目光之毒辣同行还在卷模型参数,他已洞悉天机,开始圈地建“算
看罢此图,深感老马目光之毒辣同行还在卷模型参数,他已洞悉天机,开始圈地建“算力帝国”疯狂囤积55万GPU,不仅为Grok筑基,更化身“算力包租公”,把余力租给Cursor们这哪是单纯做AI,分明是在抢占AI时代的“石油”与“电力”,商业闭环既成,规则由其定义
高通发布骁龙6Gen5和骁龙4Gen5:骁龙6Gen5:4*2.6G
高通发布骁龙6Gen5和骁龙4Gen5:骁龙6Gen5:4*2.6GHzP-Core+4*2.0GHzE-Core,台积电4nm,相比前代,功耗降低8%,GPU提升20%,支持200MP、100X变焦,支持王者荣耀120FPS,WiFi7,荣耀和REDMI首批终端。骁龙4Gen5:2*2.4GHzP-Core+6*2.1GHzE-Core,台积电4nm,相比前代,功耗降低10%,GPU提升77%。支持90FPS游戏,OPPO、realme、REDMI首批终端。
人工智能三大支柱(算力芯片、通信网络、工业体系)的构成、作用和价值一、第一支
人工智能三大支柱(算力芯片、通信网络、工业体系)的构成、作用和价值一、第一支柱:算力芯片,AI的“发动机”。核心硬件通用GPU:英伟达A100/H100、AMDMI250,大模型训练主力,强并行计算。AI专用芯片(ASIC/NPU/DCU):华为昇腾、寒武纪、壁仞、海光,针对深度学习定制,能效更高、成本更低。FPGA:可编程,适合边缘低延迟推理(工业、自动驾驶)。存算一体/光计算芯片:前沿方向,解决“存储-计算”数据搬运瓶颈。核心作用提供原始算力:支撑大模型训练(如GPT-4需数万GPU)、推理(每天千亿次调用)。定义能效上限:决定AI能跑多快、多大模型、功耗多少(直接影响电费与成本)。构建算力集群:通过NVLink/InfiniBand互联,组成“超级大脑”,支撑分布式训练。一句话价值没有算力芯片,AI就是纸上谈兵;芯片的性能与供给,决定国家AI竞争力的底线。目前来看,美国在算力算法和芯片方面,略占优势,中国在迎头赶上。二、第二支柱:通信网络,AI的“血管”。构成(三层网络)数据中心内网(高速互联):InfiniBand、NVLink、400G/800G光模块,低延迟、高带宽,GPU间通信。骨干网/算力网络:5G和未来的6G基站网络、光纤、卫星互联网,连接智算中心、边缘节点、用户终端。边缘接入网:工业以太网、Wi-Fi7、物联网(IoT),设备端数据采集与实时控制。核心作用数据高速流通:海量训练数据、模型参数、推理请求在云-边-端实时传输。支撑云边端协同:大模型在云端训练,边缘实时推理(自动驾驶、工业质检),终端交互。保障低延迟高可靠:自动驾驶、远程医疗、工业控制等场景,毫秒级延迟是安全底线。目前的5G技术和未来的6G技术,是人工智能的支撑性基础技术。5G的研发和应用,中国走在世界的前列。6G的研发,目前中国又走在前列。一句话价值网络不通,算力无用;网络带宽与延迟,直接决定AI应用的可用性与体验。三、第三支柱:工业体系,AI的“骨骼与土壤”。构成(四大产业链)半导体制造:晶圆代工(台积电、中芯国际等)、光刻/刻蚀/沉积设备、先进封装(Chiplet),决定芯片能否量产。算力基建(智算中心AIDC):高密度服务器、液冷散热、高压供电、储能/绿电,大规模算力交付。算力的运算,需要消耗相应的电力,电力决定算力。得益于风电、光伏发电、水电和核电的大发展,从近3年发电量来看,中国的年发电量几乎是美国、印度、俄罗斯、日本、德国、法国和英国的总和。液冷散热、特高压供电、储能/绿电,还有在人形机器人中将电能转化为精准机械运动,也是中国的强项。整机与智能制造:AI服务器、工业机器人、智能产线,支撑算力硬件规模化生产与AI落地。软件与生态:操作系统、AI框架(TensorFlow/PyTorch)、编译器、行业解决方案,让硬件可用、模型可落地。核心作用硬件规模化供给:稳定、低成本生产GPU/NPU、服务器、光模块,支撑AI算力爆发式需求。工程化落地能力:把算法模型变成可量产、可运维、可迭代的产品(如工业质检、自动驾驶、无人机、无人艇、机器狗、战狼等)。得益于中国完整的工业体系和供应链,相对美国的产业空心化来说,中国人工智能产品的工程化、产品化、市场化和迭代能力都相对要好些。产业链安全自主:避免“卡脖子”,保障芯片、设备、软件的自主可控,支撑长期发展。一句话价值工业体系不强,AI只能“空中楼阁”;完整的产业链,是AI从实验室走向产业的根本保障。四、三者关系总结算力芯片是动力源,提供计算能力;通信网络是传输纽带,连接算力、数据与场景;工业体系是制造与工程底座,保障硬件量产与应用落地。三者缺一不可,共同构成AI产业的“硬支撑”,决定一个国家AI发展的上限与安全。
人工智能三大支柱(算力芯片、通信网络、工业体系)的构成、作用和价值一、第一支
人工智能三大支柱(算力芯片、通信网络、工业体系)的构成、作用和价值一、第一支柱:算力芯片,AI的“发动机”。核心硬件通用GPU:英伟达A100/H100、AMDMI250,大模型训练主力,强并行计算。AI专用芯片(ASIC/NPU/DCU):华为昇腾、寒武纪、壁仞、海光,针对深度学习定制,能效更高、成本更低。FPGA:可编程,适合边缘低延迟推理(工业、自动驾驶)。存算一体/光计算芯片:前沿方向,解决“存储-计算”数据搬运瓶颈。核心作用提供原始算力:支撑大模型训练(如GPT-4需数万GPU)、推理(每天千亿次调用)。定义能效上限:决定AI能跑多快、多大模型、功耗多少(直接影响电费与成本)。构建算力集群:通过NVLink/InfiniBand互联,组成“超级大脑”,支撑分布式训练。一句话价值没有算力芯片,AI就是纸上谈兵;芯片的性能与供给,决定国家AI竞争力的底线。目前来看,美国在算力算法和芯片方面,略占优势,中国在迎头赶上。二、第二支柱:通信网络,AI的“血管”。构成(三层网络)数据中心内网(高速互联):InfiniBand、NVLink、400G/800G光模块,低延迟、高带宽,GPU间通信。骨干网/算力网络:5G和未来的6G基站网络、光纤、卫星互联网,连接智算中心、边缘节点、用户终端。边缘接入网:工业以太网、Wi-Fi7、物联网(IoT),设备端数据采集与实时控制。核心作用数据高速流通:海量训练数据、模型参数、推理请求在云-边-端实时传输。支撑云边端协同:大模型在云端训练,边缘实时推理(自动驾驶、工业质检),终端交互。保障低延迟高可靠:自动驾驶、远程医疗、工业控制等场景,毫秒级延迟是安全底线。目前的5G技术和未来的6G技术,是人工智能的支撑性基础技术。5G的研发和应用,中国走在世界的前列。6G的研发,目前中国又走在前列。一句话价值网络不通,算力无用;网络带宽与延迟,直接决定AI应用的可用性与体验。三、第三支柱:工业体系,AI的“骨骼与土壤”。构成(四大产业链)半导体制造:晶圆代工(台积电、中芯国际等)、光刻/刻蚀/沉积设备、先进封装(Chiplet),决定芯片能否量产。算力基建(智算中心AIDC):高密度服务器、液冷散热、高压供电、储能/绿电,大规模算力交付。算力的运算,需要消耗相应的电力,电力决定算力。得益于风电、光伏发电、水电和核电的大发展,从近3年发电量来看,中国的年发电量几乎是美国、印度、俄罗斯、日本、德国、法国和英国的总和。液冷散热、特高压供电、储能/绿电,还有在人形机器人中将电能转化为精准机械运动,也是中国的强项。整机与智能制造:AI服务器、工业机器人、智能产线,支撑算力硬件规模化生产与AI落地。软件与生态:操作系统、AI框架(TensorFlow/PyTorch)、编译器、行业解决方案,让硬件可用、模型可落地。核心作用硬件规模化供给:稳定、低成本生产GPU/NPU、服务器、光模块,支撑AI算力爆发式需求。工程化落地能力:把算法模型变成可量产、可运维、可迭代的产品(如工业质检、自动驾驶、无人机、无人艇、机器狗、战狼等)。得益于中国完整的工业体系和供应链,相对美国的产业空心化来说,中国人工智能产品的工程化、产品化、市场化和迭代能力都相对要好些。产业链安全自主:避免“卡脖子”,保障芯片、设备、软件的自主可控,支撑长期发展。一句话价值工业体系不强,AI只能“空中楼阁”;完整的产业链,是AI从实验室走向产业的根本保障。四、三者关系总结算力芯片是动力源,提供计算能力;通信网络是传输纽带,连接算力、数据与场景;工业体系是制造与工程底座,保障硬件量产与应用落地。三者缺一不可,共同构成AI产业的“硬支撑”,决定一个国家AI发展的上限与安全。