登录
注册
过去两年,AI 行业深陷于科技巨头发起的“大型模型竞赛”,模型参数从数十亿飙升至数万亿,训练成本由数千万美元跃升至数亿美元,GPU 集群规模也从数千块扩展至数万块。市场焦点一度局限于模型性能的比拼,仿佛通用人工智能的终点仅在于模型本身。
然而,随着时间推进至 2026 年,行业底层逻辑发生根本性逆转。摩根大通最新报告明确指出,驱动 AI 基础设施持续扩张的核心动力已不再是模型训练,而是对 AI 推理的海量需求。未来,计算能力的最大消耗者将转变为遍布全球的 AI 智能体,每一次交互与任务执行本质上都在消耗代币。AI 行业正从“模型时代”加速过渡到“代币产业时代”,围绕代币构建的生产、分配、调度与消费体系将成为新世界的运行基石。午方 AI 梳理发现,当 AI 智能体大规模涌现时,代币的实时生成、跨区域分配、动态调度及高效消耗,已成为行业面临的全新核心命题。
黄仁勋近期强调,AI 并非单纯的软件行业,而是类似电力与互联网的基础设施系统。在其提出的“五层蛋糕”架构中,AI 被划分为能源、芯片、基础设施、模型和应用。随着行业从“训练时代”迈向“推理时代”,GoodVision AI 进一步将 AI 经济链重构为以代币为中心的“七层蛋糕结构”:第一层能源是能量基础;第二层 AI 数据中心是代币工厂;第三层 GPU 是生产设备;第四层大语言模型是生产引擎;第五层代币分配构成 AI 时代的“电网”;第六层代币优化与智能调度则是大脑;第七层 AI 智能体作为消费终端。这一架构揭示了从能源到边缘节点的完整代币产业体系,但当前该体系仍远未成熟。部分企业虽拥有顶尖 GPU 却受限于供电能力,部分拥有庞大数据中心却缺乏高效调度,还有企业开发出强大智能体却受制于高昂推理成本与延迟。产业链各层级间的碎片化、冗余与效率瓶颈依然严重,唯有实现七层基础设施的互联互通,AI 才能从“工具时代”真正迈入智能世界的“大规模应用时代”。
工业革命争夺煤炭石油,互联网时代争夺流量服务器,而 AI 时代的底层竞争再次回归能源。AI 最终消耗的是电能,一个大型 AI 数据中心的能耗已接近中等规模城市。全球新建数据中心普遍面临 GPU 可购、土地可拓但供电不足、电网调度滞后的困境。在 2026 年 GTC 大会上,黄仁勋将未来数据中心定义为“代币工厂”,其上游将催生超级能源产业。在中国,长江电力、中核集团、三峡集团等代表的水电、核电企业凭借稳定供电成为核心能源来源,风电与太阳能则因 ESG 要求受益。美国方面,NextEra Energy、Dominion Energy、Exelon 等传统能源巨头也在 AI 扩张中获益,其中 Exelon 凭借核电稳定性成为全天候高稳定性电力需求的重要受益者。全球电力行业正从传统公用事业向 AI 基础设施核心资源层转变,竞争焦点从“电价竞争”转向“电力采购权竞争”。谁能锁定长期、稳定、低成本的能源,谁就掌握了代币生产的第一把钥匙。
单块 GPU 意义有限,规模化集群才是关键,AI 数据中心因此应运而生。如同工业时代的钢铁厂,AI 数据中心整合数千块 GPU 形成稳定代币生产能力,但传统建设周期长达 18 至 36 个月,电网扩建耗时更久,已无法满足指数级增长的代币经济需求。Equinix 作为全球领先运营商,在 30 多个国家拥有超 240 个数据中心,凭借全球互联与低延迟网络成为关键节点。Digital Realty 通过 PlatformDIGITAL 服务大型云厂商与金融机构。在中国,润泽科技等 A 股企业正从传统 IDC 转向 AI 计算中心,核心竞争力在于规模、电力与运维能力。
此外,CoreWeave、IREN、Applied Digital 等原加密货币矿场企业迅速转型,IREN 强调“绿色能源+AI 计算”模式,利用可再生能源建设高密度 GPU 数据中心。午方 AI 注意到,行业正呈现边缘化、小型化与模块化趋势,AI 处理能力需从超大型中央节点分散至区域边缘节点。
GoodVision AI 选择了一条差异化路径:构建轻量级、模块化且可快速复制的 AI 工厂。不同于传统超大型数据中心,其注重区域部署能力与高密度 GPU 集群效率,在全球高人口密度区快速部署 2-4MW 的小型推理机房。这种模式能更快利用当地能源,契合推理需求向边缘转移的趋势。若将传统数据中心比作工业时代钢铁厂,GoodVision AI 打造的则是 AI 时代的“区域化代币工厂”,更轻便、灵活且贴近用户,适配未来全球分布式推理网络。如果说电力是能源,GPU 则是生产设备。未来推理需求将远超训练,渗透至机器人、自动驾驶、AI 眼镜及智能体间的实时代币交换。NVIDIA 仍是绝对核心,其 H100、B200、Blackwell 等产品定义了全球标准,并通过 CUDA、TensorRT 等构建完整生态。竞争对手不仅需挑战芯片性能,更需挑战其软件生态。
AMD 凭借 MI300X 等产品成为主要竞争者,注重开放生态与 ROCm 平台;Broadcom 与 Marvell 则聚焦专用集成电路与高速互连技术,以应对复杂推理场景的能效与成本需求;Intel 通过服务器 CPU 与 Gaudi 加速卡重返竞争。在中国,Cambricon 专注 MLU 系列芯片与 Neuware 框架,Hygon 获 AMD Zen 架构授权发展 DCU,MorryThread、Horizon Robotics 等企业则代表国产替代方向,强调与 CUDA 兼容并建立国内集群。从 CUDA 到 HBM 内存、张量核心,行业核心在于提高“单位时间内生成代币的效率”。GPU 及服务器、光模块、液冷系统、交换机等底层设施同样关键。Vertiv 提供电源管理与精密空调,EIVIK 在液冷温控领域领先,中兴电气、科华数据等在 UPS 领域占据重要地位。InnoLight、新益盛等光模块企业受益于高速通信需求,戴尔、惠普、Supermicro、联想等承担服务器组装。这些环节虽不直接面对用户,却决定了 AI 基础设施的顺畅运行,正如工业时代的铁路与港口,是真正的“淘金热”业务。
大语言模型决定了代币的理解、生成与组织方式。OpenAI、Anthropic、谷歌、Meta 等企业引发了全球模型竞赛,参数规模激增,功能扩展至多模态与智能体协作。
然而市场逐渐意识到,关键不在于“谁拥有最大模型”,而在于谁能以更低成本、更高效率持续运行模型。模型本身不直接创造价值,价值产生于被调用过程中的推理结果。大语言模型正从“展示功能”转变为“代币生成引擎”。OpenAI、谷歌 Gemini、Meta Llama 等争夺生态入口,DeepSeek 则通过降低成本重塑格局。竞争标准转向代币成本、推理效率、上下文理解及多智能体协作能力。GoodVision AI 通过与大模型厂商合作,在 AI 工厂部署模型,将计算租赁转变为直接代币服务,提升毛利率与用户体验。
一旦数据中心建成,如何全球分配计算能力成为关键,计算能力租赁平台应运而生,充当 AI 时代的“电网”。AWS、Azure、谷歌云、阿里云、腾讯云等巨头正整合 AI GPU 资源至 IaaS 系统。
同时,CoreWeave、Nebius、Nscale 等专为 AI 设计的云服务迅速崛起,CoreWeave 从以太坊挖矿转型为 NVIDIA 重点支持的 AI 基础设施企业。DigitalOcean、Vultr 等轻量级平台服务中小开发者。在中国,UCloud、金山云等也是主要供应商。随着 AI 智能体激增,并非所有任务都需昂贵大模型,简单任务可本地处理,实时任务适合边缘推理,隐私任务不宜上云。午方 AI 分析认为,在“是否有足够算力”之后,“如何智能使用算力”成为关键。让合适模型在合适算力上处理合适任务,是确保代币高效利用的核心。QingCloud、Lambda、OpenRouter、Fireworks AI 等企业也是代币优化与智能调度领域的重要参与者。随着资源与任务规模扩大,仅“拥有算力”已不足以建立壁垒,动态调度模型、算力与代币流量成为决定效率的关键。UCloud、资本在线、Sugon 等正从“出售算力”转向“优化算力”。在 2026 年 GTC 大会上,黄仁勋提出未来每家公司都将同时成为“代币生产者”与“代币消费者”,AI 智能体将调用多模型、工具与 API 进行连续推理、规划与执行。