登录
注册
据 Woofun AI 消息,Omdia 最新预测显示,2026 年全球智能手机出货量将同比下降 12.2% 至 10.93 亿部,但同期市场总值反而同比增长 6.1%。
这一反常现象的核心在于平均售价的剧烈波动:预计从 2025 年的 467 美元飙升至 2026 年的 565 美元,涨幅高达 21%,单台涨价 98 美元,两项数据均创行业历史新高。推动价格上行的根本动力来自存储成本的暴涨。2026 年第一季度,DRAM 和 NAND 闪存均价环比上涨超过 80%,AI 服务器对 HBM 的激增需求吸走了内存厂商的大量产能,导致留给消费电子的供给急剧收紧。即便下半年涨幅放缓至个位数,组件成本仍将维持高位,迫使厂商持续将压力转嫁至零售价格。市场结构随之发生深刻分化:低端机型因成本上涨被迫缩减,高端机型反而在份额上受益,翻新二手市场同步扩大。对此,中国政府的回应方向是需求侧补贴:6 月 18 日,商务部等八部门发布《关于加快'人工智能+消费'发展的实施意见》,明确用个人消费贷款财政贴息政策支持消费者购买 AI 手机、智能电脑、AI 眼镜等产品。在手机整体涨价的背景下,AI 手机被正式列为国家消费战略品类。
Woofun AI 整理数据显示,当前市场正经历从'性能过剩'向'体验重构'的剧烈转型,硬件堆叠已不再是唯一解。手机整体在降,高端在涨,发布会上的叙事逻辑已发生根本性逆转。2026 年夏天上市的旗舰手机,处理器几乎清一色采用骁龙 8 Gen 5。小米在讲 7000 mAh 金沙江电池,vivo 在讲折叠屏续航天花板,iQOO 在讲电竞散热,moto 在讲折叠机身里塞进 6000 mAh。在安卓阵营里,SoC 性能话题迅速淡去,处理器芯片像当年的 4G 技术一样,在发布会中彻底隐形。手机厂商被夹在中间,只能在别的地方找出路。端侧 AI 的参数军备竞赛,在数字上打得很热闹。Counterpoint 的报告指出,2026 年具备 GenAI 能力的智能手机将占全球出货量的 45%,但分析师同时指出:有能力跑 AI 的设备,和用户真正在日常里使用 AI 功能的设备之间,存在明显的缺口。硬件能力堆上去了,用户行为并没有跟着改变。联发科和 vivo 联合演示了在天玑 9300 上跑 33B 参数大模型;华为宣称麒麟旗舰能本地推理千亿参数稀疏模型;小米高调宣称旗舰跑通了千亿 MoE。7B、13B、33B、100B,数字每隔几个月往上翻一次。
然而 vivo 做了一个反向的决定:把主力端侧模型从 7B 换回了 3B。不是因为技术不行,而是因为 3B 模型只占 2GB 内存、功耗约 750mA,能持续跑 128K 长文本。在日常使用里,3B 做到的事情和 7B 差不多,但手机不会发烫,电池不会狂掉。用户要的不是参数更大的模型,而是一个真正改变日常使用体验的 AI,随时响应、不发烫、不费电,能在打开手机的每一个场景里实际帮到用户。
这一判断的背后还有一个行业里不常被提的事实:那些动辄百亿、千亿的端侧参数,本质是稀疏 MoE 架构——总参数量很大,但每次推理实际激活的只有几十亿,再经过 INT4 量化压缩,实际运行的计算量和 7B Dense 模型差不多。千亿是仓库的总容量,不是每次用到的东西。
这一趋势意味着手机的 AI 能力由 LPDDR5X 内存容量、NPU 算力和功耗预算共同决定,稳定落地的口径几乎都收敛在 7B 附近。7B 模型经 INT4 量化后约需 4GB 内存,处于旗舰手机 12-16GB LPDDR5X 的可用范围内;联发科明确天玑 9300 的 APU 790 可以约 20 tokens/s 的速度推理 7B 模型,OPPO 将 7B 端侧模型部署用于超过 100 项 AI 功能,高通虽然不公布参数量,但其 AI 引擎的实际对标量级相同。再往上,对手机内存容量和散热的要求就会超出大多数旗舰机的实际边界。这个数字对芯片行业的含义随之改变。过去评判 NPU 的标准是峰值 TOPS,算力越高越好。但当整机厂开始主动用小模型替换大模型,NPU 真正需要做的事情是:在 750mA 的功耗预算下,稳定运行一个长上下文的推理任务,而不是冲峰值跑分。片上 SRAM 用于 KV Cache 的空间、内存带宽的调度效率、INT4/FP8 低精度格式的原生支持,这些指标,比 TOPS 数字更接近用户实际感受到的 AI 体验。推理的瓶颈不只在 NPU 算力,也在存储带宽能不能及时把模型权重喂进去。10.8GB/s 的读取速度直接影响模型加载速度和 KV Cache 刷新效率,这和 NPU 的 TOPS 数字一样决定用户感受到的 AI 响应速度。存储厂商已经意识到这件事。三星 6 月 23 日发布的 UFS 5.0 方案,顺序读取速度达到 10.8GB/s,是上一代 UFS 4.1 的两倍以上,整体能效提升超 40%。三星把这款产品定位为'端侧 AI 的核心底层基础设施'。但 UFS 5.0 要到今年四季度才开始规模量产,意味着它将出现在明年的旗舰里,不是今年的发布会上。Counterpoint 的分析指出,存储约束是 GenAI 手机目前被锁在 400 美元以上价位的核心原因之一。UFS 5.0 能带来性能跨越,但初期成本不会低,高端先受益的格局短期内不会改变。手机 AI 竞争的重心,正在从设备本身转向设备上运行的 AI 模型层。Counterpoint 的研究指出,在高端市场,Google Gemini 正在成为这一层的核心,Gemini 支撑着苹果重建的 Siri,是三星 Galaxy AI 的基础,也驱动着中国主要手机品牌海外版本的 AI 能力。OEM 厂商在模型之上负责编排逻辑、用户体验和生态整合,这才是下一阶段竞争真正发生的地方。端侧 AI 的竞争逻辑变了,但有一件事没变,旗舰机产品在处理器层面已经没有差异化空间。两款手机可以用同一颗 SoC,但发布会不能讲同一件事。差异化只能往 SoC 管不到的地方找:影像算法、游戏体验、续航调度,这些体验层的竞争,SoC 的通用设计天然覆盖不到最优解。整机厂的选择是:自己造一颗芯片,把 SoC 做不好的那件事做到极致。自从苹果用 A 系列拉开了和安卓的性能代差,'自研 SoC'就成了手机行业的终极想象。造芯的手机厂许多,但真是的数据表明,正面开发一颗能和高通、联发科竞争的旗舰 SoC,是没有性价比的选择。手机厂后来想清楚的事情是:不需要替代骁龙,只需要在骁龙覆盖不到的地方造一颗小芯片。iQOO 的 Q2 电竞芯片是一个标准样本。它不碰 CPU、不碰 GPU、不碰 NPU,只做游戏画面的超分和超帧。骁龙 8 Gen 5 的 Adreno GPU 本来也能做这件事,但同时还要处理系统图形渲染、UI 合成和其他负载,超分的效果和功耗不是最优解。Q2 把这个任务单独抠出来,用专用芯片做到极致,主 SoC 反而能腾出资源保帧率稳定。小米的自研影像芯片逻辑相同,不是替代骁龙的 ISP,而是在 ISP 完成基础处理之后,承接计算摄影、多帧合成、长焦画质优化这些对算力和延迟要求更高的任务。两颗芯片分工,比一颗芯片全包效率更高,发热更少。这条路线的性价比,远高于自研 SoC。协处理器的功能边界清晰,开发周期短;大量采用 12/16/28nm 成熟工艺,流片成本只是先进制程的零头;不需要配套完整的编译器和驱动生态。一颗游戏芯片从立项到量产,可以卡在 SoC 换代周期之间完成,比等高通在下一代骁龙里更新 GPU 快一到两年。这样的趋势对芯片行业的影响是双向的。成熟制程的专用芯片需求在增加,12/16/28nm 产线的稼动率因此受益。
与此同时,高通和联发科被迫适应这个趋势:整机厂的协处理器要顺畅接入 SoC 的数据通路,就需要开放更多底层接口,合作模式从'卖一颗芯片'变成'提供一个可以协同的平台'。OpenAI 计划在 2028 年推出一款以 AI 为核心的手机,合作造芯片的是高通和联发科。这个选择值得注意。全球最大的 AI 公司决定做手机时,没有试图自研 SoC,而是直接找了两家现有的手机芯片平台。这再一次说明 SoC 这层不是重点,抢占 Gemini 已经在占据的模型层,才是它真正的目标。这和手机行业正在发生的事情指向同一个方向:SoC 正在成为基础设施,真正的差异化竞争分散到了三个层面,AI 模型层、协处理器层和应用层。AI 模型层的竞争,是谁的端侧模型在 750mA 功耗下跑得更久,谁的编排逻辑让用户真正用起来;协处理器层的竞争,是谁能把游戏超分、影像处理这些特定场景做到极致;应用层的竞争,是谁能让在端侧 AI 真正改变用户的使用习惯。手机芯片的需求,一端被 AI 推着往效率走,另一端被成本推着往整合走。两个方向都在压缩旗舰 SoC 的独占价值,也在给成熟制程、本土玩家打开新的空间。未来手机的差价将来自厂商的创新力,AI 的落地速度,这些真正带来突破的关键点。这是继存储成本重构价格体系后,行业竞争维度发生的又一次根本性转移,标志着单纯依靠硬件参数堆叠的时代彻底终结。