登录
注册
午方 AI 梳理数据显示,随着应用场景从'聊天'向'工作流程'迁移,Token 消耗呈现爆发式增长。截至 6 月 22 日前一周,全球平台 Token 使用总量攀升至 46.7 万亿,环比增长 4.7%。在此背景下,中国模型表现强势,单周消耗量达 18.8 万亿,显著高于美国模型的 5.8 万亿。DeepSeek V4 Flash 以 4.94 万亿的消耗量位居榜首,小米 MiMo-V2.5、MiniMax M3 及腾讯 Hy3 预览版紧随其后。这一格局变化的核心驱动力在于中国模型在性能与成本间的优化平衡,其 API 调用成本仅为美国模型的零头,主要得益于 MoE 机制及注意力机制的效率提升。
尽管调用频次激增,但支出并未同步扩张。Jufui 的 Silicon Data LLM Token Expenditure Index 显示,6 月 14 日至 19 日期间该指数维持在 1.64 至 1.68 区间,低于 5 月 31 日的 2.04。这表明开发者倾向于选择更具性价比的模型,'高频调用、低成本'的趋势将利好百度、阿里巴巴、腾讯、金山云、AI Labs 及快手 Kelin 等企业。
与此同时,Volcano Engine 即将举办 FORCE Summit,市场焦点集中于抖音大模型每日 Token 消耗、Seedance 2.0 及 TRAE 等产品进展。腾讯微信 AI '小威'预计于 2026 年第四季度正式上线。长远来看,中国大模型市场复合年增长率预计达 64%,2030 年市场规模有望突破 1000 亿元人民币,企业级应用与本地化部署将成为核心收入来源。