登录
注册
据 Woofun AI 消息,美国加密货币巨头 Coinbase 首席执行官布莱恩·阿姆斯特朗近期披露,公司已将核心 AI 模型切换至中国的 GLM 5.2 与 Kimi 2.7,此举直接导致其 AI 相关支出缩减 50%。
这一决策并非源于业务萎缩,相反,在成本腰斩的同时,Coinbase 的 token 使用量反而呈现上升趋势。这种'降本增效'的反常现象,正在让 OpenAI 与 Anthropic 等硅谷传统巨头感到前所未有的焦虑,标志着 AI 基础设施选型逻辑的根本性逆转。
实现这一惊人降本效果的核心,在于 Coinbase 构建了一套精密的'成本节约系统',而非简单的模型替换。首先,公司部署了自动路由系统,该机制能根据任务复杂度、实时价格及缓存状态动态匹配模型,确保简单翻译任务由廉价模型处理,而高难度推理才调用高性能模型,彻底摒弃了'一刀切'的资源浪费。其次,通过深度优化缓存策略,Coinbase 将缓存命中率从原本的 5% 激增至 60%,这意味着六成请求可直接复用历史计算结果,大幅削减了单次请求的实际算力成本。最后,团队全面推行'上下文工程',要求开发人员为不同任务开启独立会话并精简背景信息,避免在单次对话中堆砌冗余内容。Anthropic 在其技术博客中也承认,在管理 AI 智能体时,这种上下文工程策略比传统的提示工程更为高效,其本质在于为模型提供精准信息而非单纯追求模型智商的提升。
这一趋势已迅速从 Coinbase 扩散至整个科技行业,多家企业开始实测中国模型的性价比。拥有 25 名员工的 AI 初创公司 Lindy 已全面弃用 Claude,转而采用 DeepSeek,其首席执行官 Flo Crivello 向 CNBC 坦言,AI 成本超过人力成本的局面已不可持续,模型切换后为公司节省了数百万美元。Snowflake 首席执行官斯里达·拉马斯瓦米则进行了严谨的对比测试:在 103 项编码任务中,GLM-5.2 的完成率为 66%,而 Claude Opus 4.7 为 67%,两者性能差异微乎其微。
然而价格鸿沟却触目惊心:Woofun AI 整理数据显示,GLM-5.2 的输入与输出成本分别为 1.40 美元和 4.40 美元,而 Claude Opus 4.7 分别为 5 美元和 25 美元,GPT-5.5 更是高达 5 美元和 30 美元,输出价格差距高达 5 至 7 倍。
尽管价格优势显著,但质量与稳定性的博弈依然存在。Snowflake 的测试数据揭示,GLM-5.2 在部分任务上的首次尝试成功率仅为 47.6%,低于 Opus 的 53.7%。
更关键的是,GLM 偶尔会出现'固执'的错误路径,例如在某项任务中耗时 24 分钟、经过 411 次尝试后仍告失败,而 Opus 仅用 9 分钟、49 次尝试便成功完成。
不过,在大多数常规任务中,两者的最终成功率几乎持平。对于企业决策者而言,核心问题已转化为是否愿意为几个百分点的稳定性溢价支付 5 倍成本,越来越多的答案指向否定。对于普通用户,这一变革同样具有启示意义:不应固守 ChatGPT 或 Claude 单一工具,而应像专业用户一样,根据任务类型灵活切换模型;
同时,善用缓存机制处理重复任务,并通过简化上下文信息来提升交互效率,避免在海量历史记录中徒劳搜索。
这场模型迁移浪潮正在从根本上重塑 AI 行业的定价逻辑。OpenAI 与 Anthropic 的高估值曾建立在营收持续高速增长的假设之上,但随着 Coinbase 和 Lindy 等巨头转向高性价比替代方案,这一假设正面临严峻挑战。市场已出现价格战苗头,OpenAI 在最新推出的 GPT-5.6 系列中,Terra 模型价格仅为 GPT-5.5 的一半,Luna 模型则主打极致低价。当美国科技巨头开始大规模采用中国模型以降低成本时,AI 领域的竞争焦点已从实验室的基准测试彻底转向真实的成本之战,能够以更低价格完成同等任务,已成为新的核心竞争力。