巨头弃用 OpenAI 转投中国模型，成本骤降一半

2026-07-04 00:05

据 Woofun AI 消息，美国加密货币巨头 Coinbase 首席执行官布莱恩·阿姆斯特朗近期披露，公司已将核心 AI 模型切换至中国的 GLM 5.2 与 Kimi 2.7，此举直接导致其 AI 相关支出缩减 50%。

这一决策并非源于业务萎缩，相反，在成本腰斩的同时，Coinbase 的 token 使用量反而呈现上升趋势。这种'降本增效'的反常现象，正在让 OpenAI 与 Anthropic 等硅谷传统巨头感到前所未有的焦虑，标志着 AI 基础设施选型逻辑的根本性逆转。

实现这一惊人降本效果的核心，在于 Coinbase 构建了一套精密的'成本节约系统'，而非简单的模型替换。首先，公司部署了自动路由系统，该机制能根据任务复杂度、实时价格及缓存状态动态匹配模型，确保简单翻译任务由廉价模型处理，而高难度推理才调用高性能模型，彻底摒弃了'一刀切'的资源浪费。其次，通过深度优化缓存策略，Coinbase 将缓存命中率从原本的 5% 激增至 60%，这意味着六成请求可直接复用历史计算结果，大幅削减了单次请求的实际算力成本。最后，团队全面推行'上下文工程'，要求开发人员为不同任务开启独立会话并精简背景信息，避免在单次对话中堆砌冗余内容。Anthropic 在其技术博客中也承认，在管理 AI 智能体时，这种上下文工程策略比传统的提示工程更为高效，其本质在于为模型提供精准信息而非单纯追求模型智商的提升。

这一趋势已迅速从 Coinbase 扩散至整个科技行业，多家企业开始实测中国模型的性价比。拥有 25 名员工的 AI 初创公司 Lindy 已全面弃用 Claude，转而采用 DeepSeek，其首席执行官 Flo Crivello 向 CNBC 坦言，AI 成本超过人力成本的局面已不可持续，模型切换后为公司节省了数百万美元。Snowflake 首席执行官斯里达·拉马斯瓦米则进行了严谨的对比测试：在 103 项编码任务中，GLM-5.2 的完成率为 66%，而 Claude Opus 4.7 为 67%，两者性能差异微乎其微。

然而价格鸿沟却触目惊心：Woofun AI 整理数据显示，GLM-5.2 的输入与输出成本分别为 1.40 美元和 4.40 美元，而 Claude Opus 4.7 分别为 5 美元和 25 美元，GPT-5.5 更是高达 5 美元和 30 美元，输出价格差距高达 5 至 7 倍。

尽管价格优势显著，但质量与稳定性的博弈依然存在。Snowflake 的测试数据揭示，GLM-5.2 在部分任务上的首次尝试成功率仅为 47.6%，低于 Opus 的 53.7%。

更关键的是，GLM 偶尔会出现'固执'的错误路径，例如在某项任务中耗时 24 分钟、经过 411 次尝试后仍告失败，而 Opus 仅用 9 分钟、49 次尝试便成功完成。

不过，在大多数常规任务中，两者的最终成功率几乎持平。对于企业决策者而言，核心问题已转化为是否愿意为几个百分点的稳定性溢价支付 5 倍成本，越来越多的答案指向否定。对于普通用户，这一变革同样具有启示意义：不应固守 ChatGPT 或 Claude 单一工具，而应像专业用户一样，根据任务类型灵活切换模型；

同时，善用缓存机制处理重复任务，并通过简化上下文信息来提升交互效率，避免在海量历史记录中徒劳搜索。

这场模型迁移浪潮正在从根本上重塑 AI 行业的定价逻辑。OpenAI 与 Anthropic 的高估值曾建立在营收持续高速增长的假设之上，但随着 Coinbase 和 Lindy 等巨头转向高性价比替代方案，这一假设正面临严峻挑战。市场已出现价格战苗头，OpenAI 在最新推出的 GPT-5.6 系列中，Terra 模型价格仅为 GPT-5.5 的一半，Luna 模型则主打极致低价。当美国科技巨头开始大规模采用中国模型以降低成本时，AI 领域的竞争焦点已从实验室的基准测试彻底转向真实的成本之战，能够以更低价格完成同等任务，已成为新的核心竞争力。

免责声明：本内容为作者独立观点，不代表平台立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

WOOFUN.AI 你的加密智能助理。以智能技术重构加密体验，化繁为简，打破专业门槛，让每个人都能安心、聪明、快乐地拥抱数字未来。

iOS

Google Play

Android Apk

市场生态 Alpha 失乐园评级资讯快讯日历交易所钱包