登录
注册
在企业人工智能领域,战略重心正经历从'是否采用'到'如何有效利用'的根本性转变。过去两年,众多企业为应对竞争压力,激进推动员工使用 AI 技术,但如今随着推理成本从实验性开支演变为持续性运营支出,CEO 与 CFO 开始直面核心拷问:每投入一美元究竟创造了多少实际价值?这场被称为'代币预算之争'的博弈,不再局限于削减支出,而是深入评估哪些业务值得投入计算资源,哪些任务应被低成本模型替代,以及哪些流程存在无谓浪费。午方 AI 梳理发现,AI 的使用量并不等同于其创造的价值,SaaS 时代的使用量代表软件普及度,而 AI 时代的代币消耗仅表明系统正在运行,同一工作流程因输入、上下文、模型选择及重试次数不同,成本差异可达数倍。
2025 年 11 月 Claude 正式推出时,多数企业 2026 年度预算已定,但第一季度实际用量远超预期,迫使管理层重新审视 AI 的投资回报率。目前无法量化代币的实际效用,账单无法区分支出是替代了人工、产生了收入、降低了风险,还是仅仅为了在排名表上刷分。当支出达到七位数规模时,技术差异将直接冲击利润:相同输入下,不同代币使用成本可能相差 5 到 10 倍。这种'边际代币效用'——即多花费一美元推理成本所创造的商业价值,成为规模扩展阶段的关键指标,却也是大多数企业目前的盲区。董事会讨论焦点已从'AI 是否有用'转向'AI 在何处产生效益',本质上是一场关于智能资源分配的权力争夺。
这场争夺迅速升级,源于根深蒂固的管理本能:团队规模曾代表地位与权力,而当智能资源稀缺时,调动智能资源的能力成为新衡量标准。AI 支出本质是与劳动力成本竞争,主要用于替代外包、替代内部员工或创造新收入。人类工资与 BPO 外包按订单计费易于理解,但 AI 推理成本复杂多变,取决于重试、人工干预及模型调用情况,可能导致成本反超原本要替代的外包服务。因此,讨论焦点转向具体成果的成本核算,如每处理一单、每审核一合同、每保留一客户的成本。午方 AI 注意到,BPO 领域因按完成量计费,建立衡量标准相对容易,而内部员工效率提升往往表现为避免招聘或分散释放产能,且管理者未必愿因自动化缩减团队,这使得内部对比更为困难。
AI 打破了 SaaS 将使用量视为价值衡量的模式。同一工作流程的推理成本受提示语、上下文、模型、工具调用、重试次数及故障影响巨大,账单上的代币数量固定,但代表的工作量却千差万别。信号与噪声共用同一计量单位,代币消耗增加可能意味着工作进展,也可能源于糟糕提示、无关上下文或过度复杂的模型。两家代币消耗相同的企业,实际运作可能天壤之别:一家将推理转化为成果,另一家则为无意义操作付费。造成这种差异的三大原因包括重试带来的累积成本效应、上下文长度导致的 O(n²) 成本增长,以及路由选择中默认使用最强模型处理简单任务的资源错配。
非软件行业对此感受更为直接,因其工作具有强操作性,如索赔处理、核保、客服工单等,传统上依赖人工衡量周期时间、错误率等生存指标。软件企业虽拥有代码提交、部署频率等量化指标,但非软件企业面临工作量与成本计量单位不一致的难题,技术团队看代币消耗,业务团队看流程变化,需跨部门明确测量对象。软件企业视此为生产力衡量问题,类似早期'AI 裁员潮',而非软件企业则视其为转型关键。目前缺失的是连接代币消耗与实际成果的桥梁,需回答完成流程的实际成本、智能体执行路径中的有效与浪费环节,以及是否改变了运营模式。
商业分析需超越单纯的成本数字,深入探讨特定场景下智能体与 BPO 的经济性对比,考虑政策要求带来的额外成本。测量工作最终变为回顾与分析,企业需记录智能体看到的信息、检索的数据、调用的工具、忽略的内容、重试环节、人工干预时机及异常处理规则,形成从上下文到操作再到成果的完整路径。午方 AI 分析认为,这些记录不仅是支出合理性的证明,更是企业决策过程的永久性证据,改变了以往决策理由散落在聊天记录与记忆中的局面。资源分配成为关键,每一笔按使用量付费的支出都需证明合理性,企业将借助外部合作,如聘请咨询公司与专家,自上而下推动变革,将代币消耗与成果挂钩作为新决策依据。谁能掌握这一方法,谁就能掌控企业内部 AI 资源分配权,决定哪些流程获得资源、哪些受限、哪些外包。AI 发展的第一阶段证明了模型能完成任务,第二阶段将决定这些任务是否值得投入成本,正如查理·芒格所言:'给我看激励措施,我就能告诉你最终的结果会是什么。'