Gemini 3.2实时模型上线谷歌云，推理成本仅为GPT-5.5二十分之一

2026-05-17 10:34

午方 AI 监测数据显示，Google Cloud Console 模型筛选列表中已上线名为“gemini-3.2-flash-lite-live-preview”的基础模型选项。该版本后缀中的“lite”与“live”标识，明确指向其为满足超低延迟实时交互需求而专门优化的架构。

Abacus.AI 首席执行官 Bindu Reddy 此前披露，Gemini 3.2 Flash 在编码与推理能力上已达到 GPT-5.5 的 92%，但得益于精简优化技术，其推理成本仅为后者的二十分之一，且多数查询响应延迟低于 200 毫秒。行业普遍预期，这款高性价比轻量级模型将于 5 月 20 日举行的 Google I/O 大会上正式发布。

免责声明：本内容为作者独立观点，不代表平台立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

热门资讯

CME 与 ICE 发力全天候交易，Hyperliquid 掌控 58.5% 流动性

SBI 与乐天拟推 Bitcoin 信托，日本 2028 年迎加密 ETF

Bitcoin 受国债收益率压制，77,700 美元支撑位面临考验

Forward Industries 独持 698 万 SOL 碾压其余四家

法国通用银行将稳定币接入Canton网络布局回购业务

APEMARS 预售狂揽 46.8 万美元，XLM 与 LINK 大涨背景下的新焦点

霍尔木兹海峡部分封锁致日减1000万桶石油供应

PEPE 跌破均线承压，17.1 亿市值能否守住 0.00000335 支撑

拉美 1740 亿美元汇款市场：巨头误判，红利在美元储蓄

Vitalik 提出庇护技术：对抗 AI 需保留人类手动模式