>
正文
Gemini 3.2实时模型上线谷歌云,推理成本仅为GPT-5.5二十分之一
2026-05-17 10:34

午方 AI 监测数据显示,Google Cloud Console 模型筛选列表中已上线名为“gemini-3.2-flash-lite-live-preview”的基础模型选项。该版本后缀中的“lite”与“live”标识,明确指向其为满足超低延迟实时交互需求而专门优化的架构。

Abacus.AI 首席执行官 Bindu Reddy 此前披露,Gemini 3.2 Flash 在编码与推理能力上已达到 GPT-5.5 的 92%,但得益于精简优化技术,其推理成本仅为后者的二十分之一,且多数查询响应延迟低于 200 毫秒。行业普遍预期,这款高性价比轻量级模型将于 5 月 20 日举行的 Google I/O 大会上正式发布。

免责声明:本内容为作者独立观点,不代表平台立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。
标签:
Bindu Reddy
gemini-3.2-flash-lite-live-preview
Gemini 3.2 Flash
Abacus.AI
分享:
back