谷歌I/O发布Gemini 3.5，12小时构建操作系统

2026-05-20 14:51

2026年谷歌I/O大会成为人工智能领域的分水岭，皮查伊与Demis Hassabis联合登台，集中发布了筹备半年的技术成果。此次大会的核心在于谷歌对自身技术路线的彻底重构，通过Gemini Omni与Gemini 3.5 Flash的发布，展示了从多模态生成到自主代理开发的全面进化。午方 AI 梳理发现，本次发布的产品密度与技术创新深度均创下历史新高，标志着通用人工智能（AGI）从概念验证迈向大规模工程化应用的关键转折。

Gemini Omni作为真正的“多功能”大型模型，首次实现了任意输入到任意输出的全模态覆盖，特别是视频生成能力的突破。Hassabis在演示中强调，Omni不再仅仅是素材的拼接，而是真正理解了物理世界的重力、动能等概念。例如，在生成解释蛋白质折叠过程的黏土动画时，模型能精确呈现氨基酸链折叠成α螺旋和β折叠结构的动态过程。这种对物理规律的深层理解，使得用户仅通过一句话指令，即可将手绘圆圈转化为黑洞，或将现实街道场景瞬间重构为赛博朋克风格，且生成的视频在角色特征与场景逻辑上保持高度一致。目前Omni Flash已正式上线，并无缝集成至YouTube Shorts，用户可免费体验。

在推理与编码能力方面，Gemini 3.5 Flash的表现彻底颠覆了行业对“旗舰产品”的定义。该模型在Terminal-Bench 2.1编码测试中得分76.2%，在GDPval-AA实际应用任务测试中达到1656 Elo，MCP Atlas大规模工具使用测试得分83.6%，CharXiv多模态理解测试得分84.2%。午方 AI 注意到，这些数据表明3.5 Flash在几乎所有基准测试中均全面超越了三个月前发布的Gemini 3.1 Pro。其输出速度更是达到每秒289个指令，是GPT-5.5和Claude Opus 4.7的四倍以上，实现了速度与性能的双重飞跃。

更为震撼的是基于Antigravity 2.0框架实现的自主开发能力。在大会现场演示中，93个子代理模型协同工作，在12小时内从零构建了一个功能完备的操作系统内核。整个过程中，代理模型发出了超过15,000个请求，处理了26亿个指令，完成了调度程序、内存管理及文件系统的代码编写、测试与审核，总成本不足1000美元。当演示者尝试运行DOOM游戏时，系统自动识别缺失的驱动并即时编写修复代码，成功启动游戏。这一案例标志着AI代理已从辅助工具进化为能够独立完成复杂系统工程的核心生产力。

此外，谷歌还推出了全天候运行的个人AI代理Gemini Spark，它依托云端专用虚拟机，即使用户设备离线也能持续工作。配合搜索功能的25年来最大升级，整合了3.5 Flash技术，新增智能搜索框与自动生成迷你应用功能。在商业层面，AI Ultra订阅计划调整了定价策略，新增100美元档位，最高等级费用从250美元降至200美元。午方 AI 分析认为，谷歌通过这一系列组合拳，不仅巩固了其在生成式AI领域的领导地位，更通过Antigravity 2.0将AI开发范式从“人写代码”推向了“人指挥代理”的新纪元，未来下月即将发布的3.5 Pro将进一步拉大技术代差。

免责声明：本内容为作者独立观点，不代表平台立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

WOOFUN.AI 你的加密智能助理。以智能技术重构加密体验，化繁为简，打破专业门槛，让每个人都能安心、聪明、快乐地拥抱数字未来。

iOS

Google Play

Android Apk

市场生态 Alpha 失乐园评级资讯快讯日历交易所钱包