登录
注册
2026年谷歌I/O大会成为人工智能领域的分水岭,皮查伊与Demis Hassabis联合登台,集中发布了筹备半年的技术成果。此次大会的核心在于谷歌对自身技术路线的彻底重构,通过Gemini Omni与Gemini 3.5 Flash的发布,展示了从多模态生成到自主代理开发的全面进化。午方 AI 梳理发现,本次发布的产品密度与技术创新深度均创下历史新高,标志着通用人工智能(AGI)从概念验证迈向大规模工程化应用的关键转折。
Gemini Omni作为真正的“多功能”大型模型,首次实现了任意输入到任意输出的全模态覆盖,特别是视频生成能力的突破。Hassabis在演示中强调,Omni不再仅仅是素材的拼接,而是真正理解了物理世界的重力、动能等概念。例如,在生成解释蛋白质折叠过程的黏土动画时,模型能精确呈现氨基酸链折叠成α螺旋和β折叠结构的动态过程。这种对物理规律的深层理解,使得用户仅通过一句话指令,即可将手绘圆圈转化为黑洞,或将现实街道场景瞬间重构为赛博朋克风格,且生成的视频在角色特征与场景逻辑上保持高度一致。目前Omni Flash已正式上线,并无缝集成至YouTube Shorts,用户可免费体验。
在推理与编码能力方面,Gemini 3.5 Flash的表现彻底颠覆了行业对“旗舰产品”的定义。该模型在Terminal-Bench 2.1编码测试中得分76.2%,在GDPval-AA实际应用任务测试中达到1656 Elo,MCP Atlas大规模工具使用测试得分83.6%,CharXiv多模态理解测试得分84.2%。午方 AI 注意到,这些数据表明3.5 Flash在几乎所有基准测试中均全面超越了三个月前发布的Gemini 3.1 Pro。其输出速度更是达到每秒289个指令,是GPT-5.5和Claude Opus 4.7的四倍以上,实现了速度与性能的双重飞跃。
更为震撼的是基于Antigravity 2.0框架实现的自主开发能力。在大会现场演示中,93个子代理模型协同工作,在12小时内从零构建了一个功能完备的操作系统内核。整个过程中,代理模型发出了超过15,000个请求,处理了26亿个指令,完成了调度程序、内存管理及文件系统的代码编写、测试与审核,总成本不足1000美元。当演示者尝试运行DOOM游戏时,系统自动识别缺失的驱动并即时编写修复代码,成功启动游戏。这一案例标志着AI代理已从辅助工具进化为能够独立完成复杂系统工程的核心生产力。
此外,谷歌还推出了全天候运行的个人AI代理Gemini Spark,它依托云端专用虚拟机,即使用户设备离线也能持续工作。配合搜索功能的25年来最大升级,整合了3.5 Flash技术,新增智能搜索框与自动生成迷你应用功能。在商业层面,AI Ultra订阅计划调整了定价策略,新增100美元档位,最高等级费用从250美元降至200美元。午方 AI 分析认为,谷歌通过这一系列组合拳,不仅巩固了其在生成式AI领域的领导地位,更通过Antigravity 2.0将AI开发范式从“人写代码”推向了“人指挥代理”的新纪元,未来下月即将发布的3.5 Pro将进一步拉大技术代差。