登录
注册
据 Woofun AI 消息,OpenAI 最强新模型 GPT-5.6 发布计划遭遇紧急叫停,被要求采取错峰发布策略。出于网络安全考量,该模型暂不面向全网一键解锁,仅向少量合作伙伴开放有限预览。
更关键的是,所有试用权限均需经过严格的逐一审批,谁能使用、何时使用,不再由 OpenAI 单方面决定,必须排队等待准入。这一前所未有的审批机制,标志着大模型发布自由时代的正式终结。在周三的内部问答环节,奥特曼向员工确认,GPT-5.6 将以有限预览形式先行交付给一小群合作方。到了周四的备忘录中,他进一步明确了核心规则:在预览阶段,客户将被逐一审批访问权限。过去十年,硅谷大模型领域的竞争法则唯有一个字:快。谁能抢先发布,谁就能抢占用户心智、API 调用量以及开发者生态。而现在,OpenAI 的策略发生了根本性逆转,将最强旗舰模型握在手中,等待客户排队并逐一盖章放行。奥特曼对此解释得十分克制,称出于安全审查考量,需要分阶段放量。
这意味着 GPT-5.6 实际上成为了某种'特供版'。目前,已有开发者在代码中发现 GPT-5.6-Preview 标志,确认已向部分合作企业正式开放。与此同时,关于 GPT-5.6 深层技术细节的讨论在全网持续升温。最先露出马脚的是其内部代号,开发者在 Codex 的测试路径中扒出了一串 checkpoint 代号,其中被反复提及的 kindle-alpha 据称即为本次发布候选版本。更有开发者在 ChatGPT 代码中直接翻到了 /admin/model-access/gpt-5.6-preview 这样的访问路由。这套通过读取路由日志来预判发布进度的玩法,如今已成为判断 OpenAI 动向最灵敏的信号。
此外,开发者还扒出了 GPT-5.6 全家族模型信息,其中包括一款对标 GPT-4o 语音能力的 GPT-Bidi-1 模型。至于 GPT-5.6 的真实实力,近期流出的灰度测试 demo 或许能揭示其冰山一角。开发者 Chetaslua 利用 GPT-5.6 成功打造了一款《模拟人生》游戏,仅用 48 分钟便完成了一个样本。这充分展示了 AI 在游戏开发与前端渲染领域惊人的效率。
同时,GPT-5.6 Pro 也展现了极强的视觉构建能力,仅用 HTML 便制作出一个类似《我的世界》的体素风格 3D 孔雀动画。只需一张图、一句话,GPT 5.6 Pro 便能设计出一个精美的前端 UI。接下来,一场 GPT-5.6 Pro 与 Fable 5 的真实对战引发了关注。这是针对游戏逻辑、UI 和 3D 实现能力的硬核比拼。
不过在完全相同的指令下,Fable 5 的生成表现明显优于 GPT-5.6 Pro,且整个过程完全脱离外部素材辅助,具备了更强的底层生成力。Woofun AI 整理数据显示,GPT-5.6 可能具备 150 万 token 上下文窗口,比 GPT-5.5 的 100 万 token 一口气增长了约 43%。
这意味着它能一次性'吞下'整个代码库或好几本书,从头读到尾而不串行。在模型的 reasoning effort 预算上,数值从 768 提升到了 960,推理'挡位'被显著拉高。
此外,在长链条 Agent 任务上,token 消耗据称比 GPT-5.5 再节省 10% 至 15%。此前,OpenAI 首席科学家 Jakub Pachocki 表示,内部将 GPT-5.6 定调为'一次有意义的进步'。
然而,这个全网期待的模型,其发布开关已被外部力量拿走。不止 OpenAI 一家,六月本该是大模型的'超级月份',结果'御三家'最强选手齐刷刷哑了火。OpenAI 的 GPT-5.6 已被摁进'逐个客户审批'的队列;Anthropic 的 Fable 5 和 Mythos 5 在发布三天后,因一纸出口管制令被紧急撤下。两家顶尖实验室,双双被同一只手卡住了发布闸门。再看第三家——谷歌的 Gemini 3.5 Pro。该模型在 I/O 大会上高调亮相,号称拥有 200 万 token 上下文及 Deep Think 深度推理能力,原定六月正式上线。皮查伊当时在台上表示'再等一个月',台下开发者据说集体发出一声叹息。结果六月都快过完了,它仍卡在有限预览里,迟迟没能落到普通用户手上。谷歌的延期与前两家情况不同。Gemini 3.5 Pro 跳票至七月,官方给出的理由是打磨质量、吸收早期测试反馈、解决此前 Flash 版本暴露的 token 消耗问题,并为更长链条的智能体任务做准备。换句话说,OpenAI 和 Anthropic 是被外部力量摁住,而谷歌更多是自己踩了刹车。可结果殊途同归,六月这道线,三家一个都没迈过去。地表最强的三款模型,齐刷刷停在了发布的门口,集体将档期挪到了七月。所有人以为自己马上要用上'史上最强 AI