登录
注册
据 Woofun AI 消息,6 月 24 日 OpenAI 与博通正式联手发布 Jalapeño,这是 OpenAI 首款被定义为“智能处理器”的自研 AI 加速器,专为大型语言模型推理任务打造。该芯片目前处于测试与样品阶段,目标是在 2026 年底前启动初步部署,并在随后几年逐步扩大应用规模。Jalapeño 并非意在立即全面取代英伟达 GPU,而是致力于将 ChatGPT、Codex 及 API 等模型日益增长的推理需求,逐步迁移至更适配的软硬件组合方案中。
这一战略转向标志着 OpenAI 从单纯购买计算资源,转变为深度参与定义计算资源研发过程的关键一步。长期以来,OpenAI 高度依赖外部 GPU 供应,尤其是英伟达的产品,但随着模型应用规模的指数级扩张,单纯依靠通用 GPU 在成本控制、供应保障及运行效率上已显现出明显瓶颈。Jalapeño 的出现,正是为了应对这些结构性挑战,通过定制化设计优化特定场景下的算力表现。
值得注意的是,这款芯片完全由 OpenAI 自主设计架构,博通负责提供硅片制造及网络连接技术支持,而 Celestica 则深度参与了电路板设计、机架集成及系统级测试工作,尽管具体的晶圆制造商尚未对外公开。
这种分工模式体现了产业链上下游的深度协同,旨在最大化利用各方技术优势。Woofun AI 整理数据显示,博通在定制 ASIC 芯片及数据中心网络技术领域拥有深厚积累,OpenAI 选择与其合作,意味着将核心架构设计需求委托给一家经验成熟的半导体供应商。两家公司均强调,Jalapeño 旨在融合当前领先 AI 加速器的性能优势,在性能与功耗比上实现显著跃升。
目前,工程样片已在实验室环境中按照预设的目标频率和功耗标准成功运行机器学习任务,但最终的性能数据仍需经过更严格的测试验证。未来几个月内,OpenAI 计划发布一份更为详尽的技术报告,以披露更多关键指标。关于 Jalapeño 的具体性能表现,包括实际吞吐量、延迟时间、功耗水平以及每次推理操作所能节省的具体成本,目前官方尚未公开详细数据。市场观察者倾向于将其与英伟达的 Blackwell 架构或谷歌的 TPU 进行对标,但这些比较目前仍缺乏实际部署数据的支撑。一个值得关注的现象是,从最初的设计立项到完成芯片制造,整个周期仅耗时 9 个月。
这一惊人的速度不仅体现了 AI 技术在缩短芯片研发周期方面的巨大潜力,更证实了 AI 技术本身已能深度介入硬件工程设计流程,从而有效压缩设计周期并加速验证过程。
如果这种定制化芯片的研发模式能够被广泛推广,Jalapeño 极有可能成为 OpenAI 构建多代定制计算平台的起点。早在 2025 年 10 月,OpenAI 便已宣布与博通合作开发一款功率高达 10 吉瓦级别的 AI 加速器,该项目计划于 2026 年下半年开始部署,并预计在 2029 年底前完成全部研发工作。Jalapeño 正是这一宏大合作计划中首个公开亮相的产品样本,承载着验证技术路线的重要使命。
然而,快速的设计速度并不等同于快速的部署落地。Jalapeño 能否真正成为 OpenAI 核心基础设施的一部分,仍取决于后续多个关键环节的顺利推进,包括大规模生产能力的构建、先进封装工艺的成熟度、高带宽内存的供应稳定性、服务器系统的集成程度以及数据中心的调度安排。任何单一环节出现瓶颈,都可能严重阻碍其在今年年底前的实际部署进度。市场普遍将 Jalapeño 视为对英伟达地位的直接挑战,但更准确的解读是,OpenAI 正试图为某些特定的推理任务寻找不依赖英伟达的替代方案。英伟达的核心护城河在于其成熟的 CUDA 生态系统、完善的工具链、先进的互联技术、庞大的开发者群体以及大规模的生产能力。即便有了 Jalapeño,OpenAI 在尖端训练任务和多种复杂计算场景中,短期内仍无法完全摆脱对英伟达的依赖。
不过,对于那些需求稳定、模型结构相对固定且易于控制的推理任务而言,定制芯片确实具备显著优势。将高频、标准化的推理任务迁移至 Jalapeño,有望在降低运营成本和提升供应灵活性方面带来实质性收益。对于博通而言,像 OpenAI 这样的 AI 巨头选择内部开发芯片,预示着未来将有更多定制化项目涌现。
然而,这些项目的盈利潜力最终将取决于组件成本控制、生产规模效应以及系统复杂度的平衡。对于 Jalapeño 而言,接下来市场需要重点关注的核心问题包括:到今年年底其实际部署规模能达到何种量级、能够处理哪些具体类型的计算任务,以及它能在多大程度上真正降低推理处理的成本。对于 OpenAI 来说,这款芯片不仅是技术上的突破,更是打破 GPU 供应瓶颈、掌握算力自主权的第一步。