>
正文
Tinygrad称GLM 5.2双机互联推理达120 tok/s
2026-06-21 12:31

午方 AI 获悉,GPU零售商Tinygrad披露,GLM 5.2模型在采用Blackwell架构的双机互联配置下,推理速度可达120 tok/s。该方案硬件总成本为15万美元,用户可选择两台标准版tinybox或一台tinybox Pro设备以实现同等性能。

Tinygrad将此作为核心卖点,强调'一次性购买、无后续云服务费用'的私有部署模式,旨在直接对标按量计费的云推理服务。目前GLM团队尚未对此进行官方确认,且Tinygrad未公开更多技术细节。

免责声明:本内容为作者独立观点,不代表平台立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。
标签:
Tinygrad
GLM5.2
GLM 5.2
Blackwell
tinyboxes
tinybox Pro
分享:
back