>
正文
Tinygrad稱GLM 5.2雙機互聯推理達120 tok/s
2026-06-21 12:31

午方 AI 獲悉,GPU零售商Tinygrad披露,GLM 5.2模型在採用Blackwell架構的雙機互聯配置下,推理速度可達120 tok/s。該方案硬件總成本爲15萬美元,用戶可選擇兩臺標準版tinybox或一臺tinybox Pro設備以實現同等性能。

Tinygrad將此作爲核心賣點,強調'一次性購買、無後續雲服務費用'的私有部署模式,旨在直接對標按量計費的雲推理服務。目前GLM團隊尚未對此進行官方確認,且Tinygrad未公開更多技術細節。

免責聲明:本內容為作者獨立觀點,不代表平臺立場。未經允許不得轉載,文中內容僅供參考,不作為實際操作建議,交易風險自擔。
標簽:
Tinygrad
GLM5.2
GLM 5.2
Blackwell
tinyboxes
tinybox Pro
分享:
back