Claude成本是DeepSeek的44倍

2026-06-16 18:23

午方 AI 梳理數據顯示，評估機構 Artificial Analysis 重構了 AI 智能指數評價體系，摒棄單純的選擇題測試，轉而聚焦於自主規劃、工具調用及複雜任務完成能力。新版指標核心在於量化任務執行的時間與費用，其中真實世界知識測試 GDPval-AA 權重提升至 20%，並將單次對話長度限制擴展至 250 字。

在最新榜單中，已下線的 Claude Fable 5 以 60 分領跑，而當前可用的 Claude Opus 4.8 以 56 分位居市場第一，略高於 GPT-5.5 的 55 分。國產模型表現強勁，開源模型 DeepSeek V4 Pro 與 MiniMax M3 同獲 44 分，Kimi K2.6 緊隨其後得 43 分。成本方面呈現巨大鴻溝：完成同一任務，Claude Opus 4.8 需耗費 1.78 美元，而 DeepSeek V4 Pro 僅需 0.04 美元，前者成本爲後者的 44 倍。效率上，xAI Grok 4.3 以 1.5 分鐘最快完成，最慢的 Claude Sonnet 4.6 則耗時 13.5 分鐘。

免責聲明：本內容為作者獨立觀點，不代表平臺立場。未經允許不得轉載，文中內容僅供參考，不作為實際操作建議，交易風險自擔。

熱門資訊

灰度：Anthropic 關閉訪問致 TAO 代幣暴漲 30% 助推去中心化 AI

Jane Street 減持 71% IBIT 持倉，暗度陳倉收割鏈上預測市場

USD1 獲 20 億美元啓動，鏈上美元化新路徑

美伊停火引爆反彈，比特幣衝至 67255 美元

WLFI 斥資 25 萬美元贊助 UFC，USD1 流通量飆至 50 億美元

JTO 代幣單日暴漲 18.7%：JTX 上線與回購機制引爆行情

SpaceX 上市次日市值破 2.5 萬億美元，馬斯克成萬億富翁

MiCA 寬限期 7 月 1 日終結，歐盟 75% 平臺或關停

福克斯斥資 220 億收購 Roku，Salesforce 36 億吞併 Fin

以太坊開發者突破100萬，SharpLink CEO 解析生態護城河