>
正文
Claude成本是DeepSeek的44倍
2026-06-16 18:23

午方 AI 梳理數據顯示,評估機構 Artificial Analysis 重構了 AI 智能指數評價體系,摒棄單純的選擇題測試,轉而聚焦於自主規劃、工具調用及複雜任務完成能力。新版指標核心在於量化任務執行的時間與費用,其中真實世界知識測試 GDPval-AA 權重提升至 20%,並將單次對話長度限制擴展至 250 字。

在最新榜單中,已下線的 Claude Fable 5 以 60 分領跑,而當前可用的 Claude Opus 4.8 以 56 分位居市場第一,略高於 GPT-5.5 的 55 分。國產模型表現強勁,開源模型 DeepSeek V4 Pro 與 MiniMax M3 同獲 44 分,Kimi K2.6 緊隨其後得 43 分。成本方面呈現巨大鴻溝:完成同一任務,Claude Opus 4.8 需耗費 1.78 美元,而 DeepSeek V4 Pro 僅需 0.04 美元,前者成本爲後者的 44 倍。效率上,xAI Grok 4.3 以 1.5 分鐘最快完成,最慢的 Claude Sonnet 4.6 則耗時 13.5 分鐘。

免責聲明:本內容為作者獨立觀點,不代表平臺立場。未經允許不得轉載,文中內容僅供參考,不作為實際操作建議,交易風險自擔。
標簽:
Artificial Analysis
AI Intelligence Index
Claude Fable 5
Claude Opus 4.8
GPT-5.5
DeepSeek V4 Pro
MiniMax M3
Kimi K2.6
xAI Grok 4.3
Claude Sonnet 4.6
GDPval-AA
分享:
back