Claude Sonnet 5 登場:能力逼近 Opus 4.8,定價藏一個坑
Claude Sonnet 5 登場:能力逼近 Opus 4.8,定價藏一個坑

Anthropic 發布 Claude Sonnet 5,agentic 能力逼近 Opus 4.8、早鳥定價至 8/31,但 tokenizer 更新讓實際成本可能多算 35%。立即掌握企業評估升級前的 3 個重點。

Anthropic 於 2026 年 6 月 30 日發布 Claude Sonnet 5,主打「史上最 agentic 的 Sonnet 模型」,效能逼近 Opus 4.8,但價格更低。同時上架 Amazon Bedrock 與 Claude Platform on AWS,API 代號 claude-sonnet-5。早鳥定價只到 8 月 31 日,且模型換了新版 tokenizer,實際成本不只看牌價這麼簡單。

3 秒看結論

  • Sonnet 5 在 SWE-bench Pro 拿下 63.2%、OSWorld-Verified 81.2%,知識工作測試(GDPval-AA v2)甚至小贏 Opus 4.8
  • 已上架 Amazon Bedrock、Claude Platform on AWS、Google Cloud 的 Gemini Enterprise Agent Platform(前 Vertex AI,GA)、Microsoft Foundry(Preview)
  • 早鳥定價 Input $2 / Output $10(每百萬 token),8/31 後漲到 $3 / $15
  • 新版 tokenizer 讓同樣文字的 token 數變為原本的 1.0~1.35 倍(最多增加 35%),早鳥折扣未必完全抵銷

Sonnet 5 是什麼:最 agentic 的 Sonnet 模型

Sonnet 5 不是單純的效能升級,Anthropic 把它定位成「能自主規劃、操作瀏覽器與終端機、長時間執行任務」的模型,過去這個層級的自主能力只有 Opus 系列才做得到。

最大特色是「Adaptive thinking always on」:模型依任務難度自動調整內部推理深度。改一段文字用輕量思考,多檔案重構或研究型問題自動切到深度思考,不需要工程師手動調參數。

上架範圍分兩層,企業可以按帳號類型與雲端平台直接切換,不用等功能開放:

訂閱方案層

API 與雲端平台層

  • Claude API:代號 claude-sonnet-5
  • Amazon Bedrock:已上架,全區域
  • Claude Platform on AWS:北美/南美/歐洲/亞太已開放
  • Google Cloud Gemini Enterprise Agent Platform:已於 6/30 同步上架並開放一般存取(GA)
  • Microsoft Foundry:同步上架(Preview 階段)

Anthropic 同步公布安全評測結果:Sonnet 5 的不良行為發生率低於 Sonnet 4.6,尤其在 agentic(自主執行任務)情境下更穩定,這對正在把 Claude 接進內部流程自動化的企業是個加分項。

實測數據:全面超越 Sonnet 4.6,逼近 Opus 4.8

Sonnet 5 與 Opus 4.8 benchmark 對比示意

Anthropic 與第三方測試機構公布的 benchmark 顯示,Sonnet 5 在每一項公開測試都優於前代 Sonnet 4.6,部分指標甚至超車 Opus 4.8:

Benchmark測項內容Sonnet 5
SWE-bench Pro真實軟體工程任務63.2%
OSWorld-Verified電腦操作 / agentic 任務81.2%
HLE(Humanity’s Last Exam,使用工具時)高難度推理57.4%
GDPval-AA v2知識工作品質1,618(Opus 4.8 為 1,615)

「逼近 Opus 4.8、但價格更低」是 Anthropic 這次發布的核心訴求。對已在用 Opus / Sonnet / Haiku 三代模型 分工的企業來說,這代表原本要上 Opus 才能跑的 agentic 工作負載,現在有機會下放到 Sonnet 5,同時省下單次呼叫成本。

實務上仍要看任務類型:知識工作、規劃、工具串接這類場景 Sonnet 5 已經夠用;純推理深度或超長 context 需求高的任務,Opus 4.8 仍是更保守的選擇。

定價與隱性成本:早鳥視窗 + tokenizer 怎麼算

Sonnet 5 的定價分兩階段:

項目早鳥定價(至 2026/8/31)之後定價
Input(每百萬 token)$2$3
Output(每百萬 token)$10$15

早鳥視窗只有兩個月,過了 8 月底就漲 50%。但更值得注意的是新版 tokenizer(與 Opus 4.7 同款的更新),同樣一段文字視內容類型(程式碼、中文、表格)token 數可能變為原本的 1.0 到 1.35 倍,也就是最多增加 35%。這跟我們在《Claude API 費用完整解析》 裡拆解過的 Opus 4.7 隱性成本邏輯完全一樣:牌價便宜,實際帳單不一定便宜,要看你的工作負載是文字密集還是程式碼密集。

換算下來,一個原本用 Sonnet 4.6 跑月成本 NT$ 30,000 的 agent 工作負載,換到 Sonnet 5 早鳥定價可能因為單價下降而省錢。但如果內容類型偏向 tokenizer 吃虧的類型(例如大量中文或結構化資料),省下來的部分會被多算的 token 數吃掉一部分。建議先用小流量測試實際 token 消耗量,再決定是否全面切換。

Sonnet 5、Opus 4.8、Sonnet 4.6:企業現在該選哪個

三代模型現在同時在架上,選型邏輯可以簡化成三個問題:

  1. 工作負載是不是 agentic(自主執行多步驟任務)? 是的話 Sonnet 5 是目前性價比最高的選項,不需要為了自主能力硬上 Opus 4.8
  2. 是不是需要極致推理深度或超長 context 的任務? 這類場景 Opus 4.8 仍值得保留,Sonnet 5 逼近但沒有完全取代
  3. 是不是低延遲、大量、簡單任務? Haiku 4.5 的定位沒有變,Sonnet 5 不是用來取代 Haiku 的成本結構

如果團隊已經有跨模型分工的架構,Sonnet 5 上線後最直接的動作是把原本卡在「Sonnet 4.6 不夠、Opus 4.8 太貴」中間地帶的工作負載,重新測試一次。

企業採購重點:現在該做什麼

Sonnet 5 剛上線,企業評估升級前有三件事值得先確認:

  • 鎖定早鳥定價視窗:8/31 前完成評估與切換,能用到 Input $2/Output $10 的價格
  • 實測 tokenizer 對帳單的影響:不要只看牌價下降就直接全量切換,先跑一週小流量比對實際 token 消耗
  • 確認採購路徑:台灣公司可透過 Anthropic 官網直購、Amazon Bedrock,或透過代理商處理發票與在地付款問題,詳見《台灣公司怎麼買 Claude API》

企業導入 Claude API 時最常卡的不是模型能力,是「選型決策誰來做、成本怎麼追、發票怎麼開」這三件行政與技術交叉的事。勤英科技作為 AWS 與 Google Cloud 的雲端代理商,同時協助企業評估 Claude API 在 Bedrock 上的部署與帳務整合。

想評估 Sonnet 5 是否值得切換?立即聯繫我們,安排你的工作負載成本比對 →

結論

Sonnet 5 是 Anthropic 這輪發布裡最務實的一次更新:不是堆規格,是把過去 Opus 級別才有的 agentic 能力,用 Sonnet 的價格做出來。早鳥定價視窗只有兩個月,加上 tokenizer 更新這個隱性變數,企業評估升級時間點會比看牌價複雜一點。

先確認你的工作負載類型(agentic vs 一般任務)、實測 token 消耗量,再決定要不要在 8/31 前完成切換,是目前最務實的做法。

想知道 Sonnet 5 對你目前的 Claude API 帳單有什麼影響?預約評估 →

資料來源

author avatar
Kevin Chou 行銷經理
專注於雲端成本優化、FinOps 策略及跨雲端平台(AWS、Google Cloud、Azure)的多雲架構規劃,具備企業雲端解決方案的數位行銷、數據分析與內容策略實戰經驗。持續深入追蹤 AI 基礎架構與生成式 AI 應用的最新發展,專注於研究各大雲端平台如何整合 AI 能力,協助企業發掘具體的商業應用價值。
Claude Opus Sonnet