Anthropic 於 2026 年 6 月 30 日發布 Claude Sonnet 5,主打「史上最 agentic 的 Sonnet 模型」,效能逼近 Opus 4.8,但價格更低。同時上架 Amazon Bedrock 與 Claude Platform on AWS,API 代號 claude-sonnet-5。早鳥定價只到 8 月 31 日,且模型換了新版 tokenizer,實際成本不只看牌價這麼簡單。
3 秒看結論
- Sonnet 5 在 SWE-bench Pro 拿下 63.2%、OSWorld-Verified 81.2%,知識工作測試(GDPval-AA v2)甚至小贏 Opus 4.8
- 已上架 Amazon Bedrock、Claude Platform on AWS、Google Cloud 的 Gemini Enterprise Agent Platform(前 Vertex AI,GA)、Microsoft Foundry(Preview)
- 早鳥定價 Input $2 / Output $10(每百萬 token),8/31 後漲到 $3 / $15
- 新版 tokenizer 讓同樣文字的 token 數變為原本的 1.0~1.35 倍(最多增加 35%),早鳥折扣未必完全抵銷
Sonnet 5 是什麼:最 agentic 的 Sonnet 模型
Sonnet 5 不是單純的效能升級,Anthropic 把它定位成「能自主規劃、操作瀏覽器與終端機、長時間執行任務」的模型,過去這個層級的自主能力只有 Opus 系列才做得到。
最大特色是「Adaptive thinking always on」:模型依任務難度自動調整內部推理深度。改一段文字用輕量思考,多檔案重構或研究型問題自動切到深度思考,不需要工程師手動調參數。
上架範圍分兩層,企業可以按帳號類型與雲端平台直接切換,不用等功能開放:
訂閱方案層
- Free / Pro:Sonnet 5 已是預設模型
- Max / Team / Enterprise:全數可用(各方案差異可參考《Claude 方案完整比較》)
API 與雲端平台層
- Claude API:代號
claude-sonnet-5 - Amazon Bedrock:已上架,全區域
- Claude Platform on AWS:北美/南美/歐洲/亞太已開放
- Google Cloud Gemini Enterprise Agent Platform:已於 6/30 同步上架並開放一般存取(GA)
- Microsoft Foundry:同步上架(Preview 階段)
Anthropic 同步公布安全評測結果:Sonnet 5 的不良行為發生率低於 Sonnet 4.6,尤其在 agentic(自主執行任務)情境下更穩定,這對正在把 Claude 接進內部流程自動化的企業是個加分項。
實測數據:全面超越 Sonnet 4.6,逼近 Opus 4.8

Anthropic 與第三方測試機構公布的 benchmark 顯示,Sonnet 5 在每一項公開測試都優於前代 Sonnet 4.6,部分指標甚至超車 Opus 4.8:
| Benchmark | 測項內容 | Sonnet 5 |
|---|---|---|
| SWE-bench Pro | 真實軟體工程任務 | 63.2% |
| OSWorld-Verified | 電腦操作 / agentic 任務 | 81.2% |
| HLE(Humanity’s Last Exam,使用工具時) | 高難度推理 | 57.4% |
| GDPval-AA v2 | 知識工作品質 | 1,618(Opus 4.8 為 1,615) |
「逼近 Opus 4.8、但價格更低」是 Anthropic 這次發布的核心訴求。對已在用 Opus / Sonnet / Haiku 三代模型 分工的企業來說,這代表原本要上 Opus 才能跑的 agentic 工作負載,現在有機會下放到 Sonnet 5,同時省下單次呼叫成本。
實務上仍要看任務類型:知識工作、規劃、工具串接這類場景 Sonnet 5 已經夠用;純推理深度或超長 context 需求高的任務,Opus 4.8 仍是更保守的選擇。
定價與隱性成本:早鳥視窗 + tokenizer 怎麼算
Sonnet 5 的定價分兩階段:
| 項目 | 早鳥定價(至 2026/8/31) | 之後定價 |
|---|---|---|
| Input(每百萬 token) | $2 | $3 |
| Output(每百萬 token) | $10 | $15 |
早鳥視窗只有兩個月,過了 8 月底就漲 50%。但更值得注意的是新版 tokenizer(與 Opus 4.7 同款的更新),同樣一段文字視內容類型(程式碼、中文、表格)token 數可能變為原本的 1.0 到 1.35 倍,也就是最多增加 35%。這跟我們在《Claude API 費用完整解析》 裡拆解過的 Opus 4.7 隱性成本邏輯完全一樣:牌價便宜,實際帳單不一定便宜,要看你的工作負載是文字密集還是程式碼密集。
換算下來,一個原本用 Sonnet 4.6 跑月成本 NT$ 30,000 的 agent 工作負載,換到 Sonnet 5 早鳥定價可能因為單價下降而省錢。但如果內容類型偏向 tokenizer 吃虧的類型(例如大量中文或結構化資料),省下來的部分會被多算的 token 數吃掉一部分。建議先用小流量測試實際 token 消耗量,再決定是否全面切換。
Sonnet 5、Opus 4.8、Sonnet 4.6:企業現在該選哪個
三代模型現在同時在架上,選型邏輯可以簡化成三個問題:
- 工作負載是不是 agentic(自主執行多步驟任務)? 是的話 Sonnet 5 是目前性價比最高的選項,不需要為了自主能力硬上 Opus 4.8
- 是不是需要極致推理深度或超長 context 的任務? 這類場景 Opus 4.8 仍值得保留,Sonnet 5 逼近但沒有完全取代
- 是不是低延遲、大量、簡單任務? Haiku 4.5 的定位沒有變,Sonnet 5 不是用來取代 Haiku 的成本結構
如果團隊已經有跨模型分工的架構,Sonnet 5 上線後最直接的動作是把原本卡在「Sonnet 4.6 不夠、Opus 4.8 太貴」中間地帶的工作負載,重新測試一次。
企業採購重點:現在該做什麼
Sonnet 5 剛上線,企業評估升級前有三件事值得先確認:
- 鎖定早鳥定價視窗:8/31 前完成評估與切換,能用到 Input $2/Output $10 的價格
- 實測 tokenizer 對帳單的影響:不要只看牌價下降就直接全量切換,先跑一週小流量比對實際 token 消耗
- 確認採購路徑:台灣公司可透過 Anthropic 官網直購、Amazon Bedrock,或透過代理商處理發票與在地付款問題,詳見《台灣公司怎麼買 Claude API》
企業導入 Claude API 時最常卡的不是模型能力,是「選型決策誰來做、成本怎麼追、發票怎麼開」這三件行政與技術交叉的事。勤英科技作為 AWS 與 Google Cloud 的雲端代理商,同時協助企業評估 Claude API 在 Bedrock 上的部署與帳務整合。
想評估 Sonnet 5 是否值得切換?立即聯繫我們,安排你的工作負載成本比對 →
結論
Sonnet 5 是 Anthropic 這輪發布裡最務實的一次更新:不是堆規格,是把過去 Opus 級別才有的 agentic 能力,用 Sonnet 的價格做出來。早鳥定價視窗只有兩個月,加上 tokenizer 更新這個隱性變數,企業評估升級時間點會比看牌價複雜一點。
先確認你的工作負載類型(agentic vs 一般任務)、實測 token 消耗量,再決定要不要在 8/31 前完成切換,是目前最務實的做法。
想知道 Sonnet 5 對你目前的 Claude API 帳單有什麼影響?預約評估 →



