
市場原本還在猜 Gemini 3.5 Pro 與 Claude Sonnet 4.8 誰會先登場,結果搶得頭香的卻是 Claude Opus 4.8。Anthropic 在 2026/5/28 正式推出這款新旗艦,定價維持與前代一致,但在判斷力、誠實度與 Agent 任務的實際表現上,都做了一輪扎實的升級。對正在評估導入 AI Agent 的企業而言,這次更新有幾個值得特別留意的訊號,以下從 EgentHub 顧問的角度逐一拆解。
目錄
- 三句話看懂 Claude Opus 4.8
- 誠實度提升約 4 倍
- Effort 控制:由你決定 AI 思考多深
- Dynamic Workflows:把單一 Agent 變成數位團隊
- Mythos 預告:旗艦之上還有旗艦
- 組織要跟上模型迭代的節奏
三句話看懂 Claude Opus 4.8
- 誠實度顯著提升:自我檢核能力強化後,Opus 4.8 讓自己寫的程式碼瑕疵被漏看的機率,相較前代下降約 4 倍。
- Effort 調節權回到使用者手上:claude.ai 與 Cowork 介面新增 high / extra / max 三段 effort,由你決定 Claude 投入多少思考深度。
- Dynamic Workflows 開放預覽:Claude Code 能一次調度數百個平行 subagent,獨力完成跨數十萬行的程式碼遷移。
學會說「不確定」:誠實度提升約 4 倍
幻覺一直是使用 AI 模型時最棘手的問題,而 Opus 4.8 給出的解法走了一條不同的路:與其逼著模型不要犯錯,不如讓它學會自我懷疑,在做不到或沒把握時主動承認。
以往模型常見的毛病,是在證據不足時仍宣稱一切順利。這次 Anthropic 把改善這點列為優先,讓 Opus 4.8 會在執行過程中主動標記出不確定性較高的環節,盡量避免給出未經驗證的回答。實測數據顯示,相較 Opus 4.7,它漏看自己程式碼瑕疵的機率降低了約 4 倍。
此外,4.7 那種註解過度冗長、工具呼叫不夠俐落的老問題也獲得修正。最終結果是,Opus 4.8 在 CursorBench 上的每一個 effort 等級都勝過前代,工具呼叫的步驟變少,任務完成度反而更高。
這一點對企業用戶其實格外重要:一個懂得質疑自己的 AI,遠比一個自我感覺良好的 AI,更適合擺進正式的生產環境。

Effort 控制:由你決定 AI 思考多深
另一個體感最明顯的改動,落在 claude.ai 與 Cowork 介面新增的 Effort 控制上。
過往的旗艦模型總是火力全開,品質固然好,但成本高、回應也慢。Opus 4.8 則把主導權還給使用者:預設停在 high effort,再依任務需要往上切到 extra 或 max。
- High(預設):應付多數日常工作綽綽有餘,token 用量與 Opus 4.7 的預設值相當。
- Extra(在 Claude Code 中對應 xhigh):適合高難度任務與長時間的非同步流程。
- Max:讓模型多燒一些 token,換取更高品質的答案。
對企業來說,這等於多了一個彈性的成本管理槓桿:同一個模型就能依場景調整成本曲線,寫摘要時走 high、做深度分析時切到 max,不必再為了省錢而退而求其次改用較弱的模型。這個設計也與 Gemini 3.1 Pro 的 thinking level、GPT 5.5 Pro 的 Reasoning Effort 相互呼應。

Dynamic Workflows:把單一 Agent 變成數位團隊
如果說搭配 Opus 4.7 的 Claude Code 像一位會獨立思考的工程師,那麼 Opus 4.8 加上 Dynamic Workflows,就等於替他配上一支隨時待命、可彈性調度的數位團隊。
這項功能目前以研究預覽的形式,開放給 Claude Code 的 Enterprise、Team 與 Max 方案,運作重點如下:
- 由 Claude 先自行擬定執行計畫。
- 在同一個 session 內同時啟動數百個平行 subagent。
- 各 subagent 完成後,再由主 Claude 統一驗證輸出,才回報給使用者。
- 在 Opus 4.8 的加持下,subagent 能持續運作更長時間而不中斷。
Anthropic 在發布文裡給的例子相當具體:Claude Code 搭配 Opus 4.8,能從啟動一路做到合併,獨力完成橫跨數十萬行的程式碼遷移,並以既有的測試套件作為把關品質的門檻。
Mythos 預告:旗艦之上還有旗艦
至於前陣子討論度很高的 Claude Mythos 模型,Anthropic 這次也透露了下一步的規劃:
現階段 Mythos 僅提供給 Project Glasswing 中少數從事網路安全研究的組織,理由是這個等級的模型必須先具備更強的網路安全防護機制,才適合對外開放。Anthropic 表示相關防護正在加速推進,預計幾週內就會讓 Mythos 級模型正式上線。
值得一提的是,Anthropic 也指出,Opus 4.8 在親社會性與抑制惡意行為的表現上,已經逼近 Mythos Preview 的水準。
組織要跟上模型迭代的節奏
從 Opus 4.8 這波更新可以清楚看出,各家 AI 模型廠商的競爭主軸,正逐漸從單純比拼能力轉向「可靠度大戰」。在這個 Agent 時代,企業真正要解的題目,是如何在一個有彈性的平台上,自由切換最適合的模型與工作流程。
EgentHub 提供的正是這層底層基礎:平台上的多模型彈性配置、細緻的 RBAC 權限管理、深度的 MCP 串接能力,再加上能陪企業走完整段導入旅程的 AI 顧問。當 Opus 4.8 這類新旗艦推出時,使用 EgentHub 的企業可以第一時間把它接進既有的 Agent,隨時升級能力,而不必被綁定在單一供應商身上。
模型每隔幾個月就會迭代一次,組織真正該做的,是建立一套能夠持續吸收這些更新的內部架構——讓每一次模型升級,都能順勢轉化為自身的競爭力。