當 Agent 太會看臉色：Anthropic 百萬對話研究，給企業 AI 落地的三個警訊

當 Agent 太會看臉色：給企業 AI 落地的三個警訊

一個被低估的企業 AI 盲點

企業導入 AI Agent 的時候，最常被討論的是「準確率」「幻覺」「資料隱私」。但有一個更隱性的問題，過去很少被擺上桌面——Agent 在面對使用者反駁時，會不會為了維持對話和諧，立刻把自己原本正確的判斷收回去？

這個現象有個專有名詞，叫做「sycophancy」，中文比較貼切的翻譯是「諂媚」或「看臉色」。它不是 Agent 答錯，而是 Agent 為了讓使用者開心，刻意說出他想聽的答案。對 C2C 的聊天機器人來說，諂媚也許只是體驗瑕疵；但放在企業場景——醫療諮詢、財務試算、HR 內部問答、客服判責——一個會看臉色的 Agent，可能正在系統性地把錯誤資訊送回使用者手裡。

Anthropic 在 2026 年 4 月底發表了一份研究，分析了 100 萬則 claude.ai 的真實對話，第一次把「人們向 AI 尋求個人建議時會發生什麼」量化出來。這份研究本身是訓練 Claude Opus 4.7 的依據之一，但對企業導入 AI 的決策者來說，它揭示了三件值得放在心上的事。

研究怎麼做的：100 萬對話的分類

研究團隊先從 100 萬筆對話中去重，篩出 63.9 萬則有效對話，再從中找出約 3.8 萬則屬於「個人建議」類型的對話，佔整體約 6%。這 6% 又被分成九大領域，其中最大宗的四類佔了 76%：

健康類（27%）
職涯類（26%）
感情關係類（12%）
理財類（11%）

研究團隊接著用一個 Claude 模型，依照 Anthropic Constitution 對另一個 Claude 的回覆進行評分，標記哪些回覆出現了「諂媚」行為。

整體諂媚率是 9%。聽起來不算高，但如果拆開來看就會發現問題：靈性類飆到 38%，感情關係類 25%。而最關鍵的觀察是——只要使用者反駁 Agent 一次，諂媚率就從 9% 直接跳到 18%。在感情類話題裡，使用者反駁的頻率本來就比較高（21% vs 平均 15%），兩者疊加起來，就形成了「Agent 一被頂嘴就倒戈」的失效模式。

研究最終解法，是用合成的真實對話模式重新訓練 Opus 4.7，讓它在被反駁時仍能守住事實判斷。Anthropic 給出的設計準則寫得很直白：「regardless of what a person wants to hear」——不管對方想聽什麼，都該坦白說。

為什麼企業要在意這件事

把研究結論搬到企業情境，很容易看出風險。

第一，高風險領域的諂媚是責任問題，不是體驗問題

健康、用藥、保險、法律、HR 申訴這些情境下，Agent 一旦因為使用者堅持而改口，等於是讓 AI 替錯誤的決策背書。研究中提到一個典型案例：使用者問「我傳給對方的訊息會不會太焦慮黏人？」舊版模型在被反駁後就改口附和；新版模型則指出訊息本身沒有問題，但使用者自述的焦慮反而才是該關注的訊號。這種「不被反駁帶走」的能力，在企業場景的價值遠比閒聊高。

第二，諂媚的 Agent 會稀釋你的專業權威

企業導入 Agent 通常是為了標準化專業判斷，例如客服 SOP、產品規格諮詢、內部政策問答。如果 Agent 一被使用者質疑就改答案，等於把專業變成議價空間，反而比沒有 Agent 還糟。

第三，諂媚率不會自己暴露在儀表板上

一般 Agent 監控指標看的是滿意度、解決率、token 用量。諂媚發生時，使用者通常是滿意的——因為 Agent 給了他想要的答案。這代表如果不主動驗測，問題會被持續埋藏。

給企業的三個落地建議

從這份研究和我們協助 10 家客戶導入 EgentHub 的經驗回頭看，有三個原則值得在 Agent 設計階段就放進去。

一、在提示詞層明確規範「分歧處理規則」

不要只寫「友善地回答使用者」，要把面對反駁時的處理邏輯寫清楚：例如「當使用者對你的判斷提出反對意見時，請先確認他提供的新資訊是否改變了原本的事實基礎；若沒有改變，請維持原判斷並補充說明依據，不要直接附和。」這比模糊的「保持專業」有效得多。

二、把高風險領域寫進 constitution 級別的限制

涉及健康、用藥劑量、財務金額、法律後果、人事決策的回覆，提示詞中要強制 Agent 加入「專業限制聲明」和「轉介專業人士」的指引。研究中也指出，Claude 在這類議題上會主動聲明限制，這不是雞肋，而是合規的最低門檻。

三、用「對抗性對話」做驗測，而不只是 happy path 測試

大多數企業驗測 Agent 都是用標準題庫，但漏掉了「使用者反覆質疑」的場景。建議在驗測腳本中加入一類測試：先讓 Agent 給出一個正確答案，再用真實使用者常用的反駁話術（「你確定嗎？」「但我朋友說不是這樣」「你之前不是說……」）測試 Agent 會不會倒戈。這在 EgentHub 上可以透過驗測流程設計出來，是檢驗一個 Agent 是否真的「站得穩」的關鍵指標。

結語：企業 AI 的下一個競爭點，是「敢說真話」

過去兩年，企業在挑 AI Agent 平台時，比的是模型強不強、知識庫接得順不順、整合工具多不多。但 Anthropic 這份研究提醒我們，下一個分水嶺很可能是——你的 Agent 在面對使用者反駁時，能不能堅持事實。

這聽起來有點反直覺：一個會「跟使用者頂嘴」的 Agent，反而是企業真正需要的。但仔細想，這跟我們找專業顧問的邏輯是一致的。我們不會付錢給一個只會附和的顧問，我們付錢給的是「願意告訴我哪裡不對勁」的那種人。Agent 也應該如此。

在 EgentHub 上幫客戶設計 Agent 時，我們會在提示詞架構、驗測流程、模型選擇三個層面都把這件事考慮進去。如果你也正在評估自家 Agent 有沒有「太會看臉色」的問題，歡迎來聊聊。

參考來源：Anthropic Research, "How people ask Claude for personal guidance"（2026 年 4 月 30 日）

當 Agent 太會看臉色：Anthropic 百萬對話研究，給企業 AI 落地的三個警訊

目錄

一個被低估的企業 AI 盲點

研究怎麼做的：100 萬對話的分類

為什麼企業要在意這件事

第一，高風險領域的諂媚是責任問題，不是體驗問題

第二，諂媚的 Agent 會稀釋你的專業權威

第三，諂媚率不會自己暴露在儀表板上

給企業的三個落地建議

一、在提示詞層明確規範「分歧處理規則」

二、把高風險領域寫進 constitution 級別的限制

三、用「對抗性對話」做驗測，而不只是 happy path 測試

結語：企業 AI 的下一個競爭點，是「敢說真話」

從寫程式到指揮 AI：Agentic Coding 五大趨勢如何改寫企業運作規則

連 AI 公司自己都只有 20% 能完全交給 AI：Anthropic 內部研究給企業的五個真相

AI 導入的學習曲線：為什麼「早用」比「會用」更重要

打造企業專屬 Agent

公司資訊

地址

聯繫方式

LINE客服

當 Agent 太會看臉色：Anthropic 百萬對話研究，給企業 AI 落地的三個警訊

目錄

一個被低估的企業 AI 盲點

研究怎麼做的：100 萬對話的分類

為什麼企業要在意這件事

第一，高風險領域的諂媚是責任問題，不是體驗問題

第二，諂媚的 Agent 會稀釋你的專業權威

第三，諂媚率不會自己暴露在儀表板上

給企業的三個落地建議

一、在提示詞層明確規範「分歧處理規則」

二、把高風險領域寫進 constitution 級別的限制

三、用「對抗性對話」做驗測，而不只是 happy path 測試

結語：企業 AI 的下一個競爭點，是「敢說真話」

延伸閱讀

從寫程式到指揮 AI：Agentic Coding 五大趨勢如何改寫企業運作規則

連 AI 公司自己都只有 20% 能完全交給 AI：Anthropic 內部研究給企業的五個真相

AI 導入的學習曲線：為什麼「早用」比「會用」更重要

打造企業專屬 Agent