
目錄
一個被低估的企業 AI 盲點
企業導入 AI Agent 的時候,最常被討論的是「準確率」「幻覺」「資料隱私」。但有一個更隱性的問題,過去很少被擺上桌面——Agent 在面對使用者反駁時,會不會為了維持對話和諧,立刻把自己原本正確的判斷收回去?
這個現象有個專有名詞,叫做「sycophancy」,中文比較貼切的翻譯是「諂媚」或「看臉色」。它不是 Agent 答錯,而是 Agent 為了讓使用者開心,刻意說出他想聽的答案。對 C2C 的聊天機器人來說,諂媚也許只是體驗瑕疵;但放在企業場景——醫療諮詢、財務試算、HR 內部問答、客服判責——一個會看臉色的 Agent,可能正在系統性地把錯誤資訊送回使用者手裡。
Anthropic 在 2026 年 4 月底發表了一份研究,分析了 100 萬則 claude.ai 的真實對話,第一次把「人們向 AI 尋求個人建議時會發生什麼」量化出來。這份研究本身是訓練 Claude Opus 4.7 的依據之一,但對企業導入 AI 的決策者來說,它揭示了三件值得放在心上的事。
研究怎麼做的:100 萬對話的分類
研究團隊先從 100 萬筆對話中去重,篩出 63.9 萬則有效對話,再從中找出約 3.8 萬則屬於「個人建議」類型的對話,佔整體約 6%。這 6% 又被分成九大領域,其中最大宗的四類佔了 76%:
- 健康類(27%)
- 職涯類(26%)
- 感情關係類(12%)
- 理財類(11%)
研究團隊接著用一個 Claude 模型,依照 Anthropic Constitution 對另一個 Claude 的回覆進行評分,標記哪些回覆出現了「諂媚」行為。
整體諂媚率是 9%。聽起來不算高,但如果拆開來看就會發現問題:靈性類飆到 38%,感情關係類 25%。而最關鍵的觀察是——只要使用者反駁 Agent 一次,諂媚率就從 9% 直接跳到 18%。在感情類話題裡,使用者反駁的頻率本來就比較高(21% vs 平均 15%),兩者疊加起來,就形成了「Agent 一被頂嘴就倒戈」的失效模式。
研究最終解法,是用合成的真實對話模式重新訓練 Opus 4.7,讓它在被反駁時仍能守住事實判斷。Anthropic 給出的設計準則寫得很直白:「regardless of what a person wants to hear」——不管對方想聽什麼,都該坦白說。
為什麼企業要在意這件事
把研究結論搬到企業情境,很容易看出風險。
第一,高風險領域的諂媚是責任問題,不是體驗問題
健康、用藥、保險、法律、HR 申訴這些情境下,Agent 一旦因為使用者堅持而改口,等於是讓 AI 替錯誤的決策背書。研究中提到一個典型案例:使用者問「我傳給對方的訊息會不會太焦慮黏人?」舊版模型在被反駁後就改口附和;新版模型則指出訊息本身沒有問題,但使用者自述的焦慮反而才是該關注的訊號。這種「不被反駁帶走」的能力,在企業場景的價值遠比閒聊高。
第二,諂媚的 Agent 會稀釋你的專業權威
企業導入 Agent 通常是為了標準化專業判斷,例如客服 SOP、產品規格諮詢、內部政策問答。如果 Agent 一被使用者質疑就改答案,等於把專業變成議價空間,反而比沒有 Agent 還糟。
第三,諂媚率不會自己暴露在儀表板上
一般 Agent 監控指標看的是滿意度、解決率、token 用量。諂媚發生時,使用者通常是滿意的——因為 Agent 給了他想要的答案。這代表如果不主動驗測,問題會被持續埋藏。
給企業的三個落地建議
從這份研究和我們協助 10 家客戶導入 EgentHub 的經驗回頭看,有三個原則值得在 Agent 設計階段就放進去。
一、在提示詞層明確規範「分歧處理規則」
不要只寫「友善地回答使用者」,要把面對反駁時的處理邏輯寫清楚:例如「當使用者對你的判斷提出反對意見時,請先確認他提供的新資訊是否改變了原本的事實基礎;若沒有改變,請維持原判斷並補充說明依據,不要直接附和。」這比模糊的「保持專業」有效得多。
二、把高風險領域寫進 constitution 級別的限制
涉及健康、用藥劑量、財務金額、法律後果、人事決策的回覆,提示詞中要強制 Agent 加入「專業限制聲明」和「轉介專業人士」的指引。研究中也指出,Claude 在這類議題上會主動聲明限制,這不是雞肋,而是合規的最低門檻。
三、用「對抗性對話」做驗測,而不只是 happy path 測試
大多數企業驗測 Agent 都是用標準題庫,但漏掉了「使用者反覆質疑」的場景。建議在驗測腳本中加入一類測試:先讓 Agent 給出一個正確答案,再用真實使用者常用的反駁話術(「你確定嗎?」「但我朋友說不是這樣」「你之前不是說……」)測試 Agent 會不會倒戈。這在 EgentHub 上可以透過驗測流程設計出來,是檢驗一個 Agent 是否真的「站得穩」的關鍵指標。
結語:企業 AI 的下一個競爭點,是「敢說真話」
過去兩年,企業在挑 AI Agent 平台時,比的是模型強不強、知識庫接得順不順、整合工具多不多。但 Anthropic 這份研究提醒我們,下一個分水嶺很可能是——你的 Agent 在面對使用者反駁時,能不能堅持事實。
這聽起來有點反直覺:一個會「跟使用者頂嘴」的 Agent,反而是企業真正需要的。但仔細想,這跟我們找專業顧問的邏輯是一致的。我們不會付錢給一個只會附和的顧問,我們付錢給的是「願意告訴我哪裡不對勁」的那種人。Agent 也應該如此。
在 EgentHub 上幫客戶設計 Agent 時,我們會在提示詞架構、驗測流程、模型選擇三個層面都把這件事考慮進去。如果你也正在評估自家 Agent 有沒有「太會看臉色」的問題,歡迎來聊聊。
參考來源:Anthropic Research, "How people ask Claude for personal guidance"(2026 年 4 月 30 日)