
目錄
- 當 AI 公司把鏡頭對準自己
- 數據全貌:60% 使用率、50% 生產力提升、27% 全新工作
- 第一個真相:0-20% 完全委派,人在迴圈仍是常態
- 第二個真相:全端化正在發生
- 第三個真相:監督的悖論
- 第四個真相:社交動態的隱性代價
- 第五個真相:功能開發暴增,但 craft 的拉鋸不會消失
- 對企業導入 AI 的啟示
當 AI 公司把鏡頭對準自己
如果要找一個最適合測試「AI 到底能改變多少工作」的實驗場域,答案大概就是 AI 公司本身。
Anthropic 對內部 132 名工程師與研究員進行了問卷調查,搭配 53 場深度訪談,外加 200,000 筆 Claude Code 的內部使用數據分析,產出了一份關於「AI 如何改變 AI 公司自己的工作方式」的研究。這不是客戶案例,不是產品行銷,而是一家走在技術前沿的公司,拿自己當研究對象,坦承地記錄下 AI 協作的實際樣貌——包括成效,也包括代價。
這份研究的價值,不在於 Anthropic 有多特殊,而在於它是一個高密度的預覽:當 AI 工具的能力持續提升,當組織的使用滲透率持續攀高,每一家企業都會走到類似的十字路口。差別只在時間早晚。
數據全貌:60% 使用率、50% 生產力提升、27% 全新工作
先看幾個核心數字。
Anthropic 員工自述,AI 已經佔據他們 60% 的工作時間,自評生產力提升 50%。一年前,這兩個數字分別是 28% 和 20%。這個成長幅度說明的不只是工具進步,更是使用習慣的深度滲透——從「偶爾用一下」變成「幾乎離不開」。
但最值得注意的是另一個數字:27% 的 AI 輔助工作,是原本不會做的事。這些不是核心任務的加速,而是過去被歸類為「有做更好、沒做也行」的項目——例如修復長期被忽略的小問題(engineering papercut)、做一個內部用的小工具、幫文件補上一直欠缺的圖表。AI 把這些 nice-to-have 的工作拉進了 feasible 的範圍。
從任務類型的變化也能看出結構性的轉移:功能開發佔比從 14% 飆升到 37%,設計規劃從 1% 到 10%。工程師花在寫 boilerplate 和 debug 上的時間被壓縮,騰出來的空間被重新分配到更高層次的工作。
第一個真相:0-20% 完全委派,人在迴圈仍是常態
這可能是整份研究中,對企業決策者最重要的一個數字。
即使在 Anthropic 內部——一個由頂尖 AI 研究員和工程師組成、使用自家最先進工具的環境——只有 0-20% 的工作可以「完全委派」給 AI。絕大多數任務仍然需要人在迴圈中:審查、修正、補充脈絡、做最終判斷。
這個數字直接挑戰了兩種常見的極端敘事。一種是「AI 即將取代所有人」的焦慮,另一種是「讓 AI 全自動跑就好」的天真。現實是,AI 是一個極強的協作者,但不是一個可靠的全權代理。六個月前,Claude Code 平均執行 10 次自主操作就需要人工介入;研究時已經提升到 20 次。進步顯著,但仍然是「20 步就要人看一眼」的節奏。
對企業來說,這個發現的實務意義很明確:導入 AI 不是設計一個無人流程,而是重新設計一個人機協作的流程。把人從流程中完全拿掉,在現階段不只不切實際,更可能產生品質風險。
第二個真相:全端化正在發生
研究中一個引人注意的現象是:工程師的能力邊界正在被 AI 重新畫線。
後端工程師開始自己做 UI。研究員開始自己做資料視覺化。過去需要跨團隊協作才能完成的事,現在一個人加上 AI 就能搞定。這不是因為他們突然學會了前端框架,而是 AI 填補了技能缺口,讓每個人都能在自己的專業之外多走幾步。
這對企業的含義是雙面的。
好的一面:組織的執行速度會加快,跨部門的溝通成本會下降。一個業務人員如果能用 AI 自己跑出初步的數據分析,就不需要等分析團隊排期。一個產品經理如果能用 AI 做出可用的原型,就能更早拿到使用者回饋。
但另一面也值得警惕:當每個人都能做「差不多」的事,專業深度的價值可能被稀釋。一個後端工程師用 AI 做出的 UI 能用,但不一定符合設計系統的規範、不一定考慮了無障礙設計、不一定經得起邊界情境的測試。全端化帶來的是效率,但品質的把關仍然需要專業判斷。
第三個真相:監督的悖論
這是整份研究中最值得企業管理者深思的洞察。
有效使用 AI 需要監督能力——你要能看出 AI 的輸出哪裡有問題、哪裡偏離了需求、哪裡的品質不夠。但過度依賴 AI,恰恰會讓這種監督能力退化。這就是研究中所稱的「監督的悖論」(the paradox of oversight)。
具體來說:當工程師習慣讓 AI 寫程式碼,自己只做 review,久了之後,他們對程式碼的直覺判斷力會下降。他們可能仍然看得出明顯的錯誤,但對於結構性的問題、對於「這段程式碼雖然能跑但設計方向不對」這類需要深度理解的判斷,敏銳度會逐漸流失。
這個悖論在企業情境中更為嚴峻。Anthropic 的工程師至少有深厚的技術底子作為緩衝;但在一般企業,如果一個剛入行的員工從第一天就依賴 AI 完成工作,他可能從來沒有機會建立起獨立判斷的能力。而這個能力,恰恰是他未來監督 AI 的前提。
企業不能只培訓「如何使用 AI」,還必須同時維護「沒有 AI 時也能判斷的能力」。 這聽起來矛盾,但卻是 AI 時代人才養成的核心命題。在 EgentHub 的人才養成階梯中,我們一直強調:提示詞工程只是起點,真正的目標是培養能夠判斷 AI 產出品質、設計 AI 工作流程、在關鍵節點做出人類決策的 AI 產品經理和 AI 策略人才。
第四個真相:社交動態的隱性代價
研究揭露了一個容易被忽略的副作用:AI 正在改變同事之間的互動模式。
在 Anthropic 內部,Claude 已經成為工程師「第一個提問對象」。遇到問題,先問 AI,而不是走到隔壁同事的桌前。這在效率上是合理的——AI 不需要等排期、不需要顧慮打擾別人、回應速度更快。但研究團隊觀察到,這也帶來了意想不到的影響:同事之間的非正式協作減少了,資深員工指導新人的機會變少了。
知識傳遞在組織中本來就高度依賴非正式的互動——走廊上的閒聊、午餐時的討論、code review 時的來回對話。當 AI 成為預設的知識來源,這些互動的頻率和深度都會下降。長期來看,這可能影響組織的知識厚度和團隊凝聚力。
對企業來說,這不代表要限制 AI 的使用,而是要有意識地維護人際知識傳遞的管道。例如:保留 mentor 制度、設計需要跨組協作的任務、在 AI 輔助的工作流程中嵌入「人與人討論」的節點。技術可以加速個人的產出,但組織的韌性仍然建立在人與人的連結上。
第五個真相:功能開發暴增,但 craft 的拉鋸不會消失
研究中有一個微妙但重要的觀察:Anthropic 的工程師對 AI 的態度並非一面倒地擁抱,而是分裂為兩派。
一派擁抱高效產出,把 AI 視為生產力的倍增器,享受「過去要三天的事現在三小時搞定」的快感。另一派則對手工寫程式的 craft 感到懷念,擔心 AI 會讓工程變成「組裝」而非「創作」,品質感和專業尊嚴都在流失。
這個分裂不是 Anthropic 獨有的。任何導入 AI 的組織都會遇到類似的張力。它反映的是一個更深層的問題:當 AI 把執行的門檻大幅降低,「做出來」和「做得好」之間的差距會被壓縮還是放大?
我們在協助客戶導入 EgentHub 的過程中看到,這個問題沒有標準答案,但有一個原則:讓 AI 處理重複性的執行,把人的精力留給需要判斷、創意和品質把關的環節。關鍵不是選邊站,而是在效率和品質之間找到屬於自己組織的平衡點。
對企業導入 AI 的啟示
把 Anthropic 的內部觀察帶回一般企業的脈絡,有幾個具體的行動建議。
一、以「人機協作流程」取代「AI 自動化流程」
0-20% 的完全委派率告訴我們,現階段 AI 導入的目標不該是「去掉人」,而是「讓人做更有價值的事」。設計 AI SOP 時,明確標註哪些環節由 AI 執行、哪些環節需要人類審查、哪些環節需要人類決策。
二、善用全端化紅利,但建立品質護欄
AI 讓每個人都能跨界,這是好事。但企業需要建立對應的品質檢查機制——AI 產出的內容、數據、程式碼,在進入下一個環節之前,是否經過具備專業判斷力的人審核?
三、把「監督能力」列為 AI 時代的核心職能
不要只教員工怎麼用 AI,也要持續培養他們在沒有 AI 的情況下獨立判斷的能力。特別是新進員工,在依賴 AI 之前,應該先建立足夠的領域知識基礎。
四、主動維護組織的社交知識網絡
導入 AI 的同時,有意識地保留和設計人與人互動的機會。不是因為懷舊,而是因為組織的隱性知識——那些不在文件裡、只存在於人與人對話中的判斷邏輯和經驗直覺——仍然是 AI 無法替代的。
Anthropic 這份研究最有價值的地方,不是那些令人振奮的生產力數字,而是它毫不迴避地呈現了 AI 深度滲透之後的結構性挑戰。連最懂 AI 的公司都在面對監督的悖論、社交動態的轉變、craft 與效率的拉鋸——這些問題不會因為技術進步就自動消失。
對企業來說,這反而是一個好消息:它意味著 AI 導入的競爭優勢,不在於誰先買了什麼工具,而在於誰更早想清楚人與 AI 的協作方式、誰更認真地投資在人才的判斷能力上、誰更務實地把 AI 嵌入既有的工作流程而非天真地期待全面替換。這些,才是真正的差異化所在。