
目錄
- Token 用量一年成長 7 倍
- 基礎建設:第 8 代 TPU 一分為二
- 新模型:Gemini 3.5 Flash 與 Gemini Omni
- Agent 全面進場
- SynthID 拉出跨廠商陣線
- 結語:模型像水電,Agent 才是新入口
5/20 凌晨,Sundar Pichai 一站上 Shoreline Amphitheatre 的舞台,開場第一句話就替今年的 I/O 定了調:Agentic Gemini Era。
過去一年模型競賽從沒停過,但看完整場 I/O 會發現,Google 這次想做的不只是把模型變更聰明,而是把 Search、Gmail、Maps、YouTube、Docs,一路到眼鏡、Android、Chrome 這些你早就熟悉的入口,全部重新包裝、串連到同一個核心——Agent。每個入口背後,都被塞進一個 24 小時待命的 AI Agent。
懶得看完整場演講的話,這份 EgentHub 整理的重點筆記大概 10 分鐘就能讀完,幫你抓住這次 I/O 最該知道的幾件事。
Token 用量一年成長 7 倍
要判斷 AI 被採用的速度,最直觀的指標就是 token 處理量。Google 公布的數字是:相較一年前,整整成長了 7 倍。
- 2024 年 5 月:每月 9.7 兆 tokens
- 2025 年 5 月:每月 480 兆 tokens
- 2026 年 5 月:每月 3200 兆 tokens,年增 7 倍
其他幾項數據也呼應了同樣的趨勢:
- 每月有 850 萬名開發者在 Google 模型上打造新應用
- 模型 API 每分鐘約處理 190 億 tokens
- 過去 12 個月,有 375 家 Google Cloud 客戶各自處理超過 1 兆 tokens
- Gemini App 月活躍用戶從 4 億跳到 9 億;AI Mode 上線一年就衝上 10 億 MAU
- 13 個 Google 產品突破 10 億用戶,其中 5 個突破 30 億
換句話說,AI 早就過了「普及與否」的階段,現在已經進入高速成長期。
基礎建設:第 8 代 TPU 一分為二
Google 這次公布了第 8 代 TPU,首度走向「訓練/推論雙晶片」的架構:
- TPU 8t(Training):原生算力接近前一代的 3 倍,搭配 JAX 與 Pathways,訓練可以橫跨多個資料中心,橫向擴展到超過 100 萬顆 TPU 一起運作,把訓練週期從「月」壓縮到「週」。
- TPU 8i(Inference):專為推論而設計,每一步都把延遲壓到最低。
兩顆晶片合起來,效能提升 2 倍。
值得一提的是,Google 今年的資本支出預估落在 1,800–1,900 億美元,將近 2022 年(310 億)的 6 倍——整條 AI 算力供應鏈,正在被重新配置。
新模型:Gemini 3.5 Flash 與 Gemini Omni
這次 Google 一口氣端出兩款模型,一個主打實用、一個指向未來。兩款的完整拆解,可以參考 EgentHub 另外兩篇文章。
Gemini 3.5 Flash:又快又便宜的前沿模型
- 在多數 benchmark 上勝過 Gemini 3.1 Pro
- 輸出速度是其他前沿模型的 4 倍
- 價格不到競品的一半
Pichai 在台上直接算了一筆帳:一家每天處理 1 兆 tokens 的公司,如果把 80% 的工作負載切到 3.5 Flash,一年可以省下超過 10 億美元。
前沿等級的智慧、高速、低價,這三件事過去通常只能挑兩個;Gemini 3.5 Flash 把三者一起端上桌,等於對市場投下一顆震撼彈。而效能更強的 Gemini 3.5 Pro,則預計下個月推出。
Gemini Omni:任意輸入到任意輸出
Omni 是 Google 新一代的多模態模型家族,能從任意輸入生成任意輸出。首發的 Gemini Omni Flash 先支援影片輸出,之後會擴展到圖像與文字,把 Gemini 長期以來的多模態優勢再往前拉開一段差距。Google Flow、YouTube Shorts、Gemini App 即日起開放試用。
Agent 全面進場
這次 I/O 真正的重點,是 Google 把 Agent 從「開發者的玩具」推進到「每個人都該有的 24 小時助理」。幾項關鍵產品如下:
Gemini Spark:你的個人 AI 代理
- 跑在 Google Cloud 上,不開筆電也能持續替你工作
- 由 Gemini 3.5 + Antigravity 框架驅動,能執行長時間任務
- 先整合 Google 自家工具,未來再透過 MCP 串接第三方
- 在 Android 上,會用新介面 Android Halo 顯示 Agent 進度
- 預計夏天進駐 Chrome,變成 agentic browser
目前僅先在美國開放,下週起對美國的 Google AI Ultra 訂閱戶開放 Beta。
Antigravity 2.0:從 IDE 變成 Agent 編排平台
Antigravity 從原本 agent-first 的開發環境,升級成可以同時管理多個自主 Agent 的桌面平台。對企業 IT 來說,這等於 Google 把內部那套開發體系,整套對外開放。
Search:正式進入 Agentic 時代
- Information Agents:在背景 24/7 盯著你關心的資訊,找到了再通知你
- Generative UI:Search 會即時替你的問題生成客製化的動態介面與互動視覺
- 個人化:你可以在 Search 裡建立個人化儀表板、追蹤器,像替自己做了一個迷你 App
其他一次亮相的 Agent
- Daily Brief:整合 Gmail、行事曆、Tasks,產出早晨摘要,還會排序並建議下一步
- Google Flow:影片創作 Agent,支援 vibe code 自訂工具
- Google Pics:基於 Nano Banana 的圖像編輯,把每個元素當成獨立物件處理
- Ask YouTube/Docs Live/Ask Maps:把語音對話式 AI 帶進各個產品
- 智慧眼鏡:音訊版今年秋季先上,顯示版本隨後跟進
- Gemini for Science:串接 30 多個生命科學資料庫的 Agent 平台
SynthID 拉出跨廠商陣線
這次還有一個值得單獨拉出來講的進展:SynthID 浮水印。OpenAI、Kakao、ElevenLabs 陸續加入後,AI 內容的來源追溯總算成為跨廠商標準;Google 同時也把 Content Credentials 驗證整合進 Search 與 Chrome。
對企業而言,這其實是 AI 治理與合規的伏筆:AI 產出的內容能不能被驗證來源,未來兩年很可能變成法遵上的硬性要求。
結語:模型像水電,Agent 才是新入口
整場演講看下來,這次 I/O 其實只在講一件事:AI 的競爭主軸,正慢慢往「使用體驗」傾斜。
模型本身當然還是關鍵,但它越來越像水電——必要、基礎,卻不再是差異化的來源。真正決定使用者每天打開哪個產品、企業每天仰賴哪個工具的,是 Agent 能不能貼著企業需求走、能不能把事情在同一個環境裡完成。
也正因如此,I/O 2026 更像整個產業按下的一次換檔訊號。結合 EgentHub 在 AI Agent 第一線的經驗,可以預期:接下來兩年,每個準備導入 AI 的組織,都會被迫面對同一個問題——當 Agent 成為一切工作的入口,組織內部的工作流程、權限管理與資料控管,是不是都已經準備好了?