AWS re:Invent 2025 懶人包:AI 代理人時代來了,企業該怎麼走?
AWS re:Invent 2025 懶人包:AI 代理人時代來了,企業該怎麼走?

每年 re:Invent,AWS 都在回答同一個問題:「接下來幾年,雲端世界會往哪裡走?」2025 年的答案很清楚:AI 正從「會聊天的助理」走向「會自己把事情做完的代理人(Agent)」,而 AWS 則在負責把所有需要的基礎——晶片、模型、資料、工具、治理——全部鋪好。我們將從 雲端代理商/雲端顧問的角度,整理這場 Keynote 對企業真正的意義:如果你已經在用 AWS,或正在規劃 AI 專案,這些更新會直接改變你未來 1–2 年的決策。

AWS re:Invent 是 AWS 每年一度在拉斯維加斯舉辦的全球雲端大會,今年(2025)是第 14 屆,時間是 12 月 1–5 日,會場分散在拉斯維加斯大道上的多個大型飯店與會議中心。每年都有來自全球的開發者、架構師、企業決策者與合作夥伴齊聚一堂,一週內集中發布 AWS 最新的雲端與 AI 服務、產品路線與實作案例。

一、AWS re:Invent 2025:六個你不能錯過的關鍵訊號

1. AWS 的規模本身就是一座 AI 護城河

AWS 公布的幾個關鍵數字:

  • 年營收已達 1,320 億美元,年成長率回升到約 20%
  • 過去 12 個月新增營收約 220 億美元,比超過一半《財富 500 強》公司的年營收還多。
  • 一年內新增約 3.8GW 資料中心容量,是全球最大的新增量之一。
  • 全球私有網路總長度已超過 900 萬公里,包含海底電纜。

這些數字代表的是:
AWS 有足夠的規模與資本,把 AI 所需的算力、網路與儲存鋪到別人很難追上的程度。

2. Trainium 3 / 4 + AI Factories:算力與部署模式大翻轉

AWS Trainium3
image

在晶片與基礎設施上,幾個關鍵更新:

  • Trainium 3 UltraServers 正式 GA,被定位為大規模 AI 訓練與推論的高性價比平台。
  • 下一代 Trainium 4 已開始設計,FP4 運算效能預計提升數倍,記憶體頻寬與容量也同步放大。
  • 全新服務 AWS AI Factories 讓企業可以把 Trainium Ultra、NVIDIA GPU、Bedrock、SageMaker 等能力,直接部署在自己的資料中心,運作方式近似一個「專屬的 AWS 私有 AI 區域」。

未來不一定是「把資料搬到 AWS 跑 AI」,而是可以把「AWS 的 AI 能力搬進你的機房」。

3. Nova 2 + Nova Forge:從用別人的模型,走向養自己的模型

Amazon Nova

在模型層,AWS 做了兩件事:

  1. 推出新一代 Nova 2 模型家族
    • Nova 2 Lite:追求高效、低成本推論。
    • Nova 2 Pro:強調推理與工具使用能力,是代理人場景的主力。
    • Nova 2 Sonic:語音對語音模型,支援即時、自然的語音互動。
    • Nova 2 Omni:統一多模態模型,支援文字、影像、音訊、影片輸入。
  2. 發布 Amazon Nova Forge
    • 引入「開放式訓練模型」(Open Training Models)的概念。
    • 企業可以在模型不同訓練階段(checkpoint)注入自家資料,而不是只能事後微調。
    • 藉由這種方式產生的企業專屬模型,被稱為 Novellas

就像人長大後再學語言比較吃力,但在成長期學習卻能吸收得又快又自然。Nova Forge 的做法,就是讓企業能在模型的「成長期」就開始教它自己的語言與規則。

4. Bedrock 已經變成真正的「企業 AI 平台」

Amazon Bedrock

幾個關鍵採用數據:

  • 全球已有 超過 10 萬家企業 使用 Amazon Bedrock。
  • 過去一年,Bedrock 客戶數成長超過一倍。
  • 超過 50 家客戶各自處理了超過 1 兆個 token 的推論。

Bedrock 之上推出 AgentCore,作為統一的代理人編排與治理層:

  • 你可以在這裡註冊企業內部的 API、Lambda、內部系統等各種工具。
  • 透過 Policies 設定代理人能用哪些工具、在什麼條件下可以下指令、哪些操作一律禁止。
  • Evaluations 持續評估代理人的品質(正確性、有用性、安全性等),並根據真實世界的行為迭代調整。

這表示 Bedrock 已經從「實驗平台」變成「企業級 AI 生產平台」,很多公司在上面跑的已經不只是 demo,而是真正在支撐服務與內部流程。

更多關於 Amazon AgentCore 的介紹,可以參考: AgentCore 讓 AI Agents 擺脫原型階段,真正進入企業生產環境

5. Frontier Agents:AI 不再只是「助手」,而是能接下專案的虛擬同事

AWS 推出三種 Frontier Agents(前沿代理人)

  1. Kuro Autonomous Agent
    • 幫開發團隊自動處理複雜的工程任務,例如:開新功能、修 bug、提高測試覆蓋率。
    • 可長時間運作,與 GitHub、Jira、Slack 等工具整合。
  2. AWS Security Agent
    • 自動審查系統設計文件。
    • 掃描程式碼與設定中的安全弱點。
    • 將過去需要人工安排的滲透測試,變成「隨需使用」的持續性實務。
  3. AWS DevOps Agent
    • 監控系統事件、偵測異常。
    • 自動協助找出 root cause。
    • 提出潛在修復方案與改善建議。

其中最被討論的,是 Kuro 在 Amazon 內部的一個實際案例:原本估計需要 30 位工程師、18 個月 才能完成的大型架構重構專案,在全面導入 Kuro 之後,實際結果是 6 個人、76 天就完成

這個數字說明:
AI 已經不只是寫程式小幫手,而是有能力交付「一整個專案」的生產力單位。

6. 最後 10 分鐘的 25 項更新:AI 正在重寫整個雲端堆疊

在 Keynote 的最後,AWS 用倒數計時的方式,一口氣公布了 25 項核心雲端服務的更新,涵蓋:

  • 運算(EC2、Mac 實例、Lambda Durable Functions)
  • 儲存與向量(S3、S3 Tables、S3 Vectors)
  • 資料庫與分析(RDS、OpenSearch、EMR Serverless、Database Savings Plans)
  • 安全與可觀測性(GuardDuty、Security Hub、CloudWatch)

表面看起來是功能大放送,但如果拉回到 AI 敘事,你會發現:
這些更新通通在替「AI 大量上線」那一天做準備。


二、如果你是 AWS 企業用戶,這些更新實際代表什麼?

前半段比較像「知道 AWS 在做什麼」。
接下來的重點是:那對你現在或未來 1–2 年的雲端與 AI 計畫,到底有什麼實際影響?

1️⃣ AI 基礎設施與成本:你的「AI 成本公式」要改寫了

AWS Trainium4

AWS 做了什麼?

  • 持續強化 Trainium 晶片與 UltraServers,並預告下一代 Trainium 4。
  • 與 NVIDIA 的合作進一步擴大,推出搭載新一代 GPU 系統的 EC2 實例。
  • 引入 AI Factories,讓企業可以在自家機房內部署一套專屬的 AWS AI 基礎設施。

這對企業意味著什麼?

  • 「AI 太貴,所以先做做 POC 就好」這種說法,未來會越來越站不住腳:
    當推論與訓練成本持續下降,真正的問題會變成「你有沒有把 AI 用在對的地方」,而不是「你付不付得起」。
  • 對有大量 on-prem、嚴格法規或資料主權需求較高的組織(金融、醫療、政府、製造)來說,AI 的導入不再只是「上公有雲」與「完全不上雲」兩種極端選項,
    而是多了一條:把 AWS 的 AI 能力搬進資料中心的中間路線。

勤英科技如何建議?

  • 幫你做一份「AI 成本結構體檢」:
    • 目前在 AWS 上已經有的推論與訓練工作,分散在哪些服務?
    • 如果未來逐步導入 Trainium 或不同實例家族,可能節省多少成本?
  • 協助評估你現有的機房與網路環境,從「AI Factories 有沒有機會落地」的角度重新檢視,而不是只把 on-prem 視為技術債。

2️⃣ 模型與企業資料:從「叫模型幫忙」走向「養自己的模型」

Building custom model

AWS 做了什麼?

  • Nova 2 系列模型提供從高效推論到多模態理解的完整組合。
  • Bedrock 已被超過十萬家企業採用,處理的 token 量級已經是「兆」為單位。
  • 透過 Nova Forge + Open Training Models + Novellas,讓企業可以在模型的「成長階段」就開始注入專有知識,而不是只在最後做微調。

這對企業意味著什麼?

過去常見的企業 AI 導入組合是:

「現成模型 + RAG + 微調」

未來可能會演化成:

「現成模型 + RAG + 局部重新訓練 + 更嚴謹的 Policies」

差別在於:

  • RAG:模型可以「查得到」你的資料。
  • 微調:模型可以「記住一些」你的資料。
  • Nova Forge:模型是「在成長過程中就理解你的業務」,變成一個真正內建公司知識與邏輯的企業專屬 AI。

這會逼企業開始認真面對一個問題:
你的資料現在是為「報表」整理,還是為「AI 可以理解」整理?

勤英科技如何建議?

比較務實的做法,不是直接衝去做「我要一個我的 Novellas」,而是分幾步走:

  1. 先在現有 AWS 環境中,把資料分類:
    • 哪些適合用於 RAG?
    • 哪些因為隱私或法規,未來只能在 AI Factories 裡用?
  2. 選一個具體場景,做一個 「RAG + Nova 2/Mistral」的小型專案
    例如內部知識庫問答、技術支援、售前 Q&A。
  3. 在這個過程中順便建立:
    • 給 AI 看的資料格式與品質標準
    • 權限與審計的基本規則
      才有機會在之後順利往「部分重新訓練、打造專屬模型」那一步前進。

3️⃣ 那 25 項看起來很雜的更新,其實都在替 AI 打底

Need more storage on database

AWS 做了什麼?

  • 運算升級 – Compute & Lambda
    • 新一代 X family 大記憶體實例、C8 系列 CPU 強化、M8 AN 超高時脈實例、Mac M3 Ultra / M4 Max。
    • Lambda Durable Functions 讓需要等待數小時或數天的長流程,可以用 Serverless 方式實作。
  • 儲存升級 – Storage / Vector
    • S3 最大物件從 5TB 提升到 50TB,Batch 操作最多快 10 倍。
    • S3 Tables 引入 Intelligent Tiering,可節省大量儲存成本,並支援跨區、跨帳戶複製。
    • S3 Vectors GA,可在 S3 上原生存放與查詢向量嵌入,向量儲存與查詢成本大幅下降。
  • 資料庫升級 – Database / Analytics
    • RDS for SQL Server / Oracle 容量上限提升到 256TB,IOPS 與頻寬也提升。
    • 支援指定 vCPU 數量以優化授權成本。
    • OpenSearch 向量索引支援 GPU 加速,大幅提升索引效率並降低成本。
    • Database Savings Plans 提供資料庫層級的費用折扣。
  • Security / Observability
    • GuardDuty 擴展支援 ECS。
    • 新版 Security Hub 提供更即時的風險分析與趨勢儀表板。
    • CloudWatch Unified Data Store 可以統一儲存並分析來自 CloudTrail、VPC Flow Logs 以及第三方來源的記錄。

這對企業意味著什麼?

  • 當你真的把 AI 導入到更多產品與內部流程時:
    • 儲存量一定會暴增,尤其是非結構化資料與向量。
    • 資料庫的 IO 與容量壓力會變大。
    • 安全事件與系統事件的數量只會更多不會更少。

這 25 項更新,本質上是在幫你:

  • 把「道路加寬」(更強的運算與儲存)
  • 把「紅綠燈升級」(更精細的安全偵測與治理)
  • 把「監視器裝好」(更好的可觀測性)

讓 AI 這台新引擎上路的時候,不會把整個系統撞壞。

勤英科技如何建議?

  • 重新檢視你現有的 AWS 架構與帳單:
    • 哪些 S3 Bucket 適合導入 S3 Tables 或 S3 Vectors?
    • 哪些 RDS 工作負載適合納入 Database Savings Plans?
    • GuardDuty、Security Hub、CloudWatch 的新功能,能不能順勢納入你的 SecOps、FinOps、AIOps 流程中?

三、接下來 6–12 個月,企業可以從哪三件事開始?

如果你已經在用 AWS,或準備在 AI 上加大投資,可以把 re:Invent 2025 當作一個時間點,重新整理一下自己的雲端與 AI 路線圖。這裡有三件事,值得在接下來一年內優先處理:

✅ 1. 重算一次「AI + 雲端」的成本與架構

  • 盤點現在所有在 AWS 上跑的工作負載,粗略分成三類:
    1. 純傳統應用(Web / App / DB)。
    2. 已經有用到 AI/ML 的服務。
    3. 未來有機會導入 AI 的場景(客服、內部查詢、營運優化等)。
  • 隨著 Trainium、AI Factories、S3 Vectors、Database Savings Plans 等更新,
    很多原本覺得「算起來不划算」的 AI 應用,可能會變得合理許多。

✅ 2. 至少選一個「AI 代理人」PoC 場景

  • 選一個具備以下條件的場景:
    • 資料充足、規則明確。
    • 影響範圍可控,適合做 sandbox。
    • 成效容易量化(節省人力時間、縮短處理時間、降低 ticket 量等)。
  • 從這個場景出發,設計第一個「人 + Agent 協作」的流程,目標不是立刻省掉幾個人,而是學會:
    • 怎麼定義代理人的任務與邊界。
    • 怎麼設計回饋與審核機制。
    • 怎麼把成功模式複製到其他部門。

✅ 3. 把「資料給 AI 看」當成新的治理基準

  • 不再只是用「備份是否完整」「有沒有 DR」來看資料,而是多問幾個問題:
    • 這些資料如果交給 AI,看得懂嗎?
    • 權限與遮罩做得夠不夠細?
    • 有沒有清楚的審計紀錄,知道 AI 看過什麼、用了什麼?
  • 這會影響你對 S3 結構、Metadata、RDS Schema、Data Lake、Data Warehouse,甚至 IAM、Policies 的設計方式。

結語:從 Keynote 到真正落地

AI 代理人時代已經啟動,AWS 把晶片、模型、平台和工具都準備好了,接下來差別只在於:誰先把它用進每天的營運。
如果你想從重新盤點 AWS 成本、優化架構,到用 Bedrock、向量搜尋或代理人做第一個 PoC,勤英科技作為 AWS 專業代理商,可以一起協助你規劃與落地,讓今年看到的 re:Invent 題目,明年真的變成看得到成效、算得出投報的專案。

*資料來源:AWS 官網 / AWS YouTube

author avatar
Kevin Chou
Marketing Manager at Elite Cloud. Specialized in cloud cost optimization, FinOps, and multi-cloud strategy across AWS, Google Cloud, and Azure. Experienced in digital marketing, analytics, and content strategy for enterprise cloud solutions.
AI 代理 AWS re:Invent