10分钟发布25款新品!AWS 疯狂输出背后的算力野心与 Agent 布局
刚刚结束的 AWS re:Invent 2025,可能是近年来节奏最快、“去泡沫化”最彻底的一场科技春晚。 如果非要用一个词来概括这场大会,那就是:实用(Pragmatic)。 在两个小时的 Keynote 中,AWS CEO Matt Garman 甚至上演了一场“极限挑战”:在10分钟内密集发布了25款产品,平均24秒就抛出一个重磅更新。 这种近乎压迫式的发布节奏背后,传递了一个清晰的信号:AI 行业已经过了靠“讲故事”和“秀 Demo”博眼球的阶段,现在是时候谈谈怎么把 AI 真正搬进企业的生产环境里赚回真金白银了。 在这场发布会中,我看到了 AWS 针对企业落地 AI 三大痛点——算力太贵、模型难定制、Agent 不可控——所打出的一套精密的组合拳。特别值得一提的是,中国大模型 Kimi(月之暗面) 和 MiniMax 此次被高调点名入驻,标志着全球顶级云生态对中国创新力量的认可。 以下是我从**算力基础设施、基础大模型、AI Agent(智能体)**三个维度,对本次大会的深度复盘与思考。 算力是 AI 时代的电力。谁能把算力的成本打下来,性能提上去,谁就掌握了 AI 发展的命门。AWS 这次在底层算力上的布局,可以用“软硬兼施,打破边界”来形容。 很多人可能不知道,AWS 的 Trainium(列车)系列芯片部署量已经超过了100万颗。这是一个惊人的数字,说明市场对非英伟达方案的渴求。 这次发布的 Trainium3 Ultra,采用3纳米工艺,性能提升了4.4倍。但对于企业来说,最性感的数据是它的能效:在同等延迟下,每兆瓦电力能产出5倍以上的 AI Tokens。 在能源紧缺的今天,这就是直接的利润。 更让人期待的是“期货” Trainium4。AWS 提前剧透了它的能力:专为全球最大模型训练设计,FP4 计算性能提升6倍。这意味着,未来万亿参数模型的训练成本有望大幅下降。 虽然自研搞得风生水起,但 AWS 很清楚,高端市场离不开英伟达。AWS 依然是全球运行英伟达 GPU 最稳定的云平台。 这次发布的 P6e-GB300 实例(搭载 GB200 NVL72 系统),依然是 OpenAI 等顶尖玩家训练超级模型的首选。这种“自研+合作”的双轨制,保证了 AWS 在算力供给上的绝对安全。 这是本次大会最让我眼前一亮的创新。 过去,企业面临一个两难选择:想用顶尖算力得上公有云,但为了数据安全又想留在自家机房。 AWS 推出的 AI Factories 完美解决了这个矛盾:它允许你把 AWS 的全套 AI 基础设施(包括 Trainium 芯片和 GPU)搬进你自己的数据中心。 你出机房和电力,AWS 出设备和技术栈。这种打破公有云与私有数据中心物理边界的做法,极大地降低了传统企业(如金融、医疗)拥抱 AI 的门槛。 AWS 的逻辑很清楚:没有一个模型能统治世界。所以,他们选择了做最肥沃的“土壤”。 Amazon Bedrock 平台继续通过引入第三方模型来壮大生态,新增了 Google Gemma 和 NVIDIA Nemotron。 但最让我们关注的是,Kimi 和 MiniMax 的正式入驻。这不仅仅是一次商业合作,更意味着中国大模型在性能和通用性上已经达到了国际一线的准入标准,开始借助 AWS 的全球基础设施出海服务全球客户。 AWS 终于在自研模型上亮剑了。Nova 2 系列的四款模型覆盖了从极速到全能的所有场景: • Nova 2 Light: 超越 GPT-4o-mini,主打极致性价比。 • Nova 2 Pro: 号称在复杂推理上超越 GPT-5.1 和 Claude 4.5 Sonnet(虽然是厂商数据,但值得期待)。 • Nova 2 Sonic & Omni: 分别主打实时语音和全模态理解,意在让人机交互更像“人与人”的交流。 这是我认为本次大会最具技术含金量的发布。 企业想拥有自己的模型,以前只能做微调(Fine-tuning),但容易出现“灾难性遗忘”(学了新知识,忘了旧本领)。AWS 推出的 Amazon Nova Forge 引入了 “开放训练模型(Open Training Models)” 概念。 简单说,企业不再是拿到一个成型的模型去“修补”,而是可以获取模型训练中途的“检查点(Checkpoint)”,融入自己的私有数据继续训练。 这就好比: 以前你是请一个名牌大学毕业生来公司培训,现在你是直接参与了这个学生的大学教育过程,把行业知识写进了他的教材里。这样训练出来的模型(Novella),才是真正懂业务的“专家”。 如果说大模型是大脑,那么 Agent(智能体)就是能干活的手脚。AWS 认为,AI 助手(Chatbot)的时代即将过去,Agent 的时代已经到来。但目前 Agent 最大的问题是:难造、难管、不可信。 针对这三点,AWS 给出了全套解决方案: AWS 发布了基于 Kiro 的三大开发类 Agent: • 自主 Agent: 能自己规划任务,比如自动升级成百上千个依赖库。 • 安全 Agent: 在代码写出来之前就审查设计文档,甚至自己进行渗透测试。 • 运维 Agent: 7x24小时盯着系统,一旦出故障,能瞬间定位根因并修复。 这可不是概念,数据显示,6人团队用这些工具,完成了过去需要30人干18个月的工作。 这是一个恐怖的效率提升。 企业不敢用 Agent,主要是怕它“乱说话”或“乱操作”。 • 构建工具: 帮你把老旧代码快速迁移到新平台,为 Agent 铺路。 • 治理工具(Policy): 给 Agent 设置“电子围栏”。你可以用自然语言定义策略,比如“涉及财务转账必须经过人工审批”,系统会实时拦截 Agent 的越界行为。 • 评估工具: 解决信任问题。自动监控 Agent 的输出质量,确保它既准确又无害。 纵观整场 AWS re:Invent 2025,我最大的感受是:AWS 正在用它最擅长的系统工程能力,填平 AI 落地过程中的所有坑洼。 • 觉得算力贵?用 Trainium 和 AI Factories。 • 觉得模型不懂业务?用 Nova Forge 做深度定制。 • 觉得 Agent 不可控?用全套治理工具链管起来。 AWS 不盲目卷单一的技术指标,而是构建了一个从芯片到网络,从平台到应用的端到端基础设施。对于科技行业而言,这标志着 AI 正式从令人惊叹的**“技术时代”,迈入了必须产生效益的“价值时代”**。 对于企业来说,现在也许是入局 AI 最好的时刻——工具已经备好,剩下的,就是看谁能更务实地把这些工具用在刀刃上了。告别“炫技”,回归“实用”:深度解读 AWS re:Invent 2025 的三大破局利器

第一维度:底层算力——重构 AI 的“能源供给”
1. 自研芯片的狂飙:Trainium 家族的进击
2. 与英伟达的“相爱相杀”

3. 部署模式的颠覆:AI Factories
第二维度:基础大模型——做“土壤”,而非做“霸主”
1. 生态:中国模型的高光时刻
2. 自研:Nova 2 系列的全面对标
3. 杀手锏:Nova Forge 与“开放训练模型”

第三维度:AI Agent——全面拥抱“智能体”时代
1. 帮开发者“减负”:Kiro 系列 Agent
2. 帮企业“避坑”:Agent 治理全家桶
总结与展望:从“技术流”迈向“价值流”






