当前位置:首页 > 大模型评测 > 正文内容

10分钟发布25款新品!AWS 疯狂输出背后的算力野心与 Agent 布局

上善若水2个月前 (12-03)大模型评测

 

告别“炫技”,回归“实用”:深度解读 AWS re:Invent 2025 的三大破局利器

刚刚结束的 AWS re:Invent 2025,可能是近年来节奏最快、“去泡沫化”最彻底的一场科技春晚。

如果非要用一个词来概括这场大会,那就是:实用(Pragmatic)

在两个小时的 Keynote 中,AWS CEO Matt Garman 甚至上演了一场“极限挑战”:在10分钟内密集发布了25款产品,平均24秒就抛出一个重磅更新。

这种近乎压迫式的发布节奏背后,传递了一个清晰的信号:AI 行业已经过了靠“讲故事”和“秀 Demo”博眼球的阶段,现在是时候谈谈怎么把 AI 真正搬进企业的生产环境里赚回真金白银了。image.png

在这场发布会中,我看到了 AWS 针对企业落地 AI 三大痛点——算力太贵、模型难定制、Agent 不可控——所打出的一套精密的组合拳。特别值得一提的是,中国大模型 Kimi(月之暗面)MiniMax 此次被高调点名入驻,标志着全球顶级云生态对中国创新力量的认可。

以下是我从**算力基础设施、基础大模型、AI Agent(智能体)**三个维度,对本次大会的深度复盘与思考。


第一维度:底层算力——重构 AI 的“能源供给”

算力是 AI 时代的电力。谁能把算力的成本打下来,性能提上去,谁就掌握了 AI 发展的命门。AWS 这次在底层算力上的布局,可以用“软硬兼施,打破边界”来形容。

1. 自研芯片的狂飙:Trainium 家族的进击

很多人可能不知道,AWS 的 Trainium(列车)系列芯片部署量已经超过了100万颗。这是一个惊人的数字,说明市场对非英伟达方案的渴求。

这次发布的 Trainium3 Ultra,采用3纳米工艺,性能提升了4.4倍。但对于企业来说,最性感的数据是它的能效:在同等延迟下,每兆瓦电力能产出5倍以上的 AI Tokens。 在能源紧缺的今天,这就是直接的利润。

更让人期待的是“期货” Trainium4。AWS 提前剧透了它的能力:专为全球最大模型训练设计,FP4 计算性能提升6倍。这意味着,未来万亿参数模型的训练成本有望大幅下降。

2. 与英伟达的“相爱相杀”

虽然自研搞得风生水起,但 AWS 很清楚,高端市场离不开英伟达。AWS 依然是全球运行英伟达 GPU 最稳定的云平台。

这次发布的 P6e-GB300 实例(搭载 GB200 NVL72 系统),依然是 OpenAI 等顶尖玩家训练超级模型的首选。这种“自研+合作”的双轨制,保证了 AWS 在算力供给上的绝对安全。image.png

3. 部署模式的颠覆:AI Factories

这是本次大会最让我眼前一亮的创新。

过去,企业面临一个两难选择:想用顶尖算力得上公有云,但为了数据安全又想留在自家机房。

AWS 推出的 AI Factories 完美解决了这个矛盾:它允许你把 AWS 的全套 AI 基础设施(包括 Trainium 芯片和 GPU)搬进你自己的数据中心。

你出机房和电力,AWS 出设备和技术栈。这种打破公有云与私有数据中心物理边界的做法,极大地降低了传统企业(如金融、医疗)拥抱 AI 的门槛。


第二维度:基础大模型——做“土壤”,而非做“霸主”

AWS 的逻辑很清楚:没有一个模型能统治世界。所以,他们选择了做最肥沃的“土壤”。

1. 生态:中国模型的高光时刻

Amazon Bedrock 平台继续通过引入第三方模型来壮大生态,新增了 Google Gemma 和 NVIDIA Nemotron。

但最让我们关注的是,Kimi 和 MiniMax 的正式入驻。这不仅仅是一次商业合作,更意味着中国大模型在性能和通用性上已经达到了国际一线的准入标准,开始借助 AWS 的全球基础设施出海服务全球客户。

2. 自研:Nova 2 系列的全面对标

AWS 终于在自研模型上亮剑了。Nova 2 系列的四款模型覆盖了从极速到全能的所有场景:

  • Nova 2 Light: 超越 GPT-4o-mini,主打极致性价比。

  • Nova 2 Pro: 号称在复杂推理上超越 GPT-5.1 和 Claude 4.5 Sonnet(虽然是厂商数据,但值得期待)。

  • Nova 2 Sonic & Omni: 分别主打实时语音和全模态理解,意在让人机交互更像“人与人”的交流。

3. 杀手锏:Nova Forge 与“开放训练模型”

这是我认为本次大会最具技术含金量的发布。image.png

企业想拥有自己的模型,以前只能做微调(Fine-tuning),但容易出现“灾难性遗忘”(学了新知识,忘了旧本领)。AWS 推出的 Amazon Nova Forge 引入了 “开放训练模型(Open Training Models)” 概念。

简单说,企业不再是拿到一个成型的模型去“修补”,而是可以获取模型训练中途的“检查点(Checkpoint)”,融入自己的私有数据继续训练。

这就好比: 以前你是请一个名牌大学毕业生来公司培训,现在你是直接参与了这个学生的大学教育过程,把行业知识写进了他的教材里。这样训练出来的模型(Novella),才是真正懂业务的“专家”。


第三维度:AI Agent——全面拥抱“智能体”时代

如果说大模型是大脑,那么 Agent(智能体)就是能干活的手脚。AWS 认为,AI 助手(Chatbot)的时代即将过去,Agent 的时代已经到来。但目前 Agent 最大的问题是:难造、难管、不可信。

针对这三点,AWS 给出了全套解决方案:

1. 帮开发者“减负”:Kiro 系列 Agent

AWS 发布了基于 Kiro 的三大开发类 Agent:

  • 自主 Agent: 能自己规划任务,比如自动升级成百上千个依赖库。

  • 安全 Agent: 在代码写出来之前就审查设计文档,甚至自己进行渗透测试。

  • 运维 Agent: 7x24小时盯着系统,一旦出故障,能瞬间定位根因并修复。

这可不是概念,数据显示,6人团队用这些工具,完成了过去需要30人干18个月的工作。 这是一个恐怖的效率提升。

2. 帮企业“避坑”:Agent 治理全家桶

企业不敢用 Agent,主要是怕它“乱说话”或“乱操作”。

  • 构建工具: 帮你把老旧代码快速迁移到新平台,为 Agent 铺路。

  • 治理工具(Policy): 给 Agent 设置“电子围栏”。你可以用自然语言定义策略,比如“涉及财务转账必须经过人工审批”,系统会实时拦截 Agent 的越界行为。

  • 评估工具: 解决信任问题。自动监控 Agent 的输出质量,确保它既准确又无害。


总结与展望:从“技术流”迈向“价值流”

纵观整场 AWS re:Invent 2025,我最大的感受是:AWS 正在用它最擅长的系统工程能力,填平 AI 落地过程中的所有坑洼。

1111111111111.jpg

  • • 觉得算力贵?用 Trainium 和 AI Factories。

  • • 觉得模型不懂业务?用 Nova Forge 做深度定制。

  • • 觉得 Agent 不可控?用全套治理工具链管起来。

AWS 不盲目卷单一的技术指标,而是构建了一个从芯片到网络,从平台到应用的端到端基础设施。对于科技行业而言,这标志着 AI 正式从令人惊叹的**“技术时代”,迈入了必须产生效益的“价值时代”**。

对于企业来说,现在也许是入局 AI 最好的时刻——工具已经备好,剩下的,就是看谁能更务实地把这些工具用在刀刃上了。

 


“10分钟发布25款新品!AWS 疯狂输出背后的算力野心与 Agent 布局” 的相关文章

DeepSeek又炸了!再一次颠覆想象!

DeepSeek又炸了!再一次颠覆想象!

 I. 导语:DeepSeek-OCR 成为 AI 圈热点近日,AI 圈再次被一个重磅消息引爆:DeepSeek 团队推出了革命性的文字识别模型 DeepSeek-OCR。这一事件迅速成为国...

阿里云通义大模型“爆发式实战”:14 亿次调用刷新“双11”AI新纪录!

阿里云通义大模型“爆发式实战”:14 亿次调用刷新“双11”AI新纪录!

 在刚刚过去的“双11”购物节中,除了创纪录的交易量,另一项令人瞩目的突破来自技术层面——阿里云通义系列大模型迎来了首次全面、实战级的大规模应用。这不仅是阿里巴巴在大模型领域的一次重要落地,...

谷歌 Nano Banana 2 凭何刷屏?独家揭秘:用“自家人的脸”当数据,还要“干掉”提示词工程!

谷歌 Nano Banana 2 凭何刷屏?独家揭秘:用“自家人的脸”当数据,还要“干掉”提示词工程!

 AI 视觉领域最近又被“刷屏”了。一款名为 Nano Banana 2 的 Google 视觉模型,在第三方平台 Media IO 上甫一亮相,便技惊四座。它展示的“杰作”远超传统认知:不...

谷歌 NotebookLM 推出“深度研究”:AI 助你 5 分钟构建专家级知识库,效率暴涨!

谷歌 NotebookLM 推出“深度研究”:AI 助你 5 分钟构建专家级知识库,效率暴涨!

 一、引言:暖心升级,告别碎片化学习11 月 13 日,科技巨头谷歌旗下的 AI 笔记工具 NotebookLM 迎来了一次值得所有内容创作者和研究人员关注的重大更新。这次升级的核心,是推出...

Gemini 3.0 Pro模型卡曝光,多模态、知识库能力大幅超越GPT与Claude

Gemini 3.0 Pro模型卡曝光,多模态、知识库能力大幅超越GPT与Claude

 在AI大模型竞争白热化的当下,谷歌即将发布的Gemini 3.0 Pro无疑是业界最期待的事件之一。根据最新的泄露信息和性能指标,我们可以清晰地判断:Gemini 3.0 Pro绝非一次小...

30秒做应用、实时写图文,「灵光」想用AI重塑创造力边界

30秒做应用、实时写图文,「灵光」想用AI重塑创造力边界

 在人工智能大模型领域,竞争的焦点已经悄然发生了转移,不再仅仅局限于谁的模型在基准测试中得分更高。随着“灵光”(Lingguang)的发布,行业趋势正从“谁的模型更强”转向**“谁能将能力更...