让 Agent 真正进入企业核心业务系统，到底还缺什么？

如果说过去三年是模型之争，那么未来三年将是Agent平台之争。

大模型不再只是写写文案、生成几张图。随着智能体能力的成熟，能自己思考、能自主执行、能真正解决问题的AIAgent，正在被推向舞台中央。模型之争仍是“巨兽比拼”，但产业焦点已经悄然转向：Agent将成为进入企业核心生产系统的下一代通用能力。

在今年的AWSre:Invent全球大会上，亚马逊云科技AgenticAI副总裁SwamiSivasubramanian回答了所有技术人此刻最关心的问题：要让Agent真正进入企业的核心业务系统，到底还缺什么？亚马逊云科技为此做了哪些基础设施、工具与平台级的重构？

从本质上看，每个Agent都由三个关键组件构成：

第一是模型，它是Agent的大脑，负责推理、规划和执行。

第二是代码，它定义了Agent的身份，决定其能力，并指导其完成决策过程。

第三是工具，这是让Agent“活起来”的关键——无论是后端应用程序接口（API）、知识库与数据库访问权限，还是支持实际操作的代码解释器、网页浏览器，都属于工具范畴。

过去最大的问题是：把这些组件整合在一起，是一个极为脆弱且昂贵的工程，一旦场景变化就会全部失效。现在，随着模型推理能力的提升，协调机制可以由模型接管，Agent可以自己判断下一步要干什么。

这就是AWS推出的StrandsAgentSDK的逻辑基础。Strands采用模型驱动的方法，让大型语言模型（LLM）能够自主处理Agent可能遇到的任何场景，省去了所有预设工作流程和复杂协调代码，还提高了Agent的准确性和代码可维护性。

目前StrandsAgentSDK已经开源，本次新增支持TypeScript，同时支持边缘设备，自五月份以来下载量已超过500万次。

下一个问题是，如何让Agent稳定、安全、大规模地跑在生产环境？这就进入亚马逊云科技的另一个重要产品：AmazonBedrockAgentCore。

企业使用Agent很容易遇到一个问题：demo很简单，生产很复杂。从0到数千并发Agent的能力；会话上下文、长期偏好、场景化语义都要保留；要能为Agent管控API、用户、数据的最小访问范围；要与企业系统、数据库、第三方应用安全连接；还要有监控与调试的可观察性。

AmazonBedrockAgentCore能够在安全前提下大规模构建、部署和运营Agent。它就像一个工具箱，里面的每一件工具都为解决构建与运营Agent过程中遇到的真实问题而设计。例如AgentCoreIdentity，只需几行代码，就能实现亚马逊云科技应用与Slack、Zoom等第三方应用之间的无缝身份访问管理。

本次AgentCoreMemory中推出的episodic记忆新功能，让AIAgent能够记住并从过去的经历中学习。Agent能够真正理解用户行为，通过识别相似场景中的模式自动调整，并主动提供有效的解决方案。它能将特定体验或交互作为独立情景存储和召回，就像人类记住特定事件一样。Agent的经历越丰富，就变得越智能。

Agent离不开模型，那么如何通过模型定制与训练技术，构建真正高效、可大规模部署的AIAgent？

Bedrock推出的RFT（ReinforcementFine-Tuning）自动化所有复杂的RL流程，让开发者无需理解奖励建模、策略优化、分布式训练，就能直接使用RLAIF。AmazonSageMakerAI则推出了新的无服务器模型定制功能，不再需要繁琐的基础设施准备。

更有意思的是，NovaForge首创了“开放训练模型”计划。有些行业仍需要深度嵌入领域知识的基础模型，例如药物研发、基因建模、物理仿真等。

以前企业要从零开始训练基座模型，成本极高且成果不可控。NovaForge提供了新的思路：提供中间检查点访问，允许混合使用专有与基础训练数据，保留基础模型安全性与通用能力，无需承担完整训练周期成本——这让训练行业专用基础模型变得更可行。

此外，SageMakerHyperPod推出的CheckpointlessTraining不再使用传统检查点，可在分布式集群中实时保存模型状态，故障恢复从数小时缩短到数分钟，节省高达40%的训练成本。这意味着可以在更短时间内、更低成本下迭代模型。