游戏百科

让 Agent 真正进入企业核心业务系统,到底还缺什么?

如果说过去三年是模型之争,那么未来三年将是Agent平台之争。

大模型不再只是写写文案、生成几张图。随着智能体能力的成熟,能自己思考、能自主执行、能真正解决问题的AIAgent,正在被推向舞台中央。模型之争仍是“巨兽比拼”,但产业焦点已经悄然转向:Agent将成为进入企业核心生产系统的下一代通用能力。

在今年的AWSre:Invent全球大会上,亚马逊云科技AgenticAI副总裁SwamiSivasubramanian回答了所有技术人此刻最关心的问题:要让Agent真正进入企业的核心业务系统,到底还缺什么?亚马逊云科技为此做了哪些基础设施、工具与平台级的重构?

从本质上看,每个Agent都由三个关键组件构成:

第一是模型,它是Agent的大脑,负责推理、规划和执行。

第二是代码,它定义了Agent的身份,决定其能力,并指导其完成决策过程。

第三是工具,这是让Agent“活起来”的关键——无论是后端应用程序接口(API)、知识库与数据库访问权限,还是支持实际操作的代码解释器、网页浏览器,都属于工具范畴。

过去最大的问题是:把这些组件整合在一起,是一个极为脆弱且昂贵的工程,一旦场景变化就会全部失效。现在,随着模型推理能力的提升,协调机制可以由模型接管,Agent可以自己判断下一步要干什么。

这就是AWS推出的StrandsAgentSDK的逻辑基础。Strands采用模型驱动的方法,让大型语言模型(LLM)能够自主处理Agent可能遇到的任何场景,省去了所有预设工作流程和复杂协调代码,还提高了Agent的准确性和代码可维护性。

目前StrandsAgentSDK已经开源,本次新增支持TypeScript,同时支持边缘设备,自五月份以来下载量已超过500万次。

下一个问题是,如何让Agent稳定、安全、大规模地跑在生产环境?这就进入亚马逊云科技的另一个重要产品:AmazonBedrockAgentCore。

企业使用Agent很容易遇到一个问题:demo很简单,生产很复杂。从0到数千并发Agent的能力;会话上下文、长期偏好、场景化语义都要保留;要能为Agent管控API、用户、数据的最小访问范围;要与企业系统、数据库、第三方应用安全连接;还要有监控与调试的可观察性。

AmazonBedrockAgentCore能够在安全前提下大规模构建、部署和运营Agent。它就像一个工具箱,里面的每一件工具都为解决构建与运营Agent过程中遇到的真实问题而设计。例如AgentCoreIdentity,只需几行代码,就能实现亚马逊云科技应用与Slack、Zoom等第三方应用之间的无缝身份访问管理。

本次AgentCoreMemory中推出的episodic记忆新功能,让AIAgent能够记住并从过去的经历中学习。Agent能够真正理解用户行为,通过识别相似场景中的模式自动调整,并主动提供有效的解决方案。它能将特定体验或交互作为独立情景存储和召回,就像人类记住特定事件一样。Agent的经历越丰富,就变得越智能。

Agent离不开模型,那么如何通过模型定制与训练技术,构建真正高效、可大规模部署的AIAgent?

Bedrock推出的RFT(ReinforcementFine-Tuning)自动化所有复杂的RL流程,让开发者无需理解奖励建模、策略优化、分布式训练,就能直接使用RLAIF。AmazonSageMakerAI则推出了新的无服务器模型定制功能,不再需要繁琐的基础设施准备。

更有意思的是,NovaForge首创了“开放训练模型”计划。有些行业仍需要深度嵌入领域知识的基础模型,例如药物研发、基因建模、物理仿真等。

以前企业要从零开始训练基座模型,成本极高且成果不可控。NovaForge提供了新的思路:提供中间检查点访问,允许混合使用专有与基础训练数据,保留基础模型安全性与通用能力,无需承担完整训练周期成本——这让训练行业专用基础模型变得更可行。

此外,SageMakerHyperPod推出的CheckpointlessTraining不再使用传统检查点,可在分布式集群中实时保存模型状态,故障恢复从数小时缩短到数分钟,节省高达40%的训练成本。这意味着可以在更短时间内、更低成本下迭代模型。