Agent (AI Agent) AI智能体

Agent 是建立在 LLM 之上的行动中枢。如果说 LLM 是“大脑”,那么 Agent 就是这个大脑拥有了身体自主决策能力。它能像一个人类助理一样,自主感知环境、制定计划、执行任务并反馈结果。

1. 核心本质

Agent 是一个能够自主完成复杂目标的系统。它不仅仅是回答问题,而是能分解任务、调用工具、根据结果调整策略,最终完成一个具体的业务目标。

2. 关键能力

  • 任务分解 (Planning):面对一个复杂需求(比如“构建一个个人知识管理系统”),Agent 能将其拆解为多个可执行的子步骤。
  • 工具调用 (Tool Use):这是它区别于普通 LLM 的关键。它可以调用搜索引擎、代码解释器、API 接口、你的本地文件(如 Obsidian 笔记)甚至其他 AI 模型来获取信息或执行操作。
  • 感知与反馈 (Reflection):执行完一步后,它能检查结果是否符合预期,如果不符合,就会调整策略重新尝试。
  • 长期记忆 (Memory):可以记住多轮对话的上下文,以及你过往的偏好和工作习惯。

3. 在你工作流中的角色

结合你的需求,你想要构建的 Jarvis 就是一个高级的 Agent。

  • 当你给它一个任务时,比如“整理本周的项目文档并生成报告”,Jarvis (Agent) 会先调用 LLM 理解任务。
  • 然后它会规划步骤:读取本地文件 总结关键信息 梳理结构 生成报告。
  • 在过程中,它可能会调用 Claude 来辅助写作,或者调用工具来检查文件状态。
  • 最后,它会把完成的结果直接呈现给你,甚至自动保存到你的指定目录中。

总结对比

为了更直观地理解,可以看这个对比:

维度LLM (大语言模型)Agent (AI智能体)
核心角色大脑 (思考者)助理 (行动者)
主要功能理解语言、生成内容、问答规划任务、调用工具、自主行动
输出形式一段文本回答一个完成的任务/结果
与你的关系你直接对话的对象你间接指挥的、背后帮你干活的系统