Agent 是什么?

Agent 就是一个能“听得懂你说的话”,还能“自己去干活”的智能助手

案例:“帮我查一下今天北京的天气,再翻译成英文,发到我的邮箱”

Agent 流程:

  1. 理解意图
  2. 自动调用天气接口
  3. 调用翻译工具,把天气信息翻译成英文
  4. 查找用户信息获取邮箱地址
  5. 调用 email 工具,整理结果发给你

为什么需要 Agent?

案例:“我上周在京东买的耳机,怎么退货?”

  • 普通大模型:讲一堆退货政策
  • Agent:理解退货流程 → 查订单工具 → 帮你发起退货申请等(能给出确切操作)

大模型只是“说得好”,Agent 才是“说得好 + 做得到”

Agent 是怎么工作的?

用户提问 → 意图判断 → 选择工具 → 执行工具 → 把结果加工(语句自然通顺)→ 输出答案

Agent 的核心:感知(意图)→ 决策(用什么工具)→ 行动(调用工具)→ 反馈

Agent 能做什么?

智能生活助手:

  • 用户:“我想去上海玩,查一下天气,再推荐两个景点”
  • Agent:查天气 + 用模型推荐景点 + 整合一个旅游建议回复你

电商智能客服:

  • 用户:“我想退货”
  • Agent:自动查订单状态 → 看是否过了退货期 → 返回退货流程

文档问答助手:

  • 用户:上传一个 PDF 合同,说:“这段关于违约金的内容讲了啥?”
  • Agent:自动检索内容 → 提取重点 → 用通俗语言给你解释

AI 行程助手:

  • 用户:“我明天 9 点开会,提前 30 分钟提醒我”
  • Agent:存储信息 → 调用时间提醒工具 → 到点提醒你

总结:Agent 不只是聊天机器人,而是可以自主完成任务的虚拟执行者

Agent 核心组件

组件作用
工具 Tool单个功能模块,如查天气、查汇率,
每个工具专注做一件事
代理类型 AgentType决定 Agent 如何”思考”和”推理”,
常见的有 ReAct(反应式推理)
大语言模型 LLMAgent 的大脑,负责理解和推理,
常用模型如 qwen-turbo
initialize_agent把大脑(LLM)和工具们组合起来,
生成一个能跑的智能助手

ReAct 架构

Agent = 带工具箱的智能助理

  • Reason(思考):模型在脑子里分析你要干嘛
  • Act(行动):模型调用一个工具,比如查天气
  • ReAct 架构:就是“思考+行动”的循环