Agent 是什么?
Agent 就是一个能“听得懂你说的话”,还能“自己去干活”的智能助手
案例:“帮我查一下今天北京的天气,再翻译成英文,发到我的邮箱”
Agent 流程:
- 理解意图
- 自动调用天气接口
- 调用翻译工具,把天气信息翻译成英文
- 查找用户信息获取邮箱地址
- 调用 email 工具,整理结果发给你
为什么需要 Agent?
案例:“我上周在京东买的耳机,怎么退货?”
- 普通大模型:讲一堆退货政策
- Agent:理解退货流程 → 查订单工具 → 帮你发起退货申请等(能给出确切操作)
大模型只是“说得好”,Agent 才是“说得好 + 做得到”
Agent 是怎么工作的?
用户提问 → 意图判断 → 选择工具 → 执行工具 → 把结果加工(语句自然通顺)→ 输出答案
Agent 的核心:感知(意图)→ 决策(用什么工具)→ 行动(调用工具)→ 反馈
Agent 能做什么?
智能生活助手:
- 用户:“我想去上海玩,查一下天气,再推荐两个景点”
- Agent:查天气 + 用模型推荐景点 + 整合一个旅游建议回复你
电商智能客服:
- 用户:“我想退货”
- Agent:自动查订单状态 → 看是否过了退货期 → 返回退货流程
文档问答助手:
- 用户:上传一个 PDF 合同,说:“这段关于违约金的内容讲了啥?”
- Agent:自动检索内容 → 提取重点 → 用通俗语言给你解释
AI 行程助手:
- 用户:“我明天 9 点开会,提前 30 分钟提醒我”
- Agent:存储信息 → 调用时间提醒工具 → 到点提醒你
总结:Agent 不只是聊天机器人,而是可以自主完成任务的虚拟执行者
Agent 核心组件
组件 | 作用 |
---|---|
工具 Tool | 单个功能模块,如查天气、查汇率, 每个工具专注做一件事 |
代理类型 AgentType | 决定 Agent 如何”思考”和”推理”, 常见的有 ReAct(反应式推理) |
大语言模型 LLM | Agent 的大脑,负责理解和推理, 常用模型如 qwen-turbo |
initialize_agent | 把大脑(LLM)和工具们组合起来, 生成一个能跑的智能助手 |
ReAct 架构
Agent = 带工具箱的智能助理
- Reason(思考):模型在脑子里分析你要干嘛
- Act(行动):模型调用一个工具,比如查天气
- ReAct 架构:就是“思考+行动”的循环