使用 Deep Agents 构建多智能体应用

从简单的提示词（Prompt）响应交互转向复杂的、自主的流式工作负载，标志着人工智能领域的下一个前沿。当面对多面性且复杂的任务时，单一模型的提示词往往难以胜任，而多智能体系统（Multi-Agent Systems）则通过将复杂性拆解为可管理的子任务来大显身手。在本指南中，我们将探讨如何利用 “Deep Agents” 的概念来构建稳健的多智能体应用——即能够进行深度推理和工具交互的专业化单元。

为了有效地构建这些系统，你需要一个可靠的基础设施。通过 n1n.ai 这样的统一提供商访问 DeepSeek-V3 或 Claude 3.5 Sonnet 等模型，可以确保你的智能体拥有实时协作所需的低延迟和高吞吐量。

为什么选择多智能体系统？

当任务需要超过 5-10 个连续步骤时，单智能体架构通常会遭遇“上下文漂移”和“推理疲劳”。多智能体系统通过以下方式解决这些问题：

专业化 (Specialization)：每个智能体被分配一个狭窄的角色（例如：研究员、编码员、审核员），从而实现更高的精度。
并行化 (Parallelization)：多个智能体可以同时处理独立的子任务，大幅缩短总执行时间。
错误修正 (Error Correction)：智能体可以相互审查工作，实现自我修复循环，从而提高输出质量。

核心架构：路由-执行者模式 (Router-Worker Pattern)

Deep Agents 最常见的模式是路由-执行者架构。在这种设置中，一个“主管（Supervisor）”智能体分析用户输入，并将其路由给专门的“执行者（Worker）”智能体。

对比：单智能体 vs 多智能体

特性	单智能体	多智能体 (Deep Agents)
复杂性处理	低（线性）	高（分支）
错误率	随任务长度增加而增加	通过交叉审核降低
延迟	初始延迟较低，总延迟较高	初始延迟较高，通过并行降低总延迟
模型灵活性	绑定单一模型	混合匹配（如：GPT-4o 路由，DeepSeek-V3 编码）

使用 n1n.ai，开发者可以在同一个应用中轻松地为不同的智能体更换模型，从而针对成本和性能进行优化。

使用 LangGraph 的实现指南

LangGraph 是构建循环智能体工作流的行业标准。下面是一个使用研究员（Researcher）和撰稿人（Writer）的 Deep Agent 系统的概念实现。

import operator
from typing import Annotated, Sequence, TypedDict
from langchain_core.messages import BaseMessage
from langgraph.graph import StateGraph, END

# 定义应用的状态
class AgentState(TypedDict):
    messages: Annotated[Sequence[BaseMessage], operator.add]
    current_task: str

# 定义研究员节点
def researcher(state: AgentState):
    # 使用通过 n1n.ai 提供的 DeepSeek-V3 进行深度研究的逻辑
    query = state['messages'][-1].content
    # 模拟 API 调用
    return {"messages": ["研究结果：" + query]}

# 定义撰稿人节点
def writer(state: AgentState):
    # 使用通过 n1n.ai 提供的 Claude 3.5 Sonnet 进行综合的逻辑
    context = state['messages'][-1].content
    return {"messages": ["基于以下内容的最终文章：" + context]}

# 构建图
workflow = StateGraph(AgentState)
workflow.add_node("researcher", researcher)
workflow.add_node("writer", writer)

workflow.set_entry_point("researcher")
workflow.add_edge("researcher", "writer")
workflow.add_edge("writer", END)

app = workflow.compile()

生产环境下的 Deep Agents 优化

从原型转向生产环境时，有几个关键因素决定了多智能体系统的成功：

1. Token 管理与上下文窗口

Deep Agents 在来回传递状态时会消耗大量的 Token。使用具有大上下文窗口和高效定价的模型至关重要。利用 n1n.ai 可以让你通过单一控制面板监控不同智能体的消耗情况，防止成本超支。

2. 延迟 < 500ms 的策略

对于交互式应用，首个 Token 的响应时间 (TTFT) 至关重要。如果你的主管智能体需要 3 秒钟来路由请求，用户体验将会受损。我们建议使用更小、更快的模型（如 Llama 3.1 8B）进行路由，并保留重型模型（如 OpenAI o3）处理实际的“深度”推理任务。

3. 状态持久化

在复杂的工作流中，智能体可能会失败。实现持久化层（如 LangGraph 中的 Checkpointers）允许系统从最后一个成功的节点恢复。这对于可能需要几分钟才能完成的长期研究任务尤为重要。

高级开发者的专业建议

人机协同 (Human-in-the-Loop)：始终包含一个“断点”，让人类在执行开始前批准智能体的计划。这可以防止智能体之间无限期相互纠正错误而产生的“幻觉循环”。
工具输出解析：使用 Pydantic 强制执行工具输出的 Schema。如果智能体期望 JSON 响应，请确保工具提供该响应，否则智能体会浪费 Token 尝试解析垃圾数据。
动态提示词：不要使用静态的系统提示词，而应使用“提示词链（Prompt Chaining）”，其中研究员智能体的输出可以动态更新撰稿人智能体的系统提示词。

结论

构建多智能体应用不再仅仅是一项实验性工作；它是企业级 AI 的必然要求。通过利用 LangGraph 等框架和 n1n.ai 等高速 API 聚合器，开发者可以创建比任何单一模型应用更可靠、更具扩展性且更智能的系统。

在 n1n.ai 获取免费 API 密钥。

参考来源：https://www.blog.langchain.com/building-multi-agent-applications-with-deep-agents/