跳转至

智能体

智能体是应用中的核心构建块。智能体是一个大型语言模型(LLM),配置了instructions、tools,以及可选的运行时行为,例如任务转移、安全防护措施和structured outputs。

当你想定义或自定义单个普通Agent时,请使用本页。如果你正在决定多个智能体应如何协作,请阅读智能体编排。如果智能体应在包含由清单定义的文件和沙盒原生能力的隔离工作区内运行,请阅读沙盒智能体概念

对于OpenAI模型,SDK默认使用Responses API,但这里的区别在于编排:AgentRunner让SDK为你管理轮次、工具、安全防护措施、任务转移和会话。如果你想自行掌控该循环,请直接使用Responses API。

下一篇指南

将本页作为智能体定义的中心。跳转到与你接下来需要做出的决策相匹配的相邻指南。

如果你想要... 接下来阅读
选择模型或提供商设置 模型
为智能体添加能力 工具
让智能体针对真实代码仓库、文档包或隔离工作区运行 沙盒智能体快速入门
在管理器式编排与任务转移之间做决策 智能体编排
配置任务转移行为 任务转移
运行轮次、流式传输事件或管理对话状态 运行智能体
检查最终输出、运行项或可恢复状态 结果
共享本地依赖项和运行时状态 上下文管理

基本配置

智能体最常见的属性如下:

属性 必填 描述
name 人类可读的智能体名称。
instructions 系统提示词或动态instructions回调。强烈建议设置。参见动态instructions
prompt OpenAI Responses API prompt配置。接受静态prompt对象或函数。参见Prompt模板
handoff_description 当此智能体作为任务转移目标提供时公开的简短描述。
handoffs 将对话委派给专业智能体。参见任务转移
model 使用哪个LLM。参见模型
model_settings 模型调优参数,例如temperaturetop_ptool_choice
tools 智能体可调用的工具。参见工具
mcp_servers 由MCP支持的智能体工具。参见MCP指南
mcp_config 精细调整MCP工具的准备方式,例如严格的schema转换和MCP失败格式化。参见MCP指南
input_guardrails 在此智能体链的首个用户输入上运行的安全防护措施。参见安全防护措施
output_guardrails 在此智能体的最终输出上运行的安全防护措施。参见安全防护措施
output_type 使用结构化输出类型,而不是纯文本。参见输出类型
hooks 智能体作用域的生命周期回调。参见生命周期事件(hooks)
tool_use_behavior 控制工具结果是回传给模型还是结束运行。参见工具使用行为
reset_tool_choice 在工具调用后重置tool_choice(默认值:True),以避免工具使用循环。参见工具使用的强制
from agents import Agent, ModelSettings, function_tool

@function_tool
def get_weather(city: str) -> str:
    """returns weather info for the specified city."""
    return f"The weather in {city} is sunny"

agent = Agent(
    name="Haiku agent",
    instructions="Always respond in haiku form",
    model="gpt-5-nano",
    tools=[get_weather],
)

本节中的所有内容都适用于AgentSandboxAgent基于相同理念构建,并进一步添加了default_manifestbase_instructionscapabilitiesrun_as,用于工作区范围内的运行。参见沙盒智能体概念

Prompt模板

你可以通过设置prompt来引用在OpenAI平台中创建的prompt模板。此功能适用于使用Responses API的OpenAI模型。

要使用它,请:

  1. 前往https://platform.openai.com/playground/prompts
  2. 创建一个新的prompt变量poem_style
  3. 创建包含以下内容的系统提示词:

    Write a poem in {{poem_style}}
    
  4. 使用--prompt-id标志运行示例。

from agents import Agent

agent = Agent(
    name="Prompted assistant",
    prompt={
        "id": "pmpt_123",
        "version": "1",
        "variables": {"poem_style": "haiku"},
    },
)

你也可以在运行时动态生成prompt:

from dataclasses import dataclass

from agents import Agent, GenerateDynamicPromptData, Runner

@dataclass
class PromptContext:
    prompt_id: str
    poem_style: str


async def build_prompt(data: GenerateDynamicPromptData):
    ctx: PromptContext = data.context.context
    return {
        "id": ctx.prompt_id,
        "version": "1",
        "variables": {"poem_style": ctx.poem_style},
    }


agent = Agent(name="Prompted assistant", prompt=build_prompt)
result = await Runner.run(
    agent,
    "Say hello",
    context=PromptContext(prompt_id="pmpt_123", poem_style="limerick"),
)

上下文

智能体在其context类型上是泛型的。Context是一种依赖注入工具:它是你创建并传递给Runner.run()的对象,会被传递给每个智能体、工具、任务转移等,并充当智能体运行所需依赖项和状态的容器。你可以将任何Python对象作为context提供。

阅读上下文指南,了解完整的RunContextWrapper接口、共享用量跟踪、嵌套的tool_input以及序列化注意事项。

@dataclass
class UserContext:
    name: str
    uid: str
    is_pro_user: bool

    async def fetch_purchases() -> list[Purchase]:
        return ...

agent = Agent[UserContext](
    ...,
)

输出类型

默认情况下,智能体生成纯文本(即str)输出。如果你希望智能体生成特定类型的输出,可以使用output_type参数。常见选择是使用Pydantic对象,但我们支持任何可封装在Pydantic TypeAdapter中的类型——dataclasses、lists、TypedDict等。

from pydantic import BaseModel
from agents import Agent


class CalendarEvent(BaseModel):
    name: str
    date: str
    participants: list[str]

agent = Agent(
    name="Calendar extractor",
    instructions="Extract calendar events from text",
    output_type=CalendarEvent,
)

Note

当你传入output_type时,这会告知模型使用structured outputs,而不是常规的纯文本响应。

多智能体系统设计模式

设计多智能体系统有很多方式,但我们通常看到两种广泛适用的模式:

  1. 管理器(agents as tools):中央管理器/编排器将专业子智能体作为工具调用,并保留对对话的控制权。
  2. 任务转移:对等智能体将控制权转交给接管对话的专业智能体。这是去中心化的。

更多详情请参阅我们关于构建智能体的实践指南

管理器(agents as tools)

customer_facing_agent处理所有用户交互,并调用以工具形式公开的专业子智能体。请在工具文档中阅读更多内容。

from agents import Agent

booking_agent = Agent(...)
refund_agent = Agent(...)

customer_facing_agent = Agent(
    name="Customer-facing agent",
    instructions=(
        "Handle all direct user communication. "
        "Call the relevant tools when specialized expertise is needed."
    ),
    tools=[
        booking_agent.as_tool(
            tool_name="booking_expert",
            tool_description="Handles booking questions and requests.",
        ),
        refund_agent.as_tool(
            tool_name="refund_expert",
            tool_description="Handles refund questions and requests.",
        )
    ],
)

任务转移

任务转移对象是智能体可以委派给的子智能体。当发生任务转移时,被委派的智能体会接收对话历史并接管对话。此模式支持模块化的专业智能体,使其能够在单一任务上表现出色。请在任务转移文档中阅读更多内容。

from agents import Agent

booking_agent = Agent(...)
refund_agent = Agent(...)

triage_agent = Agent(
    name="Triage agent",
    instructions=(
        "Help the user with their questions. "
        "If they ask about booking, hand off to the booking agent. "
        "If they ask about refunds, hand off to the refund agent."
    ),
    handoffs=[booking_agent, refund_agent],
)

动态instructions

在大多数情况下,你可以在创建智能体时提供instructions。不过,你也可以通过函数提供动态instructions。该函数将接收智能体和context,并且必须返回prompt。常规函数和async函数均可接受。

def dynamic_instructions(
    context: RunContextWrapper[UserContext], agent: Agent[UserContext]
) -> str:
    return f"The user's name is {context.context.name}. Help them with their questions."


agent = Agent[UserContext](
    name="Triage agent",
    instructions=dynamic_instructions,
)

生命周期事件(hooks)

有时,你希望观察智能体的生命周期。例如,你可能希望在某些事件发生时记录日志、预取数据或记录用量。

有两个hook作用域:

  • RunHooks观察整个Runner.run(...)调用,包括到其他智能体的任务转移。
  • AgentHooks通过agent.hooks附加到特定智能体实例。

回调上下文也会根据事件而变化:

  • 智能体开始/结束hook接收AgentHookContext,它包装你的原始context并携带共享的运行用量状态。
  • LLM、工具和任务转移hook接收RunContextWrapper

典型hook时机:

  • on_agent_start / on_agent_end:当某个特定智能体开始或完成生成最终输出时。
  • on_llm_start / on_llm_end:紧邻每次模型调用前后。
  • on_tool_start / on_tool_end:围绕每次本地工具调用。 对于工具调用,hook的context通常是ToolContext,因此你可以检查诸如tool_call_id之类的工具调用元数据。
  • on_handoff:当控制权从一个智能体移动到另一个智能体时。

当你希望为整个工作流设置单一观察者时,使用RunHooks;当某个智能体需要自定义副作用时,使用AgentHooks

from agents import Agent, RunHooks, Runner


class LoggingHooks(RunHooks):
    async def on_agent_start(self, context, agent):
        print(f"Starting {agent.name}")

    async def on_llm_end(self, context, agent, response):
        print(f"{agent.name} produced {len(response.output)} output items")

    async def on_agent_end(self, context, agent, output):
        print(f"{agent.name} finished with usage: {context.usage}")


agent = Agent(name="Assistant", instructions="Be concise.")
result = await Runner.run(agent, "Explain quines", hooks=LoggingHooks())
print(result.final_output)

完整的回调接口请参见生命周期API参考

安全防护措施

安全防护措施允许你在智能体运行的同时对用户输入执行检查/验证,并在智能体输出生成后对其执行检查/验证。例如,你可以筛查用户输入和智能体输出的相关性。请在安全防护措施文档中阅读更多内容。

智能体的克隆/复制

通过在智能体上使用clone()方法,你可以复制一个Agent,并可选择更改任何你需要的属性。

pirate_agent = Agent(
    name="Pirate",
    instructions="Write like a pirate",
    model="gpt-5.5",
)

robot_agent = pirate_agent.clone(
    name="Robot",
    instructions="Write like a robot",
)

工具使用的强制

提供工具列表并不总意味着LLM会使用工具。你可以通过设置ModelSettings.tool_choice来强制使用工具。有效值为:

  1. auto,允许LLM自行决定是否使用工具。
  2. required,要求LLM使用工具(但它可以智能地决定使用哪个工具)。
  3. none,要求LLM_不_使用工具。
  4. 设置特定字符串,例如my_tool,要求LLM使用该特定工具。

使用OpenAI Responses工具搜索时,命名工具选择会受到更多限制:你不能通过tool_choice定位裸命名空间名称或仅延迟工具,并且tool_choice="tool_search"不会定位ToolSearchTool。在这些情况下,优先使用autorequired。参见托管工具搜索,了解Responses特定的约束。

from agents import Agent, Runner, function_tool, ModelSettings

@function_tool
def get_weather(city: str) -> str:
    """Returns weather info for the specified city."""
    return f"The weather in {city} is sunny"

agent = Agent(
    name="Weather Agent",
    instructions="Retrieve weather details.",
    tools=[get_weather],
    model_settings=ModelSettings(tool_choice="get_weather")
)

工具使用行为

Agent配置中的tool_use_behavior参数控制工具输出的处理方式:

  • "run_llm_again":默认值。运行工具,并由LLM处理结果以生成最终响应。
  • "stop_on_first_tool":第一个工具调用的输出会被用作最终响应,不再经过LLM进一步处理。
from agents import Agent, Runner, function_tool, ModelSettings

@function_tool
def get_weather(city: str) -> str:
    """Returns weather info for the specified city."""
    return f"The weather in {city} is sunny"

agent = Agent(
    name="Weather Agent",
    instructions="Retrieve weather details.",
    tools=[get_weather],
    tool_use_behavior="stop_on_first_tool"
)
  • StopAtTools(stop_at_tool_names=[...]):如果调用了任何指定工具,则停止,并将其输出用作最终响应。
from agents import Agent, Runner, function_tool
from agents.agent import StopAtTools

@function_tool
def get_weather(city: str) -> str:
    """Returns weather info for the specified city."""
    return f"The weather in {city} is sunny"

@function_tool
def sum_numbers(a: int, b: int) -> int:
    """Adds two numbers."""
    return a + b

agent = Agent(
    name="Stop At Stock Agent",
    instructions="Get weather or sum numbers.",
    tools=[get_weather, sum_numbers],
    tool_use_behavior=StopAtTools(stop_at_tool_names=["get_weather"])
)
  • ToolsToFinalOutputFunction:一个自定义函数,用于处理工具结果并决定是停止还是继续使用LLM。
from agents import Agent, Runner, function_tool, FunctionToolResult, RunContextWrapper
from agents.agent import ToolsToFinalOutputResult
from typing import List, Any

@function_tool
def get_weather(city: str) -> str:
    """Returns weather info for the specified city."""
    return f"The weather in {city} is sunny"

def custom_tool_handler(
    context: RunContextWrapper[Any],
    tool_results: List[FunctionToolResult]
) -> ToolsToFinalOutputResult:
    """Processes tool results to decide final output."""
    for result in tool_results:
        if result.output and "sunny" in result.output:
            return ToolsToFinalOutputResult(
                is_final_output=True,
                final_output=f"Final weather: {result.output}"
            )
    return ToolsToFinalOutputResult(
        is_final_output=False,
        final_output=None
    )

agent = Agent(
    name="Weather Agent",
    instructions="Retrieve weather details.",
    tools=[get_weather],
    tool_use_behavior=custom_tool_handler
)

Note

为防止无限循环,框架会在工具调用后自动将tool_choice重置为"auto"。此行为可通过agent.reset_tool_choice配置。产生无限循环的原因是工具结果会发送给LLM,而LLM随后又因为tool_choice生成另一次工具调用,如此无穷无尽。