智能体
智能体是应用中的核心构建块。一个智能体是配置了 instructions 和工具的大型语言模型(LLM)。
基本配置
你最常为智能体配置的属性包括:
name: 一个必填字符串,用于标识你的智能体。instructions: 也称为开发者消息或系统提示词(system prompt)。model: 使用哪个 LLM,以及可选的model_settings来配置如 temperature、top_p 等模型调优参数。tools: 智能体为完成任务可使用的工具。
from agents import Agent, ModelSettings, function_tool
@function_tool
def get_weather(city: str) -> str:
"""returns weather info for the specified city."""
return f"The weather in {city} is sunny"
agent = Agent(
name="Haiku agent",
instructions="Always respond in haiku form",
model="gpt-5-nano",
tools=[get_weather],
)
上下文
智能体在其 context 类型上是泛型的。Context 是一种依赖注入工具:这是你创建并传递给 Runner.run() 的对象,它会传给每个智能体、工具、任务转移等,并作为本次运行的依赖与状态集合。你可以提供任何 Python 对象作为上下文。
@dataclass
class UserContext:
name: str
uid: str
is_pro_user: bool
async def fetch_purchases() -> list[Purchase]:
return ...
agent = Agent[UserContext](
...,
)
输出类型
默认情况下,智能体输出纯文本(即 str)。如果你希望智能体产生特定类型的输出,可以使用 output_type 参数。常见的做法是使用 Pydantic 对象,但我们支持任何可被 Pydantic TypeAdapter 包装的类型——比如 dataclasses、list、TypedDict 等。
from pydantic import BaseModel
from agents import Agent
class CalendarEvent(BaseModel):
name: str
date: str
participants: list[str]
agent = Agent(
name="Calendar extractor",
instructions="Extract calendar events from text",
output_type=CalendarEvent,
)
Note
当你传入 output_type 时,这会告诉模型使用 structured outputs 而不是常规纯文本响应。
多智能体系统设计模式
设计多智能体系统的方式很多,但我们常见到两种广泛适用的模式:
- 管理器(智能体作为工具):一个中心管理/编排器将专门的子智能体作为工具调用,并保留对会话的控制权。
- 任务转移:对等的智能体将控制权转移给某个专门的智能体,由其接管会话。这是去中心化的。
更多细节参见我们的智能体构建实用指南。
管理器(智能体作为工具)
customer_facing_agent 处理所有用户交互,并调用作为工具暴露的专门子智能体。更多内容参见 tools 文档。
from agents import Agent
booking_agent = Agent(...)
refund_agent = Agent(...)
customer_facing_agent = Agent(
name="Customer-facing agent",
instructions=(
"Handle all direct user communication. "
"Call the relevant tools when specialized expertise is needed."
),
tools=[
booking_agent.as_tool(
tool_name="booking_expert",
tool_description="Handles booking questions and requests.",
),
refund_agent.as_tool(
tool_name="refund_expert",
tool_description="Handles refund questions and requests.",
)
],
)
任务转移
任务转移是智能体可委派给的子智能体。当发生任务转移时,被委派的智能体会接收会话历史并接管会话。该模式支持模块化、专门化的智能体,在单一任务上表现出色。更多内容参见 handoffs 文档。
from agents import Agent
booking_agent = Agent(...)
refund_agent = Agent(...)
triage_agent = Agent(
name="Triage agent",
instructions=(
"Help the user with their questions. "
"If they ask about booking, hand off to the booking agent. "
"If they ask about refunds, hand off to the refund agent."
),
handoffs=[booking_agent, refund_agent],
)
动态 instructions
在大多数情况下,你可以在创建智能体时提供 instructions。你也可以通过函数提供动态 instructions。该函数将接收智能体和上下文,并必须返回提示词。支持常规和 async 函数。
def dynamic_instructions(
context: RunContextWrapper[UserContext], agent: Agent[UserContext]
) -> str:
return f"The user's name is {context.context.name}. Help them with their questions."
agent = Agent[UserContext](
name="Triage agent",
instructions=dynamic_instructions,
)
生命周期事件(hooks)
有时你希望观察智能体的生命周期。例如,你可能想记录事件,或在特定事件发生时预取数据。你可以通过 hooks 属性挂接到智能体生命周期。子类化 AgentHooks 类,并重写你感兴趣的方法。
安全防护措施
安全防护措施允许你在智能体运行的同时对用户输入进行检查/验证,并在智能体产出结果后对其输出进行检查。例如,你可以对用户输入和智能体输出进行相关性筛查。更多内容参见 guardrails 文档。
克隆/复制智能体
通过在智能体上使用 clone() 方法,你可以复制一个智能体,并可选地更改任意属性。
pirate_agent = Agent(
name="Pirate",
instructions="Write like a pirate",
model="gpt-4.1",
)
robot_agent = pirate_agent.clone(
name="Robot",
instructions="Write like a robot",
)
强制工具使用
提供工具列表并不总意味着 LLM 会使用工具。你可以通过设置 ModelSettings.tool_choice 来强制使用工具。可选值包括:
auto,允许 LLM 自行决定是否使用工具。required,要求 LLM 使用工具(但可智能选择使用哪一个)。none,要求 LLM 不 使用工具。- 设置特定字符串,例如
my_tool,要求 LLM 使用该特定工具。
from agents import Agent, Runner, function_tool, ModelSettings
@function_tool
def get_weather(city: str) -> str:
"""Returns weather info for the specified city."""
return f"The weather in {city} is sunny"
agent = Agent(
name="Weather Agent",
instructions="Retrieve weather details.",
tools=[get_weather],
model_settings=ModelSettings(tool_choice="get_weather")
)
工具使用行为
Agent 配置中的 tool_use_behavior 参数控制工具输出的处理方式:
"run_llm_again":默认值。运行工具后,LLM 处理结果以生成最终响应。"stop_on_first_tool":第一次工具调用的输出将作为最终响应,不再进行额外的 LLM 处理。
from agents import Agent, Runner, function_tool, ModelSettings
@function_tool
def get_weather(city: str) -> str:
"""Returns weather info for the specified city."""
return f"The weather in {city} is sunny"
agent = Agent(
name="Weather Agent",
instructions="Retrieve weather details.",
tools=[get_weather],
tool_use_behavior="stop_on_first_tool"
)
StopAtTools(stop_at_tool_names=[...]):当调用到任一指定工具时停止,并将其输出作为最终响应。
from agents import Agent, Runner, function_tool
from agents.agent import StopAtTools
@function_tool
def get_weather(city: str) -> str:
"""Returns weather info for the specified city."""
return f"The weather in {city} is sunny"
@function_tool
def sum_numbers(a: int, b: int) -> int:
"""Adds two numbers."""
return a + b
agent = Agent(
name="Stop At Stock Agent",
instructions="Get weather or sum numbers.",
tools=[get_weather, sum_numbers],
tool_use_behavior=StopAtTools(stop_at_tool_names=["get_weather"])
)
ToolsToFinalOutputFunction:自定义函数,用于处理工具结果,并决定是停止还是继续让 LLM 处理。
from agents import Agent, Runner, function_tool, FunctionToolResult, RunContextWrapper
from agents.agent import ToolsToFinalOutputResult
from typing import List, Any
@function_tool
def get_weather(city: str) -> str:
"""Returns weather info for the specified city."""
return f"The weather in {city} is sunny"
def custom_tool_handler(
context: RunContextWrapper[Any],
tool_results: List[FunctionToolResult]
) -> ToolsToFinalOutputResult:
"""Processes tool results to decide final output."""
for result in tool_results:
if result.output and "sunny" in result.output:
return ToolsToFinalOutputResult(
is_final_output=True,
final_output=f"Final weather: {result.output}"
)
return ToolsToFinalOutputResult(
is_final_output=False,
final_output=None
)
agent = Agent(
name="Weather Agent",
instructions="Retrieve weather details.",
tools=[get_weather],
tool_use_behavior=custom_tool_handler
)
Note
为防止无限循环,框架会在一次工具调用后自动将 tool_choice 重置为 "auto"。可通过 agent.reset_tool_choice 配置这一行为。产生无限循环的原因是工具结果会发送给 LLM,而由于 tool_choice 的设置,LLM 会再次生成工具调用,如此往复。