追踪
Agents SDK内置追踪功能,会收集智能体运行期间事件的完整记录:LLM生成、工具调用、任务转移、安全防护措施,甚至包括发生的自定义事件。使用Traces 仪表板,你可以在开发和生产环境中调试、可视化并监控你的工作流。
Note
默认启用追踪。你可以通过三种常见方式禁用它:
- 你可以通过设置环境变量
OPENAI_AGENTS_DISABLE_TRACING=1全局禁用追踪 - 你可以在代码中使用
set_tracing_disabled(True)全局禁用追踪 - 你可以通过将
agents.run.RunConfig.tracing_disabled设置为True,为单次运行禁用追踪
对于使用OpenAI的API且遵循零数据保留(ZDR)政策的组织,追踪不可用。
追踪和Span
- 追踪(Traces)表示一次“工作流”的端到端操作。它们由Span组成。追踪具有以下属性:
workflow_name:这是逻辑工作流或应用。例如“代码生成”或“客户服务”。trace_id:追踪的唯一ID。如果未传入,会自动生成。格式必须为trace_<32_alphanumeric>。group_id:可选的组ID,用于关联来自同一对话的多个追踪。例如,你可以使用聊天线程ID。disabled:如果为 True,则不会记录该追踪。metadata:追踪的可选元数据。
- Span表示具有开始和结束时间的操作。Span具有:
started_at和ended_at时间戳。trace_id,表示它们所属的追踪parent_id,指向此Span的父Span(如果有)span_data,即有关该Span的信息。例如,AgentSpanData包含有关智能体的信息,GenerationSpanData包含有关LLM生成的信息,等等。
默认追踪
默认情况下,SDK会追踪以下内容:
- 整个
Runner.{run, run_sync, run_streamed}()都会包装在trace()中。 - 每次智能体运行时,都会包装在
agent_span()中 - LLM生成会包装在
generation_span()中 - 每个函数工具调用都会包装在
function_span()中 - 安全防护措施会包装在
guardrail_span()中 - 任务转移会包装在
handoff_span()中 - 音频输入(语音转文本)会包装在
transcription_span()中 - 音频输出(文本转语音)会包装在
speech_span()中 - 相关音频Span可能会以
speech_group_span()为父级
默认情况下,追踪名为“Agent workflow”。如果使用 trace,你可以设置此名称;也可以使用 RunConfig 配置名称和其他属性。
此外,你可以设置自定义追踪进程,将追踪推送到其他目标位置(作为替代目标或辅助目标)。
长时间运行的工作进程与即时导出
默认的 BatchTraceProcessor 会每隔几秒在后台导出追踪,
或者在内存队列达到其大小触发阈值时更早导出,
并且还会在进程退出时执行最终刷新。在 Celery、
RQ、Dramatiq 或 FastAPI 后台任务等长时间运行的工作进程中,这意味着追踪通常会自动导出,
无需任何额外代码,但它们可能不会在每个作业完成后立即出现在 Traces 仪表板中。
如果你需要在一个工作单元结束时获得即时交付保证,请在追踪上下文退出后调用
flush_traces()。
from agents import Runner, flush_traces, trace
@celery_app.task
def run_agent_task(prompt: str):
try:
with trace("celery_task"):
result = Runner.run_sync(agent, prompt)
return result.final_output
finally:
flush_traces()
from fastapi import BackgroundTasks, FastAPI
from agents import Runner, flush_traces, trace
app = FastAPI()
def process_in_background(prompt: str) -> None:
try:
with trace("background_job"):
Runner.run_sync(agent, prompt)
finally:
flush_traces()
@app.post("/run")
async def run(prompt: str, background_tasks: BackgroundTasks):
background_tasks.add_task(process_in_background, prompt)
return {"status": "queued"}
flush_traces() 会阻塞,直到当前缓冲的追踪和Span
导出完成,因此请在 trace() 关闭后调用它,以避免刷新尚未完全构建的追踪。如果默认导出延迟可以接受,
则可以跳过此调用。
更高层级的追踪
有时,你可能希望对 run() 的多次调用成为单个追踪的一部分。你可以通过将整个代码包装在 trace() 中来实现。
from agents import Agent, Runner, trace
async def main():
agent = Agent(name="Joke generator", instructions="Tell funny jokes.")
with trace("Joke workflow"): # (1)!
first_result = await Runner.run(agent, "Tell me a joke")
second_result = await Runner.run(agent, f"Rate this joke: {first_result.final_output}")
print(f"Joke: {first_result.final_output}")
print(f"Rating: {second_result.final_output}")
- 因为对
Runner.run的两次调用都包装在with trace()中,所以各个运行会成为整体追踪的一部分,而不是创建两个追踪。
追踪的创建
你可以使用 trace() 函数创建追踪。追踪需要启动和结束。你有两个选项可以做到这一点:
- 推荐:将追踪用作上下文管理器,即
with trace(...) as my_trace。这会在正确的时间自动启动和结束追踪。 - 你也可以手动调用
trace.start()和trace.finish()。
当前追踪通过 Python contextvar 进行记录。这意味着它可以自动适配并发场景。如果你手动启动/结束追踪,需要向 start()/finish() 传入 mark_as_current 和 reset_current,以更新当前追踪。
Span的创建
你可以使用各种 *_span() 方法来创建Span。一般来说,你不需要手动创建Span。可以使用 custom_span() 函数来记录自定义Span信息。
Span会自动成为当前追踪的一部分,并嵌套在最近的当前Span下;最近的当前Span通过 Python contextvar 进行记录。
敏感数据
某些Span可能会捕获潜在敏感数据。
generation_span() 会存储LLM生成的输入/输出,function_span() 会存储函数调用的输入/输出。这些可能包含敏感数据,因此你可以通过 RunConfig.trace_include_sensitive_data 禁用对此类数据的捕获。
同样,默认情况下,音频Span包含输入和输出音频的 base64 编码PCM数据。你可以通过配置 VoicePipelineConfig.trace_include_sensitive_audio_data 来禁用对此音频数据的捕获。
默认情况下,trace_include_sensitive_data 为 True。你可以在运行应用之前导出 OPENAI_AGENTS_TRACE_INCLUDE_SENSITIVE_DATA 环境变量并将其设为 true/1 或 false/0,从而无需代码即可设置默认值。
自定义追踪进程
追踪的高层架构如下:
- 初始化时,我们会创建一个全局 [
TraceProvider][agents.tracing.setup.TraceProvider],它负责创建追踪。 - 我们使用
BatchTraceProcessor配置TraceProvider,后者会将追踪/Span批量发送到BackendSpanExporter;该导出器会将Span和追踪批量导出到OpenAI后端。
若要自定义此默认设置,将追踪发送到替代或额外后端,或修改导出器行为,你有两个选项:
add_trace_processor()允许你添加一个额外的追踪进程,它会在追踪和Span就绪时接收它们。这样除了将追踪发送到OpenAI后端外,你还可以执行自己的处理。set_trace_processors()允许你用自己的追踪进程替换默认进程。这意味着,除非你包含一个会执行此操作的TracingProcessor,否则追踪不会发送到OpenAI后端。
非OpenAI模型的追踪
你可以将OpenAI API密钥与非OpenAI模型一起使用,以在OpenAI Traces 仪表板中启用免费追踪,而无需禁用追踪。有关适配器选择和设置注意事项,请参阅模型指南中的第三方适配器部分。
import os
from agents import set_tracing_export_api_key, Agent, Runner
from agents.extensions.models.any_llm_model import AnyLLMModel
tracing_api_key = os.environ["OPENAI_API_KEY"]
set_tracing_export_api_key(tracing_api_key)
model = AnyLLMModel(
model="your-provider/your-model-name",
api_key="your-api-key",
)
agent = Agent(
name="Assistant",
model=model,
)
如果你只需要为单次运行使用不同的追踪密钥,请通过 RunConfig 传入,而不是更改全局导出器。
from agents import Runner, RunConfig
await Runner.run(
agent,
input="Hello",
run_config=RunConfig(tracing={"api_key": "sk-tracing-123"}),
)
其他说明
- 在Openai Traces 仪表板查看免费追踪。
生态系统集成
以下社区和供应商集成支持OpenAI Agents SDK的追踪接口。