追踪
Agents SDK 内置了追踪功能,可在智能体运行期间收集完整的事件记录:LLM 生成、工具调用、任务转移、安全防护措施,甚至发生的自定义事件。使用Traces 仪表板,你可以在开发和生产中调试、可视化并监控你的工作流。
Note
默认启用追踪。你可以通过三种常见方式禁用:
- 通过设置环境变量
OPENAI_AGENTS_DISABLE_TRACING=1全局禁用追踪 - 在代码中使用
set_tracing_disabled(True)全局禁用追踪 - 通过将
agents.run.RunConfig.tracing_disabled设为True,为单次运行禁用追踪
对于在 OpenAI API 上使用零数据保留(ZDR)策略运行的组织,追踪不可用。
Traces 与 spans
- Traces 表示“工作流”的一次端到端操作。它由 Span 组成。Trace 具有以下属性:
workflow_name:逻辑工作流或应用。例如“代码生成”或“客户服务”。trace_id:Trace 的唯一 ID。如果你未传入则自动生成。格式必须为trace_<32_alphanumeric>。group_id:可选分组 ID,用于关联同一会话中的多个 Trace。例如,你可以使用聊天线程 ID。disabled:若为 True,则不会记录该 Trace。metadata:Trace 的可选元数据。
- Spans 表示具有开始和结束时间的操作。Span 具有:
started_at和ended_at时间戳。trace_id,表示其所属的 Traceparent_id,指向该 Span 的父 Span(若有)span_data,即 Span 的信息。例如,AgentSpanData包含智能体信息,GenerationSpanData包含 LLM 生成信息,等等。
默认追踪
默认情况下,SDK 会追踪以下内容:
- 整个
Runner.{run, run_sync, run_streamed}()被包裹在trace()中。 - 每次智能体运行时,都会包裹在
agent_span()中 - LLM 生成包裹在
generation_span()中 - 每次函数工具调用都包裹在
function_span()中 - 安全防护措施包裹在
guardrail_span()中 - 任务转移包裹在
handoff_span()中 - 音频输入(语音转文本)包裹在
transcription_span()中 - 音频输出(文本转语音)包裹在
speech_span()中 - 相关音频 Span 可能作为
speech_group_span()的子级
默认情况下,Trace 名称为“Agent workflow”。如果你使用 trace,可以设置该名称;也可以通过RunConfig配置名称和其他属性。
此外,你还可以设置自定义追踪进程,将追踪发送到其他目标(作为替代目标或次要目标)。
更高层级的追踪
有时,你可能希望将多次 run() 调用纳入同一个 Trace。你可以通过将整段代码包裹在 trace() 中来实现。
from agents import Agent, Runner, trace
async def main():
agent = Agent(name="Joke generator", instructions="Tell funny jokes.")
with trace("Joke workflow"): # (1)!
first_result = await Runner.run(agent, "Tell me a joke")
second_result = await Runner.run(agent, f"Rate this joke: {first_result.final_output}")
print(f"Joke: {first_result.final_output}")
print(f"Rating: {second_result.final_output}")
- 因为这两次
Runner.run调用被包裹在with trace()中,所以这些单独运行会成为整体 Trace 的一部分,而不是创建两个 Trace。
创建 Trace
你可以使用 trace() 函数创建 Trace。Trace 需要被启动和结束。你有两种方式:
- 推荐:将 Trace 用作上下文管理器,即
with trace(...) as my_trace。这会在正确的时间自动启动和结束 Trace。 - 你也可以手动调用
trace.start()和trace.finish()。
当前 Trace 通过 Python 的 contextvar 跟踪。这意味着它可自动适配并发。如果你手动启动/结束 Trace,则需要向 start()/finish() 传递 mark_as_current 和 reset_current 来更新当前 Trace。
创建 Span
你可以使用各种 *_span() 方法创建 Span。通常你不需要手动创建 Span。可使用 custom_span() 函数来跟踪自定义 Span 信息。
Span 会自动归属于当前 Trace,并嵌套在最近的当前 Span 之下,后者通过 Python 的 contextvar 进行跟踪。
敏感数据
某些 Span 可能会捕获潜在的敏感数据。
generation_span() 会存储 LLM 生成的输入/输出,function_span() 会存储函数调用的输入/输出。这些可能包含敏感数据,因此你可以通过 RunConfig.trace_include_sensitive_data 禁用这类数据采集。
类似地,音频 Span 默认包含输入和输出音频的 base64 编码 PCM 数据。你可以通过配置 VoicePipelineConfig.trace_include_sensitive_audio_data 禁用该音频数据采集。
默认情况下,trace_include_sensitive_data 为 True。你可以在运行应用前,通过导出 OPENAI_AGENTS_TRACE_INCLUDE_SENSITIVE_DATA 环境变量为 true/1 或 false/0,在不改代码的情况下设置默认值。
自定义追踪进程
追踪的高层架构如下:
- 初始化时,我们会创建一个全局 [
TraceProvider][agents.tracing.setup.TraceProvider],负责创建 Trace。 - 我们为
TraceProvider配置一个BatchTraceProcessor,它会将 Trace/Span 批量发送给BackendSpanExporter,后者再将 Span 和 Trace 批量导出到 OpenAI 后端。
要自定义此默认设置,将追踪发送到替代或附加后端,或修改导出器行为,你有两个选项:
add_trace_processor()允许你添加一个额外的追踪进程,它会在 Trace 和 Span 就绪时接收它们。这样你就可以在发送到 OpenAI 后端之外执行自己的处理。set_trace_processors()允许你用自己的追踪进程替换默认进程。这意味着除非你包含可执行该操作的TracingProcessor,否则 Trace 不会发送到 OpenAI 后端。
对非 OpenAI 模型进行追踪
你可以将 OpenAI API key 与非 OpenAI 模型一起使用,从而在无需禁用追踪的情况下,在 OpenAI Traces 仪表板启用免费追踪。有关适配器选择和设置注意事项,请参阅 Models 指南中的第三方适配器部分。
import os
from agents import set_tracing_export_api_key, Agent, Runner
from agents.extensions.models.any_llm_model import AnyLLMModel
tracing_api_key = os.environ["OPENAI_API_KEY"]
set_tracing_export_api_key(tracing_api_key)
model = AnyLLMModel(
model="your-provider/your-model-name",
api_key="your-api-key",
)
agent = Agent(
name="Assistant",
model=model,
)
如果你只需为单次运行使用不同的追踪 key,请通过 RunConfig 传入,而不是更改全局导出器。
from agents import Runner, RunConfig
await Runner.run(
agent,
input="Hello",
run_config=RunConfig(tracing={"api_key": "sk-tracing-123"}),
)
附加说明
- 在 Openai Traces 仪表板查看免费追踪。
生态系统集成
以下社区和供应商集成支持 OpenAI Agents SDK 的追踪接口。