使用状況
Agents SDK は、すべての実行ごとにトークンの使用状況を自動追跡します。実行コンテキストから参照でき、コストの監視、制限の適用、分析の記録に使えます。
追跡項目
- requests: 実行された LLM API 呼び出し数
- input_tokens: 送信された入力トークン合計
- output_tokens: 受信した出力トークン合計
- total_tokens: 入力 + 出力
- details:
input_tokens_details.cached_tokensoutput_tokens_details.reasoning_tokens
実行からの使用状況へのアクセス
Runner.run(...) の後、result.context_wrapper.usage から使用状況にアクセスできます。
result = await Runner.run(agent, "What's the weather in Tokyo?")
usage = result.context_wrapper.usage
print("Requests:", usage.requests)
print("Input tokens:", usage.input_tokens)
print("Output tokens:", usage.output_tokens)
print("Total tokens:", usage.total_tokens)
使用状況は、実行中のすべてのモデル呼び出し(ツール呼び出しやハンドオフを含む)にわたって集計されます。
セッションでの使用状況へのアクセス
Session(例: SQLiteSession)を使用する場合、同一実行内の複数ターンにまたがって使用状況が蓄積されます。Runner.run(...) の各呼び出しは、その時点での実行の累積使用状況を返します。
session = SQLiteSession("my_conversation")
first = await Runner.run(agent, "Hi!", session=session)
print(first.context_wrapper.usage.total_tokens)
second = await Runner.run(agent, "Can you elaborate?", session=session)
print(second.context_wrapper.usage.total_tokens) # includes both turns
フックでの使用状況の利用
RunHooks を使用している場合、各フックに渡される context オブジェクトには usage が含まれます。これにより、重要なライフサイクルのタイミングで使用状況をログできます。