コンテンツにスキップ

エージェントの実行

エージェントはそれ自体では何もしません。Runner クラスまたは run() ユーティリティで 実行 します。

ターンの実行、イベントのストリーミング、会話状態の管理を行いたくなったら、エージェント の後にこのページを読んでください。エージェントをどのように定義するかをまだ検討している場合は、まず エージェント から始めてください。

シンプルな実行
import { Agent, run } from '@openai/agents';
const agent = new Agent({
name: 'Assistant',
instructions: 'You are a helpful assistant',
});
const result = await run(
agent,
'Write a haiku about recursion in programming.',
);
console.log(result.finalOutput);
// Code within the code,
// Functions calling themselves,
// Infinite loop's dance.

カスタム runner が不要な場合は、シングルトンのデフォルト Runner インスタンスを実行する run() ユーティリティも使用できます。

または、独自の Runner インスタンスを作成できます。

シンプルな実行
import { Agent, Runner } from '@openai/agents';
const agent = new Agent({
name: 'Assistant',
instructions: 'You are a helpful assistant',
});
// You can pass custom configuration to the runner
const runner = new Runner();
const result = await runner.run(
agent,
'Write a haiku about recursion in programming.',
);
console.log(result.finalOutput);
// Code within the code,
// Functions calling themselves,
// Infinite loop's dance.

エージェントを実行すると、最終出力と実行の完全な履歴を含む エージェントの実行結果 オブジェクトを受け取ります。

Runner の run メソッドを使用するときは、開始エージェントと入力を渡します。入力は文字列(ユーザーメッセージとして扱われます)または入力項目のリストにできます。これらの項目は OpenAI Responses API の項目です。

runner は次のループを実行します。

  1. 現在の入力で現在のエージェントのモデルを呼び出します。
  2. LLM のレスポンスを調べます。
    • 最終出力 → 返します。
    • ハンドオフ → 新しいエージェントに切り替え、蓄積された会話履歴を維持し、1 に戻ります。
    • ツール呼び出し → ツールを実行し、その実行結果を会話に追加し、1 に戻ります。
  3. maxTurnsnull でない限り、maxTurns に達すると MaxTurnsExceededError をスローします。

アプリの起動時に Runner を作成し、リクエスト間で再利用してください。このインスタンスは、モデルプロバイダーやトレーシングオプションなどのグローバル設定を保存します。完全に異なる設定が必要な場合にのみ、別の Runner を作成してください。シンプルなスクリプトでは、内部的にデフォルト runner を使用する run() を呼び出すこともできます。

run() メソッドには、実行を開始する初期エージェント、実行用の入力、一連のオプションを渡します。

入力は、文字列(ユーザーメッセージとして扱われます)、入力項目 のリスト、または 人間の介入(HITL) エージェントを構築している場合は RunState オブジェクトにできます。

追加オプションは次のとおりです。

オプションデフォルト説明
streamfalsetrue の場合、呼び出しは StreamedRunResult を返し、モデルから到着したイベントを順次発行します。
contextすべてのツール / ガードレール / ハンドオフに転送されるコンテキストオブジェクトです。詳細は コンテキスト管理 を参照してください。
maxTurns10安全上の制限です。到達すると MaxTurnsExceededError をスローします。制限を無効にするには null を渡します。
signalキャンセル用の AbortSignal です。
sessionセッション永続化の実装です。セッション を参照してください。
sessionInputCallbackセッション履歴と新しい入力をマージするカスタムロジックです。モデル呼び出しの前に実行されます。セッション を参照してください。
callModelInputFilterモデルを呼び出す直前にモデル入力(項目 + 任意の instructions)を編集するフックです。モデル入力フィルターの呼び出し を参照してください。
toolErrorFormatterモデルへ返されるツール承認拒否メッセージをカスタマイズするフックです。ツールエラーフォーマッター を参照してください。
reasoningItemIdPolicy以前の実行項目がモデル入力に戻されるときに、reasoning item の id を保持するか省略するかを制御します。Reasoning item ID ポリシー を参照してください。
tracing実行単位のトレーシング設定の上書き(例: エクスポート用 API キー)です。
sandboxSandboxAgent 実行用のサンドボックスクライアント、ライブセッション、セッション状態、スナップショット、マニフェスト上書き、または同時実行制限です。コンセプト を参照してください。
toolExecutionローカルツール呼び出しの SDK 側実行設定です。一度に実行する関数ツールの数を制限するには toolExecution.maxFunctionToolConcurrency を使用します。
errorHandlersサポートされているランタイムエラー(現在は maxTurns)のハンドラーです。エラーハンドラー を参照してください。
conversationIdサーバー側の会話を再利用します(OpenAI Responses API + Conversations API のみ)。
previousResponseId会話を作成せず、前回の Responses API 呼び出しから継続します(OpenAI Responses API のみ)。

ストリーミングを使うと、LLM の実行中にストリーミングイベントも受け取れます。ストリームが開始されると、StreamedRunResult には、生成されたすべての新しい出力を含む実行に関する完全な情報が含まれます。for await ループを使用してストリーミングイベントを反復処理できます。詳細は ストリーミング を参照してください。

独自の Runner インスタンスを作成する場合、runner を設定するために RunConfig オブジェクトを渡せます。

フィールド目的
modelstring | Model実行内の すべて のエージェントに特定のモデルを強制します。
modelProviderModelProviderモデル名を解決します。デフォルトは OpenAI プロバイダーです。
modelSettingsModelSettingsエージェントごとの設定を上書きするグローバルな調整パラメーターです。オプトインの再試行設定を含む詳細は、モデル を参照してください。
handoffInputFilterHandoffInputFilterハンドオフの実行時に入力項目を変更します(ハンドオフ自体でまだ定義されていない場合)。
inputGuardrailsInputGuardrail[]初期 ユーザー入力に適用されるガードレールです。
outputGuardrailsOutputGuardrail[]最終 出力に適用されるガードレールです。
tracingDisabledbooleanOpenAI トレーシングを完全に無効化します。
traceIncludeSensitiveDatabooleanスパンは出力しつつ、LLM/ツールの入力と出力をトレースから除外します。
workflowNamestringトレースダッシュボードに表示され、関連する実行のグループ化に役立ちます。
traceId / groupIdstringSDK に生成させる代わりに、トレース ID またはグループ ID を手動で指定します。
traceMetadataRecord<string, string>すべてのスパンに付与する任意のメタデータです。
tracingTracingConfig実行単位のトレーシング上書き(例: エクスポート用 API キー)です。
sessionInputCallbackSessionInputCallbackこの runner 上のすべての実行に対するデフォルトの履歴マージ戦略です。
callModelInputFilterCallModelInputFilter各モデル呼び出しの前にモデル入力を編集するグローバルフックです。
toolErrorFormatterToolErrorFormatterモデルへ返されるツール承認拒否メッセージをカスタマイズするグローバルフックです。
reasoningItemIdPolicyReasoningItemIdPolicy生成済み項目を後続のモデル呼び出しへ再生するときに、reasoning item の id を保持するか省略するかのデフォルトポリシーです。
sandboxSandboxRunConfigSandboxAgent 実行用のデフォルトサンドボックスランタイム設定です。
toolExecutionToolExecutionConfigローカルツール呼び出しのデフォルトの SDK 側実行設定です。maxFunctionToolConcurrency は、各ターンでのローカル関数ツールの同時実行数に上限を設定します。未設定または null の場合、そのターンで出力されたすべての関数ツール呼び出しを開始します。

toolExecution.maxFunctionToolConcurrency1 以上の整数である必要があります。この設定は、ローカル関数ツールの SDK 側実行のみを制限します。プロバイダー側の modelSettings.parallelToolCalls は変更しません。

状態を次のターンに引き継ぐ一般的な方法は 4 つあります。

戦略状態の保存場所最適な用途次のターンで渡すもの
result.historyアプリのメモリ小規模なチャットループ、完全な手動制御、任意のプロバイダーresult.history
sessionストレージ + SDK永続的なチャット状態、再開可能な実行、カスタムストア同じ session インスタンス(またはストアに裏付けられたもの)
conversationIdOpenAI Conversations APIワーカー/サービス間で共有するサーバー側状態同じ conversationId と新しいユーザーターンのみ
previousResponseIdOpenAI Responses API のみ会話を作成せずに、サーバー管理で最もシンプルに継続する場合result.lastResponseId と新しいユーザーターンのみ

result.historysession はクライアント管理です。conversationIdpreviousResponseId は OpenAI 管理で、OpenAI Responses API を使用している場合にのみ適用されます。ほとんどのアプリケーションでは、会話ごとに永続化戦略を 1 つ選びます。クライアント管理の履歴とサーバー管理の状態を混在させると、両方の層を意図的に照合している場合を除き、コンテキストが重複する可能性があります。

サンドボックスエージェントには、ライブサンドボックスワークスペースという別の状態レイヤーが追加されます。会話履歴には通常の SDK sessionconversationId、または previousResponseId を使用し、サンドボックスファイルシステムの状態には sandbox.sessionsandbox.sessionStateRunState、またはスナップショットを使用します。ワークスペースのライフサイクルについては、コンセプト を参照してください。

runner.run()(または run() ユーティリティ)を呼び出すたびに、アプリケーションレベルの会話における 1 つの ターン を表します。RunResult のどの範囲をエンドユーザーに表示するかは選択できます。finalOutput だけを表示する場合もあれば、生成されたすべての項目を表示する場合もあります。

会話履歴の引き継ぎ例
import { Agent, run } from '@openai/agents';
import type { AgentInputItem } from '@openai/agents';
let thread: AgentInputItem[] = [];
const agent = new Agent({
name: 'Assistant',
});
async function userSays(text: string) {
const result = await run(
agent,
thread.concat({ role: 'user', content: text }),
);
thread = result.history; // Carry over history + newly generated items
return result.finalOutput;
}
await userSays('What city is the Golden Gate Bridge in?');
// -> "San Francisco"
await userSays('What state is it in?');
// -> "California"

インタラクティブなバージョンについては、チャットのコード例 を参照してください。

毎ターン、ローカルの会話履歴全体を送信する代わりに、OpenAI Responses API に会話履歴を永続化させることができます。これは、長い会話や複数のサービスを調整している場合に便利です。以下のどちらのサーバー管理方式でも、各リクエストでは新しいターンの入力のみを渡します。API が以前の状態を再利用します。詳細は Conversation state ガイド を参照してください。

OpenAI では、サーバー側状態を再利用する方法を 2 つ提供しています。

1. 会話全体のための conversationId
Section titled “1. 会話全体のための conversationId”

Conversations API を使用して会話を一度作成し、その ID をすべてのターンで再利用できます。SDK は新しく生成された項目だけを自動的に含めます。

サーバー会話の再利用
import { Agent, run } from '@openai/agents';
import { OpenAI } from 'openai';
const agent = new Agent({
name: 'Assistant',
instructions: 'Reply very concisely.',
});
async function main() {
// Create a server-managed conversation:
const client = new OpenAI();
const { id: conversationId } = await client.conversations.create({});
const first = await run(agent, 'What city is the Golden Gate Bridge in?', {
conversationId,
});
console.log(first.finalOutput);
// -> "San Francisco"
const second = await run(agent, 'What state is it in?', { conversationId });
console.log(second.finalOutput);
// -> "California"
}
main().catch(console.error);
2. 前回のターンから継続するための previousResponseId
Section titled “2. 前回のターンから継続するための previousResponseId”

そもそも Responses API のみで始めたい場合は、前回のレスポンスから返された ID を使用して各リクエストをチェーンできます。これにより、完全な会話リソースを作成せずに、ターン間でコンテキストを維持できます。

previousResponseId によるチェーン
import { Agent, run } from '@openai/agents';
const agent = new Agent({
name: 'Assistant',
instructions: 'Reply very concisely.',
});
async function main() {
const first = await run(agent, 'What city is the Golden Gate Bridge in?');
console.log(first.finalOutput);
// -> "San Francisco"
const previousResponseId = first.lastResponseId;
const second = await run(agent, 'What state is it in?', {
previousResponseId,
});
console.log(second.finalOutput);
// -> "California"
}
main().catch(console.error);

conversationIdpreviousResponseId は同時に使用できません。システム間で共有できる名前付きの会話リソースが必要な場合は conversationId を使用し、1 つのレスポンスから次のレスポンスへ継続するための最も軽量な SDK レベルの基本コンポーネントだけが必要な場合は previousResponseId を使用します。

モデル入力フィルターの呼び出し

Section titled “モデル入力フィルターの呼び出し”

callModelInputFilter を使用すると、モデルが呼び出される 直前 にモデル入力を編集できます。このフックは、現在のエージェント、コンテキスト、結合された入力項目(存在する場合はセッション履歴を含む)を受け取ります。更新された input 配列と任意の instructions を返して、機密データの編集、古いメッセージの削除、追加のシステムガイダンスの注入を行います。

実行ごとに runner.run(..., { callModelInputFilter }) で設定するか、Runner 設定(RunConfigcallModelInputFilter)のデフォルトとして設定します。

戻り値は ModelInputData オブジェクト、つまり { input: AgentInputItem[], instructions? } である必要があります。input フィールドは必須で、配列でなければなりません。これ以外の形を返すと UserError がスローされます。

SDK は、フィルターを呼び出す前に準備済みのターン入力をクローンします。session も使用している場合、フィルター適用後のクローンが永続化されるため、ここで適用された編集や切り詰めは、保存されるセッション履歴にも反映されます。

conversationId または previousResponseId を使用する場合、このフックは次の Responses API 呼び出し用に準備されたペイロードに対して実行されます。以前のサーバー管理コンテキストは API によって復元されるため、その呼び出しのフィルター済み配列は、以前の履歴全体の再生ではなく、新しいターンの差分だけをすでに表している場合があります。この最終フィルターステップの前に、保存済み履歴と現在のターンのマージ方法を変更する必要がある場合は、sessionInputCallback を使用します。

toolErrorFormatter を使用すると、ツール呼び出しが拒否されたときにモデルへ送り返される承認拒否メッセージをカスタマイズできます。これにより、SDK のデフォルトメッセージではなく、ドメイン固有の文言(例: コンプライアンスガイダンス)を返せます。

formatter は、実行ごと(runner.run(..., { toolErrorFormatter }))または RunConfignew Runner(...)toolErrorFormatter)でグローバルに設定できます。

この formatter は承認拒否に対するグローバルなフォールバックです。特定の中断を result.state.reject(interruption, { message: '...' }) で拒否した場合、その呼び出しごとの messagetoolErrorFormatter より優先されます。どちらも指定されていない場合、SDK はデフォルトの拒否テキスト Tool execution was not approved. にフォールバックします。

formatter は現在、approval_rejected イベントで実行され、次を受け取ります。

  • kind(現在は常に 'approval_rejected'
  • toolType'function''computer''shell'、または 'apply_patch'
  • toolName
  • callId
  • defaultMessage(SDK のフォールバックメッセージ。現在は Tool execution was not approved.
  • runContext

メッセージを上書きするには文字列を返し、SDK のデフォルトを維持するには undefined を返します。formatter がスローした場合(または文字列以外の値を返した場合)、SDK は警告をログに記録し、デフォルトの承認拒否メッセージにフォールバックします。

reasoningItemIdPolicy を使用すると、SDK が以前に生成された実行項目を後続のモデル入力用に AgentInputItem[] へ戻すときに、reasoning item の id フィールドを保持するかどうかを制御できます。

これは、SDK が生成済みモデル項目を入力として再生する場所に影響します。たとえば次のような場合です。

  • 同じ実行内のフォローアップモデル呼び出し(例: ツール実行後)
  • 生成済み項目を入力/履歴として再利用する後続ターン
  • 保存済み RunState から再開された実行
  • result.history / result.output のような派生の実行結果ビュー(モデル入力の形をした配列)
  • 'preserve'(デフォルト)は reasoning item ID を保持します。
  • 'omit' は reasoning item が入力として送り返される前に id フィールドを削除します。
  • reasoning 以外の項目は影響を受けません。

これによって 変更されない もの:

  • 元のモデルレスポンス(result.rawResponses
  • 実行項目(result.newItems
  • プロバイダーから返されるモデルの現在ターンの出力

言い換えると、このポリシーは SDK が以前に生成された項目から 次の入力 を構築するときに適用されます。

ポリシーは、実行ごと(runner.run(..., { reasoningItemIdPolicy: 'omit' }))または runner のデフォルト(new Runner({ reasoningItemIdPolicy: 'omit', ... }))として設定できます。保存済み RunState から再開する場合、上書きしない限り、以前に解決されたポリシーが再利用されます。

reasoningItemIdPolicycallModelInputFilter の前に適用されます。カスタム動作が必要な場合でも、callModelInputFilter は準備済み入力を検査し、モデル呼び出しの前に reasoning ID を手動で再導入または削除できます。

再生される reasoning item を ID なしで正規化したい場合(例: 転送/再生されるモデル入力をよりシンプルに保つため、またはアプリのパイプラインにおける連携要件に合わせるため)は、'omit' を使用します。

また、バックエンド/プロバイダーが再生された reasoning item をリクエスト検証エラーで拒否する場合(例: フォローアップ入力内の reasoning item ID に関連する HTTP 400 エラー)にも、便利なトラブルシューティングオプションです。そのような場合、'omit' で再生された reasoning ID を削除すると、バックエンドが新しいリクエストでは無効と扱う ID の送信を避けられます。

SDK に再生入力を通して reasoning item ID を引き継がせたい場合、かつ連携先がそれを受け入れる場合は、'preserve' のままにしてください。

errorHandlers を使用すると、サポートされているランタイムエラーをスローする代わりに、最終出力へ変換できます。サポートされているキーは maxTurnsmodelRefusal です。

  • errorHandlers.maxTurns は最大ターン数エラーのみを処理します。
  • errorHandlers.modelRefusalModelRefusalError として表面化したモデル拒否を処理します。
  • errorHandlers.default は、サポートされている種類のフォールバックとして使用されます。
  • ハンドラーは { error, context, runData } を受け取り、{ finalOutput, includeInHistory? } を返せます。

SDK は、catch できる少数のエラーをスローします。

すべて基本 AgentsError クラスを拡張しており、現在の実行状態にアクセスするための state プロパティを提供する場合があります。

以下は GuardrailExecutionError を処理するコード例です。入力ガードレールは最初のユーザー入力でしか実行されないため、この例では元の入力とコンテキストで実行を再開します。また、保存済み状態を再利用して、モデルを再度呼び出さずに出力ガードレールをリトライする方法も示しています。

ガードレール実行エラー
import {
Agent,
GuardrailExecutionError,
InputGuardrail,
InputGuardrailTripwireTriggered,
OutputGuardrail,
OutputGuardrailTripwireTriggered,
run,
} from '@openai/agents';
import { z } from 'zod';
// Shared guardrail agent to avoid re-creating it on every fallback run.
const guardrailAgent = new Agent({
name: 'Guardrail check',
instructions: 'Check if the user is asking you to do their math homework.',
outputType: z.object({
isMathHomework: z.boolean(),
reasoning: z.string(),
}),
});
async function main() {
const input = 'Hello, can you help me solve for x: 2x + 3 = 11?';
const context = { customerId: '12345' };
// Input guardrail example
const unstableInputGuardrail: InputGuardrail = {
name: 'Math Homework Guardrail (unstable)',
execute: async () => {
throw new Error('Something is wrong!');
},
};
const fallbackInputGuardrail: InputGuardrail = {
name: 'Math Homework Guardrail (fallback)',
execute: async ({ input, context }) => {
const result = await run(guardrailAgent, input, { context });
const isMathHomework =
result.finalOutput?.isMathHomework ??
/solve for x|math homework/i.test(JSON.stringify(input));
return {
outputInfo: result.finalOutput,
tripwireTriggered: isMathHomework,
};
},
};
const agent = new Agent({
name: 'Customer support agent',
instructions:
'You are a customer support agent. You help customers with their questions.',
inputGuardrails: [unstableInputGuardrail],
});
try {
// Input guardrails only run on the first turn of a run, so retries must start a fresh run.
await run(agent, input, { context });
} catch (e) {
if (e instanceof GuardrailExecutionError) {
console.error(`Guardrail execution failed (input): ${e}`);
try {
agent.inputGuardrails = [fallbackInputGuardrail];
// Retry from scratch with the original input and context.
await run(agent, input, { context });
} catch (ee) {
if (ee instanceof InputGuardrailTripwireTriggered) {
console.log('Math homework input guardrail tripped on retry');
} else {
throw ee;
}
}
} else {
throw e;
}
}
// Output guardrail example
const replyOutputSchema = z.object({ reply: z.string() });
const unstableOutputGuardrail: OutputGuardrail<typeof replyOutputSchema> = {
name: 'Answer review (unstable)',
execute: async () => {
throw new Error('Output guardrail crashed.');
},
};
const fallbackOutputGuardrail: OutputGuardrail<typeof replyOutputSchema> = {
name: 'Answer review (fallback)',
execute: async ({ agentOutput }) => {
const outputText =
typeof agentOutput === 'string'
? agentOutput
: (agentOutput?.reply ?? JSON.stringify(agentOutput));
const flagged = /math homework|solve for x|x =/i.test(outputText);
return {
outputInfo: { flaggedOutput: outputText },
tripwireTriggered: flagged,
};
},
};
const agent2 = new Agent<unknown, typeof replyOutputSchema>({
name: 'Customer support agent (output check)',
instructions: 'You are a customer support agent. Answer briefly.',
outputType: replyOutputSchema,
outputGuardrails: [unstableOutputGuardrail],
});
try {
await run(agent2, input, { context });
} catch (e) {
if (e instanceof GuardrailExecutionError && e.state) {
console.error(`Guardrail execution failed (output): ${e}`);
try {
agent2.outputGuardrails = [fallbackOutputGuardrail];
// Output guardrails can be retried using the saved state without another model call.
await run(agent2, e.state);
} catch (ee) {
if (ee instanceof OutputGuardrailTripwireTriggered) {
console.log('Output guardrail tripped after retry with saved state');
} else {
throw ee;
}
}
} else {
throw e;
}
}
}
main().catch(console.error);

入力と出力のリトライ:

  • 入力ガードレールは実行の最初のユーザー入力でしか実行されないため、同じ入力/コンテキストで新しい実行を開始してリトライする必要があります。保存済みの state を渡しても、入力ガードレールは再トリガーされません。
  • 出力ガードレールはモデルレスポンスの後に実行されるため、GuardrailExecutionError の保存済み state を再利用して、別のモデル呼び出しなしで出力ガードレールを再実行できます。

上記の例を実行すると、次の出力が表示されます。

Guardrail execution failed (input): Error: Input guardrail failed to complete: Error: Something is wrong!
Math homework input guardrail tripped on retry
Guardrail execution failed (output): Error: Output guardrail failed to complete: Error: Output guardrail crashed.
Output guardrail tripped after retry with saved state