コンテンツにスキップ

エージェントオーケストレーション

オーケストレーションとは、アプリ内でのエージェントの流れを指します。どのエージェントが、どの順番で実行され、次に何が起こるかをどのように決定するのでしょうか。エージェントをオーケストレーションする主な方法は 2 つあります。

このページは、クイックスタートまたはエージェントを読んだ後にお読みください。このページは、Agent コンストラクター自体ではなく、複数のエージェントにまたがるワークフロー設計について説明します。

  1. LLM に意思決定を任せる: LLM の知能を使って計画、推論し、それに基づいてどのステップを取るかを決定します。
  2. コードでオーケストレーションする: コードによってエージェントの流れを決定します。

これらのパターンは組み合わせて使用できます。それぞれにトレードオフがあり、以下で説明します。

LLM によるオーケストレーション

Section titled “LLM によるオーケストレーション”

エージェントは、指示、ツール、ハンドオフを備えた LLM です。つまり、オープンエンドなタスクが与えられると、LLM はツールを使ってアクションを実行したりデータを取得したりし、ハンドオフを使ってサブエージェントにタスクを委任しながら、タスクへの取り組み方を自律的に計画できます。たとえば、リサーチエージェントには次のようなツールを備えられます。

  • オンラインで情報を見つけるための Web 検索
  • 独自データや連携先を検索するためのファイル検索と取得
  • コンピュータ上でアクションを実行するためのコンピュータ操作
  • データ分析を行うためのコード実行
  • 計画やレポート作成などに優れた専門エージェントへのハンドオフ

Agents SDK では、次の 2 つのオーケストレーションパターンが最もよく使われます。

パターン仕組み最適なケース
Agents as toolsマネージャーエージェントが会話の制御を維持し、agent.asTool() を通じて専門エージェントを呼び出します。1 つのエージェントに最終回答を担わせたい場合、複数の専門エージェントからの出力を統合したい場合、または共有ガードレールを 1 か所で適用したい場合
ハンドオフトリアージエージェントが会話を専門エージェントにルーティングし、その専門エージェントがそのターンの残りでアクティブなエージェントになります。専門エージェントにユーザーへ直接応答させたい場合、プロンプトの焦点を保ちたい場合、または専門エージェントごとに異なる指示 / モデルを使いたい場合

agents as tools は、専門エージェントにサブタスクを手伝わせたいが、ユーザー向けの会話を引き継がせたくない場合に使います。マネージャーは、どのツールを呼び出すか、最終応答をどのように提示するかを決定する責任を持ち続けます。API の詳細はツールを、並列比較の例はエージェントを参照してください。

ハンドオフ は、ルーティング自体がワークフローの一部であり、選択された専門エージェントに会話の次の部分を担わせたい場合に使います。ハンドオフは、会話コンテキストを保持しながら、アクティブな指示を専門エージェント向けに絞り込みます。API についてはハンドオフを、最小のエンドツーエンドの例についてはクイックスタートを参照してください。

2 つのパターンを組み合わせることもできます。トリアージエージェントが専門エージェントにハンドオフし、その専門エージェントが限定されたサブタスクのために他のエージェントをツールとして引き続き使うこともできます。

このパターンは、タスクがオープンエンドで、LLM の知能に頼りたい場合に適しています。ここで最も重要な戦術は次のとおりです。

  1. 良いプロンプトに投資してください。利用可能なツール、その使い方、どのパラメーターの範囲内で動作すべきかを明確にします。
  2. アプリを監視して改善を繰り返してください。どこで問題が起きるかを確認し、プロンプトを反復改善します。
  3. エージェントが内省して改善できるようにしてください。たとえば、ループ内で実行して自己批評させる、またはエラーメッセージを提供して改善させます。
  4. 何でも得意であることを期待される汎用エージェントではなく、1 つのタスクに秀でた専門エージェントを用意してください。
  5. evals に投資してください。これにより、改善し、タスクにより熟達するようエージェントをトレーニングできます。

このスタイルのオーケストレーションを支える SDK の基本コンポーネントを知りたい場合は、ツールハンドオフエージェントの実行から始めてください。

コードによるオーケストレーション

Section titled “コードによるオーケストレーション”

LLM によるオーケストレーションは強力ですが、コードによるオーケストレーションでは、速度、コスト、パフォーマンスの面でタスクをより決定論的で予測可能にできます。一般的なパターンは次のとおりです。

  • structured outputs を使って、コードで検査できる適切な形式のデータを生成します。たとえば、エージェントにタスクをいくつかのカテゴリーに分類させ、そのカテゴリーに基づいて次のエージェントを選択できます。
  • あるエージェントの出力を次のエージェントの入力に変換して、複数のエージェントをチェーン化します。ブログ記事を書くようなタスクは、一連のステップ - リサーチ、アウトライン作成、ブログ記事の執筆、批評、改善 - に分解できます。
  • タスクを実行するエージェントを、評価してフィードバックを提供するエージェントと一緒に while ループで実行し、評価者が出力が特定の基準を満たしたと言うまで続けます。
  • 複数のエージェントを並列に実行します。たとえば、Promise.all のような JavaScript の基本コンポーネントを使います。互いに依存しない複数のタスクがある場合、速度の面で有用です。

examples/agent-patterns に多数のコード例があります。