コンテンツにスキップ

エージェントオーケストレーション

オーケストレーションとは、アプリ内でのエージェントの流れを指します。どのエージェントを、どの順序で実行し、次に何が起こるかをどのように決定するか、ということです。エージェントをオーケストレーションする主な方法は 2 つあります:

  1. LLM に判断を任せる:LLM の知能を使って計画と推論を行い、それに基づいて取る手順を決定します。
  2. コードによるオーケストレーション:コードでエージェントの流れを決定します。

これらのパターンは組み合わせることができます。それぞれにトレードオフがあり、以下で説明します。

LLM によるオーケストレーション

エージェントとは、instructions、tools、ハンドオフを備えた LLM です。つまり、自由度の高いタスクが与えられた場合、LLM は、tools を使ってアクションを実行しデータを取得し、ハンドオフを使ってサブエージェントにタスクを委任しながら、そのタスクへの取り組み方を自律的に計画できます。たとえば、リサーチエージェントには次のようなツールを備えられます:

  • オンラインで情報を見つけるための Web 検索
  • 独自データや接続先を検索するためのファイル検索と取得
  • コンピューター上でアクションを実行するためのコンピュータ操作
  • データ分析を行うためのコード実行
  • 計画、レポート作成などに優れた専門エージェントへのハンドオフ。

コア SDK パターン

Python SDK では、次の 2 つのオーケストレーションパターンが最もよく登場します:

パターン 仕組み 最適な場合
Agents as tools マネージャーエージェントが会話の制御を維持し、Agent.as_tool() を通じて専門エージェントを呼び出します。 1 つのエージェントに最終回答を担わせたい場合、複数の専門エージェントからの出力を統合したい場合、または共通のガードレールを 1 か所で適用したい場合。
ハンドオフ トリアージエージェントが会話を専門エージェントにルーティングし、その専門エージェントがそのターンの残りでアクティブなエージェントになります。 専門エージェントに直接応答させたい場合、プロンプトを焦点の絞られた状態に保ちたい場合、またはマネージャーが結果を説明することなく instructions を切り替えたい場合。

専門エージェントが範囲の限定されたサブタスクを支援するべきだが、ユーザー向けの会話を引き継ぐべきではない場合は、 agents as tools を使用します。ルーティング自体がワークフローの一部であり、選ばれた専門エージェントにインタラクションの次の部分を担わせたい場合は、 ハンドオフ を使用します。

この 2 つを組み合わせることもできます。トリアージエージェントが専門エージェントにハンドオフし、その専門エージェントがさらに狭いサブタスクのために他のエージェントをツールとして呼び出すこともできます。

このパターンは、タスクの自由度が高く、LLM の知能に頼りたい場合に最適です。ここで最も重要な戦術は次のとおりです:

  1. 優れたプロンプトに投資します。利用できるツール、その使い方、そしてエージェントが従うべきパラメーターを明確にします。
  2. アプリを監視し、反復改善します。どこで問題が起こるかを確認し、プロンプトを改善します。
  3. エージェントが内省して改善できるようにします。たとえば、ループ内で実行して自己批評させる、またはエラーメッセージを提供して改善させます。
  4. 何でも得意であることを期待される汎用エージェントではなく、1 つのタスクに秀でた専門エージェントを用意します。
  5. evals に投資します。これにより、エージェントをトレーニングして改善し、タスクの遂行能力を高めることができます。

このスタイルのオーケストレーションを支えるコア SDK の基本コンポーネントを知りたい場合は、ツールハンドオフエージェントの実行 から始めてください。

コードによるオーケストレーション

LLM によるオーケストレーションは強力ですが、コードによるオーケストレーションは、速度、コスト、パフォーマンスの観点でタスクをより決定論的で予測可能にします。ここでの一般的なパターンは次のとおりです:

  • structured outputs を使って、コードで検査できる適切な形式のデータを生成します。たとえば、エージェントにタスクをいくつかのカテゴリーに分類させ、そのカテゴリーに基づいて次のエージェントを選択できます。
  • 複数のエージェントをチェーンし、あるエージェントの出力を次のエージェントの入力に変換します。ブログ記事を書くようなタスクを一連のステップに分解できます - リサーチする、アウトラインを書く、ブログ記事を書く、批評し、それから改善します。
  • タスクを実行するエージェントを while ループ内で、評価してフィードバックを提供するエージェントと一緒に実行し、評価者が出力が特定の基準を満たしたと言うまで続けます。
  • 複数のエージェントを並列に実行します。たとえば、asyncio.gather のような Python の基本コンポーネントを使います。これは、互いに依存しない複数のタスクがある場合に高速化に役立ちます。

examples/agent_patterns には多数のコード例があります。

関連ガイド

  • 構成パターンとエージェント設定については、エージェント を参照してください。
  • Agent.as_tool() とマネージャースタイルのオーケストレーションについては、ツール を参照してください。
  • 専門エージェント間の委任については、ハンドオフ を参照してください。
  • 実行ごとのオーケストレーション制御と会話状態については、エージェントの実行 を参照してください。
  • 最小限のエンドツーエンドのハンドオフ例については、クイックスタート を参照してください。