OpenAI Agents SDK
OpenAI Agents SDK は、抽象化を最小限に抑えた軽量で使いやすいパッケージで、エージェント型の AI アプリを構築できるようにします。これは、以前のエージェント実験である Swarm の本番対応アップグレードです。Agents SDK にはごく少数の基本コンポーネントがあります。
- エージェント: instructions と tools を備えた LLM
- ハンドオフ: 特定のタスクを他のエージェントに委譲できる仕組み
- ガードレール: エージェントの入力と出力の検証を可能にする仕組み
- セッション: エージェント実行をまたいで会話履歴を自動的に維持
Python と組み合わせると、これらの基本コンポーネントだけでツールとエージェント間の複雑な関係を表現でき、急な学習曲線なしに実運用アプリケーションを構築できます。さらに、SDK には組み込みの トレーシング があり、エージェントのフローを可視化・デバッグできるほか、評価やアプリケーション向けのモデルのファインチューニングまで行えます。
Agents SDK を使う理由
この SDK の設計原則は 2 つです。
- 使う価値がある十分な機能を提供しつつ、学習が速いよう基本コンポーネントは少数に保つ。
- そのままでも優れた体験を提供しつつ、動作を細部までカスタマイズ可能にする。
主な機能は次のとおりです。
- エージェントループ: ツールの呼び出し、結果の LLM への送信、LLM の完了までのループを処理する組み込みのエージェントループ。
- Python ファースト: 新しい抽象化を学ぶのではなく、言語の標準機能でエージェントのオーケストレーションや連携を記述。
- ハンドオフ: 複数のエージェント間の協調・委譲を可能にする強力な機能。
- ガードレール: エージェントと並行して入力のバリデーションやチェックを実行し、失敗時は早期に中断。
- セッション: エージェント実行をまたぐ会話履歴の自動管理により、手動の状態管理を不要に。
- 関数ツール: 任意の Python 関数をツールに変換し、スキーマの自動生成と Pydantic によるバリデーションを提供。
- トレーシング: ワークフローの可視化・デバッグ・監視に加え、OpenAI の評価・ファインチューニング・蒸留ツール群を活用可能。
インストール
Hello World の例
from agents import Agent, Runner
agent = Agent(name="Assistant", instructions="You are a helpful assistant")
result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)
# Code within the code,
# Functions calling themselves,
# Infinite loop's dance.
(これを実行する場合は、OPENAI_API_KEY
環境変数を設定してください)