コンテンツにスキップ

LiteLLM 経由の任意モデル利用

Note

これは LiteLLM のベータ版統合です。特に小規模なモデルプロバイダーでは問題が発生する可能性があります。問題があれば GitHub Issues からご報告ください。迅速に修正します。

LiteLLM は、1 つのインターフェースで 100 以上のモデルを利用できるライブラリです。Agents SDK では LiteLLM 統合を追加し、任意の AI モデルを利用できるようにしました。

セットアップ

litellm が利用可能であることを確認します。オプションの litellm 依存関係グループをインストールしてください。

pip install "openai-agents[litellm]"

完了したら、任意のエージェントで LitellmModel を使用できます。

これは完全に動作する例です。実行すると、モデル名と API キーの入力を求められます。例:

  • モデルに openai/gpt-4.1、OpenAI の API キー
  • モデルに anthropic/claude-3-5-sonnet-20240620、Anthropic の API キー
  • など

LiteLLM でサポートされているモデルの完全な一覧は、litellm providers docs を参照してください。

from __future__ import annotations

import asyncio

from agents import Agent, Runner, function_tool, set_tracing_disabled
from agents.extensions.models.litellm_model import LitellmModel

@function_tool
def get_weather(city: str):
    print(f"[debug] getting weather for {city}")
    return f"The weather in {city} is sunny."


async def main(model: str, api_key: str):
    agent = Agent(
        name="Assistant",
        instructions="You only respond in haikus.",
        model=LitellmModel(model=model, api_key=api_key),
        tools=[get_weather],
    )

    result = await Runner.run(agent, "What's the weather in Tokyo?")
    print(result.final_output)


if __name__ == "__main__":
    # First try to get model/api key from args
    import argparse

    parser = argparse.ArgumentParser()
    parser.add_argument("--model", type=str, required=False)
    parser.add_argument("--api-key", type=str, required=False)
    args = parser.parse_args()

    model = args.model
    if not model:
        model = input("Enter a model name for Litellm: ")

    api_key = args.api_key
    if not api_key:
        api_key = input("Enter an API key for Litellm: ")

    asyncio.run(main(model, api_key))

使用状況データの追跡

LiteLLM の応答で Agents SDK の使用状況メトリクスを集計したい場合は、エージェント作成時に ModelSettings(include_usage=True) を渡してください。

from agents import Agent, ModelSettings
from agents.extensions.models.litellm_model import LitellmModel

agent = Agent(
    name="Assistant",
    model=LitellmModel(model="your/model", api_key="..."),
    model_settings=ModelSettings(include_usage=True),
)

include_usage=True の場合、LiteLLM のリクエストは、組み込みの OpenAI モデルと同様に result.context_wrapper.usage を介してトークン数およびリクエスト数を報告します。