LiteLLM による任意モデルの利用

Note

LiteLLM 統合はベータ版です。特に小規模なモデルプロバイダーでは問題が発生する可能性があります。問題があれば Github issues から報告してください。迅速に修正します。

LiteLLM は、単一のインターフェースで 100 以上のモデルを利用できるライブラリです。Agents SDK には LiteLLM 統合が追加されており、任意の AI モデルを利用できます。

セットアップ

litellm が利用可能である必要があります。オプションの litellm 依存関係グループをインストールしてください。

pip install "openai-agents[litellm]"

完了したら、任意のエージェントで LitellmModel を使用できます。

例

これは完全に動作する例です。実行すると、モデル名と API キーの入力を求められます。たとえば、次を入力できます。

openai/gpt-4.1（モデル）と OpenAI の API キー
anthropic/claude-3-5-sonnet-20240620（モデル）と Anthropic の API キー
など

LiteLLM でサポートされているモデルの一覧は、litellm providers docs を参照してください。

from __future__ import annotations

import asyncio

from agents import Agent, Runner, function_tool, set_tracing_disabled
from agents.extensions.models.litellm_model import LitellmModel

@function_tool
def get_weather(city: str):
    print(f"[debug] getting weather for {city}")
    return f"The weather in {city} is sunny."


async def main(model: str, api_key: str):
    agent = Agent(
        name="Assistant",
        instructions="You only respond in haikus.",
        model=LitellmModel(model=model, api_key=api_key),
        tools=[get_weather],
    )

    result = await Runner.run(agent, "What's the weather in Tokyo?")
    print(result.final_output)


if __name__ == "__main__":
    # First try to get model/api key from args
    import argparse

    parser = argparse.ArgumentParser()
    parser.add_argument("--model", type=str, required=False)
    parser.add_argument("--api-key", type=str, required=False)
    args = parser.parse_args()

    model = args.model
    if not model:
        model = input("Enter a model name for Litellm: ")

    api_key = args.api_key
    if not api_key:
        api_key = input("Enter an API key for Litellm: ")

    asyncio.run(main(model, api_key))

使用状況データの追跡

LiteLLM のレスポンスを Agents SDK の使用状況メトリクスに反映させたい場合は、エージェント作成時に ModelSettings(include_usage=True) を渡してください。

from agents import Agent, ModelSettings
from agents.extensions.models.litellm_model import LitellmModel

agent = Agent(
    name="Assistant",
    model=LitellmModel(model="your/model", api_key="..."),
    model_settings=ModelSettings(include_usage=True),
)

include_usage=True を指定すると、LiteLLM のリクエストは組み込みの OpenAI モデルと同様に、result.context_wrapper.usage を通じてトークン数とリクエスト数を報告します。