LiteLLM による任意モデルの利用
Note
LiteLLM 統合はベータ版です。特に小規模なモデルプロバイダーでは問題が発生する場合があります。問題があれば GitHub Issues に報告してください。迅速に修正します。
LiteLLM は、単一のインターフェースで 100 以上のモデルを利用できるライブラリです。Agents SDK に LiteLLM 統合を追加し、任意の AI モデルを使用できるようにしました。
セットアップ
litellm
が利用可能である必要があります。オプションの litellm
依存関係グループをインストールしてください:
完了したら、任意の エージェント で LitellmModel
を使用できます。
例
これは完全に動作する例です。実行すると、モデル名と API キーの入力を求められます。たとえば次のように入力できます:
openai/gpt-4.1
をモデルにし、OpenAI の API キーanthropic/claude-3-5-sonnet-20240620
をモデルにし、Anthropic の API キー- など
LiteLLM でサポートされているモデルの一覧は、litellm providers docs を参照してください。
from __future__ import annotations
import asyncio
from agents import Agent, Runner, function_tool, set_tracing_disabled
from agents.extensions.models.litellm_model import LitellmModel
@function_tool
def get_weather(city: str):
print(f"[debug] getting weather for {city}")
return f"The weather in {city} is sunny."
async def main(model: str, api_key: str):
agent = Agent(
name="Assistant",
instructions="You only respond in haikus.",
model=LitellmModel(model=model, api_key=api_key),
tools=[get_weather],
)
result = await Runner.run(agent, "What's the weather in Tokyo?")
print(result.final_output)
if __name__ == "__main__":
# First try to get model/api key from args
import argparse
parser = argparse.ArgumentParser()
parser.add_argument("--model", type=str, required=False)
parser.add_argument("--api-key", type=str, required=False)
args = parser.parse_args()
model = args.model
if not model:
model = input("Enter a model name for Litellm: ")
api_key = args.api_key
if not api_key:
api_key = input("Enter an API key for Litellm: ")
asyncio.run(main(model, api_key))
使用データのトラッキング
LiteLLM のレスポンスを Agents SDK の使用状況メトリクスに反映させたい場合は、エージェント作成時に ModelSettings(include_usage=True)
を渡してください。
from agents import Agent, ModelSettings
from agents.extensions.models.litellm_model import LitellmModel
agent = Agent(
name="Assistant",
model=LitellmModel(model="your/model", api_key="..."),
model_settings=ModelSettings(include_usage=True),
)
include_usage=True
を指定すると、LiteLLM のリクエストは、組み込みの OpenAI モデルと同様に、result.context_wrapper.usage
を通じてトークン数とリクエスト数を報告します。