通过 LiteLLM 使用任意模型

Note

LiteLLM 集成处于测试阶段。你在使用某些模型提供商（尤其是较小的提供商）时可能会遇到问题。请通过 Github issues 报告问题，我们会尽快修复。

LiteLLM 是一个库，允许你通过统一接口使用 100+ 模型。我们在 Agents SDK 中加入了 LiteLLM 集成，让你可以使用任意 AI 模型。

设置

你需要确保可用 litellm。可以通过安装可选的 litellm 依赖组来完成：

pip install "openai-agents[litellm]"

完成后，你可以在任意智能体中使用 LitellmModel。

示例

这是一个可直接运行的示例。运行后会提示输入模型名称和 API 密钥。例如，你可以输入：

openai/gpt-4.1 作为模型，以及你的 OpenAI API 密钥
anthropic/claude-3-5-sonnet-20240620 作为模型，以及你的 Anthropic API 密钥
等等

有关 LiteLLM 支持的完整模型列表，请参见 litellm providers 文档。

from __future__ import annotations

import asyncio

from agents import Agent, Runner, function_tool, set_tracing_disabled
from agents.extensions.models.litellm_model import LitellmModel

@function_tool
def get_weather(city: str):
    print(f"[debug] getting weather for {city}")
    return f"The weather in {city} is sunny."


async def main(model: str, api_key: str):
    agent = Agent(
        name="Assistant",
        instructions="You only respond in haikus.",
        model=LitellmModel(model=model, api_key=api_key),
        tools=[get_weather],
    )

    result = await Runner.run(agent, "What's the weather in Tokyo?")
    print(result.final_output)


if __name__ == "__main__":
    # First try to get model/api key from args
    import argparse

    parser = argparse.ArgumentParser()
    parser.add_argument("--model", type=str, required=False)
    parser.add_argument("--api-key", type=str, required=False)
    args = parser.parse_args()

    model = args.model
    if not model:
        model = input("Enter a model name for Litellm: ")

    api_key = args.api_key
    if not api_key:
        api_key = input("Enter an API key for Litellm: ")

    asyncio.run(main(model, api_key))

使用数据追踪

如果你希望 LiteLLM 的响应填充到 Agents SDK 的使用指标中，在创建智能体时传入 ModelSettings(include_usage=True)。

from agents import Agent, ModelSettings
from agents.extensions.models.litellm_model import LitellmModel

agent = Agent(
    name="Assistant",
    model=LitellmModel(model="your/model", api_key="..."),
    model_settings=ModelSettings(include_usage=True),
)

设置 include_usage=True 后，LiteLLM 请求会像内置的 OpenAI 模型一样，通过 result.context_wrapper.usage 报告 token 与请求计数。