콘텐츠로 이동

휴먼인더루프 (HITL)

휴먼인더루프 (HITL) 플로우를 사용하면 사람이 민감한 도구 호출을 승인하거나 거부할 때까지 에이전트 실행을 일시 정지할 수 있습니다. 도구는 언제 승인이 필요한지 선언하고, 실행 결과는 보류 중인 승인을 인터럽션(중단 처리)으로 노출하며, RunState 를 사용하면 결정이 내려진 뒤 실행을 직렬화하고 재개할 수 있습니다.

승인이 필요한 도구 표시

needs_approvalTrue 로 설정하면 항상 승인이 필요하게 할 수 있고, 호출별로 판단하는 비동기 함수를 제공할 수도 있습니다. 이 callable 은 실행 컨텍스트, 파싱된 도구 매개변수, 그리고 도구 호출 ID 를 전달받습니다.

from agents import Agent, Runner, function_tool


@function_tool(needs_approval=True)
async def cancel_order(order_id: int) -> str:
    return f"Cancelled order {order_id}"


async def requires_review(_ctx, params, _call_id) -> bool:
    return "refund" in params.get("subject", "").lower()


@function_tool(needs_approval=requires_review)
async def send_email(subject: str, body: str) -> str:
    return f"Sent '{subject}'"


agent = Agent(
    name="Support agent",
    instructions="Handle tickets and ask for approval when needed.",
    tools=[cancel_order, send_email],
)

needs_approvalfunction_tool, Agent.as_tool, ShellTool, ApplyPatchTool 에서 사용할 수 있습니다. 로컬 MCP 서버도 MCPServerStdio, MCPServerSse, MCPServerStreamableHttprequire_approval 을 통해 승인을 지원합니다. 호스티드 MCP 서버는 HostedMCPTooltool_config={"require_approval": "always"} 를 설정하고 선택적으로 on_approval_request 콜백을 제공하는 방식으로 승인을 지원합니다. Shell 및 apply_patch 도구는 인터럽션을 노출하지 않고 자동 승인 또는 자동 거부를 원할 경우 on_approval 콜백을 받을 수 있습니다.

승인 플로우 동작 방식

  1. 모델이 도구 호출을 내보내면, 러너가 needs_approval 를 평가합니다
  2. 해당 도구 호출에 대한 승인 결정이 이미 RunContextWrapper 에 저장되어 있다면(예: always_approve=True 로 인해), 러너는 프롬프트 없이 진행합니다. 호출별 승인은 특정 호출 ID 범위로 제한됩니다. 이후 호출을 자동으로 허용하려면 always_approve=True 를 사용하세요
  3. 그렇지 않으면 실행이 일시 정지되고, RunResult.interruptions (또는 RunResultStreaming.interruptions) 에 agent.name, name, arguments 등의 세부 정보를 포함한 ToolApprovalItem 항목이 들어갑니다
  4. result.to_state() 로 결과를 RunState 로 변환한 다음, state.approve(...) 또는 state.reject(...) 를 호출합니다(선택적으로 always_approve 또는 always_reject 를 전달). 그 후 Runner.run(agent, state) 또는 Runner.run_streamed(agent, state) 로 재개합니다
  5. 재개된 실행은 중단된 지점에서 계속되며, 새로운 승인이 필요하면 이 플로우로 다시 진입합니다

예시: 일시 정지, 승인, 재개

아래 스니펫은 JavaScript HITL 가이드를 그대로 따릅니다. 도구가 승인을 필요로 하면 일시 정지하고, 상태를 디스크에 저장한 뒤, 다시 불러와 결정을 수집한 후 재개합니다.

import asyncio
import json
from pathlib import Path

from agents import Agent, Runner, RunState, function_tool


async def needs_oakland_approval(_ctx, params, _call_id) -> bool:
    return "Oakland" in params.get("city", "")


@function_tool(needs_approval=needs_oakland_approval)
async def get_temperature(city: str) -> str:
    return f"The temperature in {city} is 20° Celsius"


agent = Agent(
    name="Weather assistant",
    instructions="Answer weather questions with the provided tools.",
    tools=[get_temperature],
)

STATE_PATH = Path(".cache/hitl_state.json")


def prompt_approval(tool_name: str, arguments: str | None) -> bool:
    answer = input(f"Approve {tool_name} with {arguments}? [y/N]: ").strip().lower()
    return answer in {"y", "yes"}


async def main() -> None:
    result = await Runner.run(agent, "What is the temperature in Oakland?")

    while result.interruptions:
        # Persist the paused state.
        state = result.to_state()
        STATE_PATH.parent.mkdir(parents=True, exist_ok=True)
        STATE_PATH.write_text(state.to_string())

        # Load the state later (could be a different process).
        stored = json.loads(STATE_PATH.read_text())
        state = await RunState.from_json(agent, stored)

        for interruption in result.interruptions:
            approved = await asyncio.get_running_loop().run_in_executor(
                None, prompt_approval, interruption.name or "unknown_tool", interruption.arguments
            )
            if approved:
                state.approve(interruption, always_approve=False)
            else:
                state.reject(interruption)

        result = await Runner.run(agent, state)

    print(result.final_output)


if __name__ == "__main__":
    asyncio.run(main())

이 예시에서 prompt_approvalinput() 을 사용하고 run_in_executor(...) 로 실행되므로 동기식입니다. 승인 소스가 이미 비동기식이라면(예: HTTP 요청 또는 async 데이터베이스 쿼리), 대신 async def 함수를 사용하고 직접 await 할 수 있습니다.

승인을 기다리는 동안 출력을 스트리밍하려면 Runner.run_streamed 를 호출하고, 완료될 때까지 result.stream_events() 를 소비한 다음, 위에 나온 동일한 result.to_state() 및 재개 단계를 따르세요.

이 저장소의 다른 패턴

  • 스트리밍 승인: examples/agent_patterns/human_in_the_loop_stream.pystream_events() 를 모두 소진한 다음, 보류 중인 도구 호출을 승인하고 Runner.run_streamed(agent, state) 로 재개하는 방법을 보여줍니다
  • 도구로서의 에이전트 승인: Agent.as_tool(..., needs_approval=...) 는 위임된 에이전트 작업에 검토가 필요할 때 동일한 인터럽션 플로우를 적용합니다
  • Shell 및 apply_patch 도구: ShellToolApplyPatchToolneeds_approval 를 지원합니다. 향후 호출을 위해 결정을 캐시하려면 state.approve(interruption, always_approve=True) 또는 state.reject(..., always_reject=True) 를 사용하세요. 자동 결정을 위해서는 on_approval 를 제공하세요(examples/tools/shell.py 참조). 수동 결정을 위해서는 인터럽션을 처리하세요(examples/tools/shell_human_in_the_loop.py 참조)
  • 로컬 MCP 서버: MCPServerStdio / MCPServerSse / MCPServerStreamableHttp 에서 require_approval 을 사용해 MCP 도구 호출을 게이트할 수 있습니다(examples/mcp/get_all_mcp_tools_example/main.pyexamples/mcp/tool_filter_example/main.py 참조)
  • 호스티드 MCP 서버: HostedMCPTool 에서 require_approval"always" 로 설정해 HITL 을 강제하고, 선택적으로 on_approval_request 를 제공해 자동 승인 또는 거부를 할 수 있습니다(examples/hosted_mcp/human_in_the_loop.pyexamples/hosted_mcp/on_approval.py 참조). 신뢰할 수 있는 서버에는 "never" 를 사용하세요(examples/hosted_mcp/simple.py)
  • 세션 및 메모리: Runner.run 에 세션을 전달하면 승인과 대화 기록이 여러 턴에 걸쳐 유지됩니다. SQLite 및 OpenAI Conversations 세션 변형은 examples/memory/memory_session_hitl_example.pyexamples/memory/openai_session_hitl_example.py 에 있습니다
  • 실시간 에이전트: 실시간 데모는 RealtimeSessionapprove_tool_call / reject_tool_call 을 통해 도구 호출을 승인 또는 거부하는 WebSocket 메시지를 노출합니다(서버 측 핸들러는 examples/realtime/app/server.py 참조)

장기 실행 승인

RunState 는 내구성을 염두에 두고 설계되었습니다. state.to_json() 또는 state.to_string() 으로 보류 중인 작업을 데이터베이스나 큐에 저장하고, 나중에 RunState.from_json(...) 또는 RunState.from_string(...) 으로 다시 생성할 수 있습니다. 직렬화된 페이로드에 민감한 컨텍스트 데이터를 저장하고 싶지 않다면 context_override 를 전달하세요.

보류 작업 버전 관리

승인이 꽤 오래 대기할 수 있다면, 직렬화된 상태와 함께 에이전트 정의 또는 SDK 에 대한 버전 마커를 저장하세요. 그러면 모델, 프롬프트, 또는 도구 정의가 변경될 때 비호환성을 피하기 위해 역직렬화를 일치하는 코드 경로로 라우팅할 수 있습니다.