빠른 시작

베타 기능

샌드박스 에이전트는 베타 버전입니다. 정식 출시 전까지 API 세부 정보, 기본값, 지원 기능이 변경될 수 있으며, 시간이 지나면서 더 고급 기능이 추가될 수 있습니다.

최신 에이전트는 파일 시스템의 실제 파일을 다룰 수 있을 때 가장 효과적으로 작동합니다. Agents SDK의 샌드박스 에이전트는 모델이 대규모 문서 집합을 검색하고, 파일을 편집하고, 명령을 실행하고, 결과물을 생성하고, 저장된 샌드박스 상태에서 작업을 다시 이어갈 수 있는 영구 워크스페이스를 제공합니다.

SDK는 파일 스테이징, 파일 시스템 도구, 셸 액세스, 샌드박스 수명 주기, 스냅샷, 공급자별 연동 코드를 직접 구성하지 않아도 이러한 실행 하네스를 제공합니다. 기존 Agent 및 Runner 흐름을 유지하면서 워크스페이스용 Manifest, 샌드박스 네이티브 도구용 기능, 작업 실행 위치를 지정하는 SandboxRunConfig를 추가하면 됩니다.

사전 요구 사항

Python 3.10 이상
OpenAI Agents SDK에 대한 기본적인 이해
샌드박스 클라이언트. 로컬 개발의 경우 UnixLocalSandboxClient로 시작합니다.

설치

SDK를 아직 설치하지 않았다면 다음을 실행합니다.

pip install openai-agents

Docker 기반 샌드박스의 경우:

pip install "openai-agents[docker]"

로컬 샌드박스 에이전트 생성

이 예제는 로컬 저장소를 repo/ 아래에 스테이징하고, 로컬 스킬을 지연 로드하며, 러너가 실행을 위한 Unix 로컬 샌드박스 세션을 생성하도록 합니다.

import asyncio
from pathlib import Path

from agents import Runner
from agents.run import RunConfig
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
from agents.sandbox.capabilities import Capabilities, LocalDirLazySkillSource, Skills
from agents.sandbox.entries import LocalDir
from agents.sandbox.sandboxes.unix_local import UnixLocalSandboxClient

EXAMPLE_DIR = Path(__file__).resolve().parent
HOST_REPO_DIR = EXAMPLE_DIR / "repo"
HOST_SKILLS_DIR = EXAMPLE_DIR / "skills"


def build_agent(model: str) -> SandboxAgent[None]:
    return SandboxAgent(
        name="Sandbox engineer",
        model=model,
        instructions=(
            "Read `repo/task.md` before editing files. Stay grounded in the repository, preserve "
            "existing behavior, and mention the exact verification command you ran. "
            "If you edit files with apply_patch, paths are relative to the sandbox workspace root."
        ),
        default_manifest=Manifest(
            entries={
                "repo": LocalDir(src=HOST_REPO_DIR),
            }
        ),
        capabilities=Capabilities.default() + [
            Skills(
                lazy_from=LocalDirLazySkillSource(
                    # This is a host path read by the SDK process.
                    # Requested skills are copied into `skills_path` in the sandbox.
                    source=LocalDir(src=HOST_SKILLS_DIR),
                )
            ),
        ],
    )


async def main() -> None:
    result = await Runner.run(
        build_agent("gpt-5.6-sol"),
        "Open `repo/task.md`, fix the issue, run the targeted test, and summarize the change.",
        run_config=RunConfig(
            sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
            workflow_name="Sandbox coding example",
        ),
    )
    print(result.final_output)


if __name__ == "__main__":
    asyncio.run(main())

examples/sandbox/docs/coding_task.py를 참고하세요. 이 예제는 Unix 로컬 실행에서 결정론적으로 검증할 수 있도록 셸 기반의 작은 저장소를 사용합니다.

핵심 선택 사항

기본 실행이 정상적으로 작동한 후 일반적으로 고려하는 선택 사항은 다음과 같습니다.

default_manifest: 새로운 샌드박스 세션에 사용할 파일, 저장소, 디렉터리, 마운트
instructions: 여러 프롬프트에 공통으로 적용할 간단한 워크플로 규칙
base_instructions: SDK 샌드박스 프롬프트를 대체하기 위한 고급 확장 수단
capabilities: 파일 시스템 편집/이미지 검사, 셸, 스킬, 메모리, 압축과 같은 샌드박스 네이티브 도구
run_as: 모델이 사용하는 도구의 샌드박스 사용자 ID
SandboxRunConfig.client: 샌드박스 백엔드
SandboxRunConfig.session, session_state, 또는 snapshot: 후속 실행이 이전 작업에 다시 연결되는 방식

다음 단계

개념: 매니페스트, 기능, 권한, 스냅샷, 실행 구성, 구성 패턴을 이해합니다.
샌드박스 클라이언트: Unix 로컬, Docker, 호스팅 공급자 및 마운트 전략을 선택합니다.
에이전트 메모리: 이전 샌드박스 실행에서 얻은 내용을 보존하고 재사용합니다.

셸 액세스가 가끔 사용하는 도구 중 하나일 뿐이라면 도구 가이드의 호스팅 셸로 시작하세요. 워크스페이스 격리, 샌드박스 클라이언트 선택 또는 샌드박스 세션 재개 동작이 설계의 일부라면 샌드박스 에이전트를 사용하세요.