빠른 시작
베타 기능
샌드박스 에이전트는 베타입니다. API, 기본값, 지원 기능의 세부 사항은 일반 공개 전까지 변경될 수 있으며, 시간이 지나면서 더 고급 기능이 추가될 예정입니다.
최신 에이전트는 파일 시스템의 실제 파일을 다룰 수 있을 때 가장 잘 작동합니다. Agents SDK의 샌드박스 에이전트는 모델에 영구 작업 공간을 제공하여 대규모 문서 집합을 검색하고, 파일을 편집하고, 명령을 실행하고, 아티팩트를 생성하고, 저장된 샌드박스 상태에서 작업을 다시 이어갈 수 있게 합니다.
SDK는 파일 스테이징, 파일 시스템 도구, 셸 접근, 샌드박스 수명 주기, 스냅샷, 공급자별 연결 코드를 직접 엮지 않아도 이러한 실행 하네스를 제공합니다. 일반적인 Agent 및 Runner 흐름을 유지한 다음, 작업 공간을 위한 Manifest, 샌드박스 네이티브 도구를 위한 기능, 작업이 실행될 위치를 위한 SandboxRunConfig를 추가하면 됩니다.
사전 요구 사항
- Python 3.10 이상
- OpenAI Agents SDK에 대한 기본적인 이해
- 샌드박스 클라이언트. 로컬 개발의 경우
UnixLocalSandboxClient로 시작하세요.
설치
아직 SDK를 설치하지 않았다면:
Docker 기반 샌드박스의 경우:
로컬 샌드박스 에이전트 생성
이 예제는 repo/ 아래에 로컬 리포지토리를 스테이징하고, 로컬 스킬을 지연 로드하며, 러너가 실행을 위한 Unix-local 샌드박스 세션을 만들 수 있게 합니다.
import asyncio
from pathlib import Path
from agents import Runner
from agents.run import RunConfig
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
from agents.sandbox.capabilities import Capabilities, LocalDirLazySkillSource, Skills
from agents.sandbox.entries import LocalDir
from agents.sandbox.sandboxes.unix_local import UnixLocalSandboxClient
EXAMPLE_DIR = Path(__file__).resolve().parent
HOST_REPO_DIR = EXAMPLE_DIR / "repo"
HOST_SKILLS_DIR = EXAMPLE_DIR / "skills"
def build_agent(model: str) -> SandboxAgent[None]:
return SandboxAgent(
name="Sandbox engineer",
model=model,
instructions=(
"Read `repo/task.md` before editing files. Stay grounded in the repository, preserve "
"existing behavior, and mention the exact verification command you ran. "
"If you edit files with apply_patch, paths are relative to the sandbox workspace root."
),
default_manifest=Manifest(
entries={
"repo": LocalDir(src=HOST_REPO_DIR),
}
),
capabilities=Capabilities.default() + [
Skills(
lazy_from=LocalDirLazySkillSource(
# This is a host path read by the SDK process.
# Requested skills are copied into `skills_path` in the sandbox.
source=LocalDir(src=HOST_SKILLS_DIR),
)
),
],
)
async def main() -> None:
result = await Runner.run(
build_agent("gpt-5.5"),
"Open `repo/task.md`, fix the issue, run the targeted test, and summarize the change.",
run_config=RunConfig(
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
workflow_name="Sandbox coding example",
),
)
print(result.final_output)
if __name__ == "__main__":
asyncio.run(main())
examples/sandbox/docs/coding_task.py를 참조하세요. 이 예제는 작은 셸 기반 리포지토리를 사용하므로 Unix-local 실행 전반에서 결정적으로 검증할 수 있습니다.
주요 선택 사항
기본 실행이 작동한 후 대부분의 사용자가 다음으로 고려하는 선택지는 다음과 같습니다.
default_manifest: 새 샌드박스 세션을 위한 파일, 리포지토리, 디렉터리, 마운트instructions: 프롬프트 전반에 적용되어야 하는 짧은 워크플로 규칙base_instructions: SDK 샌드박스 프롬프트를 대체하기 위한 고급 탈출구capabilities: 파일 시스템 편집/이미지 검사, 셸, 스킬, 메모리, 압축과 같은 샌드박스 네이티브 도구run_as: 모델 대상 도구를 위한 샌드박스 사용자 IDSandboxRunConfig.client: 샌드박스 백엔드SandboxRunConfig.session,session_state또는snapshot: 이후 실행이 이전 작업에 다시 연결되는 방식
다음 단계
- 개념: 매니페스트, 기능, 권한, 스냅샷, 실행 구성, 구성 패턴 이해
- 샌드박스 클라이언트: Unix-local, Docker, 호스티드 공급자, 마운트 전략 선택
- 에이전트 메모리: 이전 샌드박스 실행에서 얻은 교훈 보존 및 재사용
셸 접근이 가끔 사용하는 도구 중 하나일 뿐이라면 도구 가이드의 호스티드 셸부터 시작하세요. 작업 공간 격리, 샌드박스 클라이언트 선택 또는 샌드박스 세션 재개 동작이 설계의 일부일 때 샌드박스 에이전트를 선택하세요.