빠른 시작
베타 기능
샌드박스 에이전트는 베타입니다. API, 기본값, 지원 기능의 세부 사항은 일반 제공 전에 변경될 수 있으며, 시간이 지남에 따라 더 고급 기능이 추가될 수 있습니다.
최신 에이전트는 파일 시스템의 실제 파일을 다룰 수 있을 때 가장 잘 작동합니다. Agents SDK의 샌드박스 에이전트는 모델에 대규모 문서 집합 검색, 파일 편집, 명령 실행, 아티팩트 생성, 저장된 샌드박스 상태에서 작업 재개를 수행할 수 있는 지속적인 워크스페이스를 제공합니다.
SDK는 파일 스테이징, 파일 시스템 도구, 셸 접근, 샌드박스 수명 주기, 스냅샷, 제공자별 글루 코드를 직접 연결하지 않아도 이러한 실행 하네스를 제공합니다. 일반적인 Agent 및 Runner 흐름을 유지한 다음, 워크스페이스용 Manifest, 샌드박스 네이티브 도구용 기능, 작업이 실행될 위치를 위한 SandboxRunConfig를 추가하면 됩니다.
사전 요구 사항
- Python 3.10 이상
- OpenAI Agents SDK에 대한 기본 이해
- 샌드박스 클라이언트. 로컬 개발의 경우
UnixLocalSandboxClient로 시작하세요.
설치
아직 SDK를 설치하지 않았다면:
Docker 기반 샌드박스의 경우:
로컬 샌드박스 에이전트 생성
이 예제는 repo/ 아래에 로컬 저장소를 스테이징하고, 로컬 스킬을 지연 로드하며, 러너가 실행을 위한 Unix 로컬 샌드박스 세션을 만들도록 합니다.
import asyncio
from pathlib import Path
from agents import Runner
from agents.run import RunConfig
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
from agents.sandbox.capabilities import Capabilities, LocalDirLazySkillSource, Skills
from agents.sandbox.entries import LocalDir
from agents.sandbox.sandboxes.unix_local import UnixLocalSandboxClient
EXAMPLE_DIR = Path(__file__).resolve().parent
HOST_REPO_DIR = EXAMPLE_DIR / "repo"
HOST_SKILLS_DIR = EXAMPLE_DIR / "skills"
def build_agent(model: str) -> SandboxAgent[None]:
return SandboxAgent(
name="Sandbox engineer",
model=model,
instructions=(
"Read `repo/task.md` before editing files. Stay grounded in the repository, preserve "
"existing behavior, and mention the exact verification command you ran. "
"If you edit files with apply_patch, paths are relative to the sandbox workspace root."
),
default_manifest=Manifest(
entries={
"repo": LocalDir(src=HOST_REPO_DIR),
}
),
capabilities=Capabilities.default() + [
Skills(
lazy_from=LocalDirLazySkillSource(
# This is a host path read by the SDK process.
# Requested skills are copied into `skills_path` in the sandbox.
source=LocalDir(src=HOST_SKILLS_DIR),
)
),
],
)
async def main() -> None:
result = await Runner.run(
build_agent("gpt-5.5"),
"Open `repo/task.md`, fix the issue, run the targeted test, and summarize the change.",
run_config=RunConfig(
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
workflow_name="Sandbox coding example",
),
)
print(result.final_output)
if __name__ == "__main__":
asyncio.run(main())
examples/sandbox/docs/coding_task.py를 참조하세요. 이 예제는 작은 셸 기반 저장소를 사용하므로 Unix 로컬 실행 전반에서 결정적으로 검증할 수 있습니다.
주요 선택 사항
기본 실행이 작동한 뒤 대부분의 사람이 다음으로 고려하는 선택 사항은 다음과 같습니다.
default_manifest: 새 샌드박스 세션을 위한 파일, 저장소, 디렉터리, 마운트instructions: 프롬프트 전반에 적용되어야 하는 짧은 워크플로 규칙base_instructions: SDK 샌드박스 프롬프트를 대체하기 위한 고급 이스케이프 해치capabilities: 파일 시스템 편집/이미지 검사, 셸, 스킬, 메모리, 압축과 같은 샌드박스 네이티브 도구run_as: 모델이 사용하는 도구의 샌드박스 사용자 IDSandboxRunConfig.client: 샌드박스 백엔드SandboxRunConfig.session,session_state또는snapshot: 이후 실행이 이전 작업에 다시 연결하는 방식
다음 단계
- 개념: 매니페스트, 기능, 권한, 스냅샷, 실행 구성, 구성 패턴을 이해합니다.
- 샌드박스 클라이언트: Unix 로컬, Docker, 호스티드 제공자, 마운트 전략을 선택합니다.
- 에이전트 메모리: 이전 샌드박스 실행에서 얻은 교훈을 보존하고 재사용합니다.
셸 접근이 가끔 사용하는 도구 중 하나에 불과하다면 도구 가이드의 호스티드 셸부터 시작하세요. 워크스페이스 격리, 샌드박스 클라이언트 선택, 샌드박스 세션 재개 동작이 설계의 일부라면 샌드박스 에이전트를 사용하세요.