실시간 전송 방식
이 페이지를 사용하여 실시간 에이전트가 Python 애플리케이션에 어떻게 적합한지 결정하세요.
Python SDK 경계
Python SDK에는 브라우저 WebRTC 전송이 포함되지 않습니다. 이 페이지는 Python SDK 전송 선택지, 즉 서버 측 WebSocket 및 SIP 연결 플로우만 다룹니다. 브라우저 WebRTC는 별도의 플랫폼 주제이며, 공식 WebRTC를 사용하는 Realtime API 가이드에 문서화되어 있습니다.
결정 가이드
| 목표 | 시작 위치 | 이유 |
|---|---|---|
| 서버가 관리하는 실시간 앱 빌드 | 빠른 시작 | 기본 Python 경로는 RealtimeRunner가 관리하는 서버 측 WebSocket 세션입니다. |
| 어떤 전송 방식과 배포 형태를 선택해야 하는지 이해 | 이 페이지 | 전송 방식이나 배포 형태를 확정하기 전에 이 페이지를 사용하세요. |
| 에이전트를 전화 또는 SIP 통화에 연결 | 실시간 가이드 및 examples/realtime/twilio_sip |
이 저장소에는 call_id로 구동되는 SIP 연결 플로우가 포함되어 있습니다. |
기본 Python 경로인 서버 측 WebSocket
커스텀 RealtimeModel을 전달하지 않으면 RealtimeRunner는 OpenAIRealtimeWebSocketModel을 사용합니다.
즉, 표준 Python 토폴로지는 다음과 같습니다.
- Python 서비스가
RealtimeRunner를 생성합니다. await runner.run()이RealtimeSession을 반환합니다.- 세션에 진입하여 텍스트, 구조화된 메시지 또는 오디오를 전송합니다.
RealtimeSessionEvent항목을 소비하고 오디오 또는 대본을 애플리케이션으로 전달합니다.
이 토폴로지는 핵심 데모 앱, CLI 예제, Twilio Media Streams 예제에서 사용됩니다.
서버가 오디오 파이프라인, 도구 실행, 승인 플로우, 기록 처리를 담당할 때 이 경로를 사용하세요.
전화 통신 경로인 SIP 연결
이 저장소에 문서화된 전화 통신 플로우에서 Python SDK는 call_id를 통해 기존 실시간 통화에 연결합니다.
이 토폴로지는 다음과 같습니다.
- OpenAI가
realtime.call.incoming과 같은 웹훅을 서비스로 보냅니다. - 서비스가 Realtime Calls API를 통해 통화를 수락합니다.
- Python 서비스가
RealtimeRunner(..., model=OpenAIRealtimeSIPModel())을 시작합니다. - 세션이
model_config={"call_id": ...}로 연결된 다음, 다른 실시간 세션과 마찬가지로 이벤트를 처리합니다.
이 토폴로지는 examples/realtime/twilio_sip에 나와 있습니다.
더 넓은 Realtime API도 일부 서버 측 제어 패턴에 call_id를 사용하지만, 이 저장소에서 제공되는 연결 예제는 SIP입니다.
이 SDK 범위 밖의 브라우저 WebRTC
앱의 주 클라이언트가 Realtime WebRTC를 사용하는 브라우저인 경우:
- 이 저장소의 Python SDK 문서 범위 밖으로 간주하세요.
- 클라이언트 측 플로우와 이벤트 모델에는 공식 WebRTC를 사용하는 Realtime API 및 실시간 대화 문서를 사용하세요.
- 브라우저 WebRTC 클라이언트 위에 사이드밴드 서버 연결이 필요한 경우 공식 실시간 서버 측 제어 가이드를 사용하세요.
- 이 저장소가 브라우저 측
RTCPeerConnection추상화나 바로 사용할 수 있는 브라우저 WebRTC 샘플을 제공한다고 기대하지 마세요.
또한 이 저장소는 현재 브라우저 WebRTC와 Python 사이드밴드를 함께 사용하는 예제를 제공하지 않습니다.
커스텀 엔드포인트 및 연결 지점
RealtimeModelConfig의 전송 구성 인터페이스를 사용하면 기본 경로를 조정할 수 있습니다.
url: WebSocket 엔드포인트 재정의headers: Azure 인증 헤더와 같은 명시적 헤더 제공api_key: API 키를 직접 또는 콜백을 통해 전달call_id: 기존 실시간 통화에 연결. 이 저장소에서 문서화된 예제는 SIP입니다.playback_tracker: 인터럽션(중단 처리)을 위해 실제 재생 진행 상황 보고
토폴로지를 선택한 후의 상세한 생명주기와 기능 범위는 실시간 에이전트 가이드를 참조하세요.