에이전트 오케스트레이션
오케스트레이션은 앱 내 에이전트의 흐름을 의미합니다. 어떤 에이전트가 어떤 순서로 실행되며, 다음에 무엇이 일어날지는 어떻게 결정할까요? 에이전트를 오케스트레이션하는 주요 방법은 두 가지입니다.
이 페이지는 빠른 시작 또는 에이전트를 읽은 후에 읽어보세요. 이 페이지는
Agent생성자 자체가 아니라 여러 에이전트에 걸친 워크플로 설계를 다룹니다.
- LLM이 결정을 내리도록 허용: LLM의 지능을 사용해 계획하고, 추론하고, 이를 바탕으로 어떤 단계를 수행할지 결정합니다.
- 코드를 통한 오케스트레이션: 코드로 에이전트의 흐름을 결정합니다.
이러한 패턴은 함께 조합해서 사용할 수 있습니다. 각각에는 아래에 설명된 고유한 트레이드오프가 있습니다.
LLM을 통한 오케스트레이션
섹션 제목: “LLM을 통한 오케스트레이션”에이전트는 instructions, tools와 핸드오프를 갖춘 LLM입니다. 즉, 개방형 작업이 주어지면 LLM은 도구를 사용해 작업을 수행하고 데이터를 확보하며, 핸드오프를 사용해 하위 에이전트에 작업을 위임하면서 자율적으로 작업을 해결할 계획을 세울 수 있습니다. 예를 들어 리서치 에이전트에는 다음과 같은 도구를 제공할 수 있습니다.
- 온라인에서 정보를 찾기 위한 웹 검색
- 전용 데이터와 연결된 리소스를 탐색하기 위한 파일 검색 및 검색
- 컴퓨터에서 작업을 수행하기 위한 컴퓨터 사용
- 데이터 분석을 위한 코드 실행
- 계획, 보고서 작성 등에 뛰어난 전문 에이전트로의 핸드오프
핵심 SDK 패턴
섹션 제목: “핵심 SDK 패턴”Agents SDK에서는 다음 두 가지 오케스트레이션 패턴이 가장 자주 사용됩니다.
| 패턴 | 작동 방식 | 적합한 경우 |
|---|---|---|
| Agents as tools | 관리자 에이전트가 대화 제어권을 유지하고 agent.asTool()을 통해 전문 에이전트를 호출합니다. | 하나의 에이전트가 최종 답변을 책임지거나, 여러 전문 에이전트의 출력을 결합하거나, 공통 가드레일을 한곳에서 적용하길 원할 때 |
| 핸드오프 | 트리아지 에이전트가 대화를 전문 에이전트로 라우팅하고, 해당 전문 에이전트가 해당 턴의 나머지 동안 활성 에이전트가 됩니다. | 전문 에이전트가 사용자에게 직접 응답하거나, 프롬프트의 초점을 유지하거나, 전문 에이전트별로 서로 다른 instructions/모델을 사용하길 원할 때 |
전문 에이전트가 하위 작업을 도와야 하지만 사용자와 마주하는 대화를 넘겨받아서는 안 될 때는 agents as tools를 사용하세요. 관리자는 어떤 도구를 호출할지, 최종 응답을 어떻게 제시할지 결정하는 책임을 계속 가집니다. API 세부 정보는 도구를, 나란히 비교한 예시는 에이전트를 참조하세요.
라우팅 자체가 워크플로의 일부이고 선택된 전문 에이전트가 대화의 다음 부분을 책임지길 원할 때는 핸드오프를 사용하세요. 핸드오프는 대화 컨텍스트를 보존하면서 활성 instructions를 해당 전문 에이전트에 맞게 좁힙니다. API는 핸드오프를, 가장 작은 엔드투엔드 예제는 빠른 시작을 참조하세요.
두 패턴을 결합할 수도 있습니다. 트리아지 에이전트가 전문 에이전트로 핸드오프하고, 그 전문 에이전트가 제한된 하위 작업에 대해 여전히 다른 에이전트를 도구로 사용할 수 있습니다.
이 패턴은 작업이 개방형이고 LLM의 지능에 의존하고 싶을 때 적합합니다. 여기서 가장 중요한 전략은 다음과 같습니다.
- 좋은 프롬프트에 투자하세요. 어떤 도구를 사용할 수 있는지, 어떻게 사용해야 하는지, 어떤 매개변수 범위 안에서 작동해야 하는지 명확히 하세요.
- 앱을 모니터링하고 반복적으로 개선하세요. 어디에서 문제가 발생하는지 확인하고 프롬프트를 반복 개선하세요.
- 에이전트가 스스로 점검하고 개선할 수 있게 하세요. 예를 들어 루프에서 실행하고 스스로 비평하게 하거나, 오류 메시지를 제공하고 개선하게 하세요.
- 무엇이든 잘하기를 기대하는 범용 에이전트보다는, 한 가지 작업에 뛰어난 전문 에이전트를 두세요.
- evals에 투자하세요. 이를 통해 에이전트를 훈련해 개선하고 작업 성능을 높일 수 있습니다.
이러한 오케스트레이션 스타일의 기반이 되는 SDK 기본 구성 요소를 알고 싶다면 도구, 핸드오프, 에이전트 실행부터 시작하세요.
코드를 통한 오케스트레이션
섹션 제목: “코드를 통한 오케스트레이션”LLM을 통한 오케스트레이션은 강력하지만, 코드를 통한 오케스트레이션은 속도, 비용, 성능 측면에서 작업을 더 결정적이고 예측 가능하게 만듭니다. 여기서 일반적인 패턴은 다음과 같습니다.
- 코드로 검사할 수 있는 적절한 형식의 데이터를 생성하기 위해 structured outputs를 사용합니다. 예를 들어 에이전트에게 작업을 몇 가지 카테고리로 분류하게 한 다음, 해당 카테고리를 바탕으로 다음 에이전트를 선택할 수 있습니다.
- 한 에이전트의 출력을 다음 에이전트의 입력으로 변환하여 여러 에이전트를 체이닝합니다. 블로그 게시글 작성 같은 작업을 일련의 단계로 분해할 수 있습니다. 조사하고, 개요를 작성하고, 블로그 게시글을 작성하고, 비평한 다음 개선하는 식입니다.
- 평가를 수행하고 피드백을 제공하는 에이전트와 함께 작업을 수행하는 에이전트를
while루프에서 실행해, 평가자가 출력이 특정 기준을 통과한다고 말할 때까지 반복합니다. - 여러 에이전트를 병렬로 실행합니다. 예를 들어
Promise.all같은 JavaScript 기본 구성 요소를 사용할 수 있습니다. 서로 의존하지 않는 여러 작업이 있을 때 속도 측면에서 유용합니다.
examples/agent-patterns에 여러 코드 예제가 있습니다.