콘텐츠로 이동

에이전트 오케스트레이션

오케스트레이션은 앱에서 에이전트가 흐르는 방식을 의미합니다. 어떤 에이전트가 어떤 순서로 실행되며, 다음에 무엇이 일어날지 어떻게 결정할까요? 에이전트를 오케스트레이션하는 주요 방법은 두 가지입니다.

  1. LLM이 결정을 내리도록 허용: LLM의 지능을 사용해 계획하고, 추론하고, 이를 바탕으로 어떤 단계를 수행할지 결정합니다.
  2. 코드를 통한 오케스트레이션: 코드로 에이전트의 흐름을 결정합니다.

이러한 패턴은 함께 조합해 사용할 수 있습니다. 각 방식에는 아래에 설명된 고유한 장단점이 있습니다.

LLM을 통한 오케스트레이션

에이전트는 instructions, tools 및 핸드오프를 갖춘 LLM입니다. 즉, 개방형 작업이 주어지면 LLM은 tools를 사용해 작업을 수행하고 데이터를 얻으며, 핸드오프를 사용해 하위 에이전트에게 작업을 위임하면서, 작업을 어떻게 처리할지 자율적으로 계획할 수 있습니다. 예를 들어 연구 에이전트에는 다음과 같은 도구를 장착할 수 있습니다.

  • 온라인에서 정보를 찾기 위한 웹 검색
  • 독점 데이터와 연결을 검색하기 위한 파일 검색 및 검색
  • 컴퓨터에서 작업을 수행하기 위한 컴퓨터 사용
  • 데이터 분석을 위한 코드 실행
  • 기획, 보고서 작성 등에 뛰어난 전문 에이전트로의 핸드오프

핵심 SDK 패턴

Python SDK에서는 두 가지 오케스트레이션 패턴이 가장 자주 사용됩니다.

패턴 작동 방식 가장 적합한 경우
Agents as tools 관리자 에이전트가 대화의 제어권을 유지하고 Agent.as_tool()을 통해 전문 에이전트를 호출합니다. 하나의 에이전트가 최종 답변을 담당하거나, 여러 전문가의 출력을 결합하거나, 공유 가드레일을 한곳에서 적용하도록 하고 싶을 때
핸드오프 트리아지 에이전트가 대화를 전문가에게 라우팅하고, 해당 전문가가 나머지 턴 동안 활성 에이전트가 됩니다. 전문가가 직접 응답하거나, 프롬프트를 집중된 상태로 유지하거나, 관리자가 결과를 설명하지 않고 instructions를 전환하도록 하고 싶을 때

전문가가 제한된 하위 작업을 도와야 하지만 사용자와 직접 마주하는 대화를 인수해서는 안 되는 경우 agents as tools를 사용합니다. 라우팅 자체가 워크플로의 일부이고 선택된 전문가가 상호작용의 다음 부분을 담당하도록 하고 싶을 때는 핸드오프를 사용합니다.

두 가지를 조합할 수도 있습니다. 트리아지 에이전트가 전문가에게 핸드오프할 수 있으며, 해당 전문가는 여전히 좁은 범위의 하위 작업을 위해 다른 에이전트를 도구로 호출할 수 있습니다.

이 패턴은 작업이 개방형이고 LLM의 지능에 의존하고자 할 때 유용합니다. 여기서 가장 중요한 전략은 다음과 같습니다.

  1. 좋은 프롬프트에 투자합니다. 어떤 도구를 사용할 수 있는지, 어떻게 사용해야 하는지, 어떤 매개변수 범위 내에서 작동해야 하는지 명확히 합니다.
  2. 앱을 모니터링하고 반복적으로 개선합니다. 문제가 발생하는 지점을 파악하고 프롬프트를 반복 개선합니다.
  3. 에이전트가 스스로 성찰하고 개선하도록 허용합니다. 예를 들어 루프 안에서 실행하고 스스로 비평하게 하거나, 오류 메시지를 제공하고 개선하게 합니다.
  4. 무엇이든 잘하도록 기대되는 범용 에이전트보다, 하나의 작업에 탁월한 전문 에이전트를 둡니다.
  5. 평가에 투자합니다. 이를 통해 에이전트를 훈련해 작업 수행 능력을 개선하고 향상시킬 수 있습니다.

이러한 오케스트레이션 방식의 핵심 SDK 기본 구성 요소를 알고 싶다면 도구, 핸드오프, 에이전트 실행부터 시작하세요.

코드를 통한 오케스트레이션

LLM을 통한 오케스트레이션은 강력하지만, 코드를 통한 오케스트레이션은 속도, 비용, 성능 측면에서 작업을 더 결정적이고 예측 가능하게 만듭니다. 여기서 흔히 사용되는 패턴은 다음과 같습니다.

  • structured outputs를 사용해 코드로 검사할 수 있는 적절한 형식의 데이터를 생성합니다. 예를 들어 에이전트에게 작업을 몇 가지 카테고리로 분류하게 한 다음, 해당 카테고리를 바탕으로 다음 에이전트를 선택할 수 있습니다.
  • 하나의 에이전트 출력을 다음 에이전트의 입력으로 변환해 여러 에이전트를 체이닝합니다. 블로그 게시물 작성 같은 작업을 연구하기, 개요 작성하기, 블로그 게시물 작성하기, 비평하기, 개선하기와 같은 일련의 단계로 분해할 수 있습니다.
  • 평가하고 피드백을 제공하는 에이전트와 함께, 작업을 수행하는 에이전트를 while 루프에서 실행하여 평가자가 출력이 특정 기준을 통과했다고 말할 때까지 반복합니다.
  • 여러 에이전트를 병렬로 실행합니다. 예를 들어 asyncio.gather 같은 Python 기본 구성 요소를 사용할 수 있습니다. 서로 의존하지 않는 여러 작업이 있을 때 속도 측면에서 유용합니다.

examples/agent_patterns에 여러 코드 예제가 있습니다.

관련 가이드

  • 구성 패턴과 에이전트 설정은 에이전트를 참조하세요.
  • Agent.as_tool() 및 관리자 스타일 오케스트레이션은 도구를 참조하세요.
  • 전문 에이전트 간 위임은 핸드오프를 참조하세요.
  • 실행별 오케스트레이션 제어와 대화 상태는 에이전트 실행을 참조하세요.
  • 최소한의 엔드투엔드 핸드오프 예제는 빠른 시작을 참조하세요.