Phase 14 - Lesson 28

Padrões de Orquestração: Supervisor, Swarm, Hierárquico

Quatro padrões de orquestração são recorrentes nos frameworks de 2026: supervisor-worker, swarm / peer-to-peer, hierárquico, debate. A orientação da Anthropic: "Trata-se de construir o sistema certo para as suas necessidades." Comece simples; adicione topologia apenas quando um único agente associado a cinco padrões de fluxo de trabalho for insuficiente.

Tipo: Aprender + Construir Idiomas: Python (stdlib) Pré-requisitos: Fase 14 · 12 (Padrões de Fluxo de Trabalho), Fase 14 · 25 (Debate Multiagente) Tempo: ~60 minutos

Objetivos de Aprendizado

  • Nomear os quatro padrões de orquestração recorrentes e quando cada um se aplica.
  • Descrever a recomendação da LangChain de 2026: supervisão baseada em chamada de ferramentas (tool-call-based) versus bibliotecas de supervisor.
  • Explicar a regra da Anthropic de "construir o sistema certo" e como ela define a escolha da topologia.
  • Implementar todos os quatro padrões em stdlib contra um LLM simulado por script.

O Problema

As equipes recorrem a "multiagentes" antes do necessário. Quatro padrões se repetem nos frameworks; uma vez que você consiga nomeá-los, poderá escolher o correto — ou evitar a topologia inteiramente.

O Conceito

Supervisor-worker

  • Um LLM de roteamento central distribui tarefas para agentes especialistas.
  • Decide: retornar para si mesmo, passar a tarefa para um especialista ou encerrar.
  • Os especialistas não conversam entre si; todo o roteamento passa pelo supervisor.

Frameworks: LangGraph create_supervisor, Anthropic orchestrator-workers, CrewAI Hierarchical Process.

Recomendação da LangChain de 2026: faça a supervisão por meio de chamadas diretas de ferramentas (tool calls) em vez de create_supervisor. Isso oferece um controle mais refinado da engenharia de contexto — você decide exatamente o que cada especialista vê.

Swarm / peer-to-peer

  • Agentes passam tarefas diretamente por meio de uma interface de ferramentas compartilhada.
  • Sem roteador central.
  • Menor latência do que o supervisor (menos saltos/hops).
  • Mais difícil de compreender e depurar (sem um ponto central de controle).

Frameworks: topologia de swarm do LangGraph, transferências (handoffs) do SDK de Agents da OpenAI (quando todos os agentes podem passar tarefas para todos os outros).

Hierárquico

  • Supervisores gerenciando sub-supervisores que gerenciam workers.
  • Implementado como subgrafos aninhados no LangGraph; crews aninhadas no CrewAI.
  • Escala para grandes populações de agentes ao custo de complexidade operacional.

Quando você precisa disso: quando o limite de contexto de um único supervisor não consegue conter as descrições de todos os especialistas.

Debate

  • Proponentes paralelos + crítica cruzada iterativa (Lição 25).
  • Não é exatamente orquestração — está mais para verificação — mas aparece como uma opção de topologia nos frameworks.

CrewAI Crew vs Flow

O CrewAI formaliza dois modos de implantação:

  • Flow para automação determinística baseada em eventos (ponto de partida recomendado para produção).
  • Crew para colaboração autônoma baseada em papéis (roles).

Isso é ortogonal aos quatro padrões acima, mas mapeia para a topologia: Flow é normalmente supervisor ou hierárquico; Crew é normalmente supervisor com um roteador de LLM.

Orientação da Anthropic

"O sucesso no espaço de LLMs não se trata de construir o sistema mais sofisticado. Trata-se de construir o sistema certo para as suas necessidades."

Ordem de decisão:

  1. Agente único + padrões de fluxo de trabalho (Lição 12) — comece aqui.
  2. Supervisor-worker — quando você tem de 2 a 4 especialistas.
  3. Swarm — quando a latência importa mais do que a clareza do raciocínio.
  4. Hierárquico — apenas quando o limite de contexto do supervisor falhar.
  5. Debate — quando a precisão importa mais do que o custo.

Onde esse padrão costuma dar errado

  • Mentalidade de topologia primeiro (topology-first). Decidir "precisamos de multiagentes" antes de identificar qual problema os multiagentes realmente resolvem.
  • Transferências infinitas (bouncing handoffs) no swarm. A -> B -> A -> B. Use contadores de saltos (hop counters).
  • Hierarquia falsa. Três camadas porque é uma "empresa", mas apenas duas equipes reais. Simplifique.

Construa

O arquivo code/main.py implementa todos os quatro padrões em stdlib contra um LLM simulado por script:

  • Supervisor — roteador central.
  • Swarm — peer-to-peer com transferências diretas.
  • Hierarchical — supervisores de supervisores.
  • Debate — proponentes paralelos + crítica.

Cada padrão lida com a mesma tarefa de três intenções (reembolso / bug / vendas). Os formatos de rastreamento (trace) diferem.

Execute:

python3 code/main.py

Saída: rastreamento por padrão + contagem de operações. O supervisor é o mais limpo; swarm é o mais curto; hierárquico é o mais profundo; debate é o mais caro.

Use

  • LangGraph para supervisor e hierárquico (subgrafos aninhados).
  • OpenAI Agents SDK para transferências como ferramentas (formato de supervisor).
  • CrewAI Flow para produção determinística.
  • Customizado para debate ou quando você deseja controle exato.

Envie

O arquivo outputs/skill-orchestration-picker.md seleciona uma topologia e a implementa.

Exercícios

  1. Converta um supervisor-worker em um swarm removendo o roteador. O que quebra? O que melhora?
  2. Adicione um contador de saltos (hop counter) ao swarm: recuse após 3 transferências. Ele detecta a oscilação A->B->A?
  3. Construa um sistema hierárquico de dois níveis para um domínio com 12 especialistas. Onde o limite de contexto falha sem o aninhamento?
  4. Monitore o perfil dos quatro padrões em uma carga de trabalho semelhante à de produção. Qual deles vence em qual métrica (latência, custo, precisão, depurabilidade)?
  5. Leia o artigo "Building Effective Agents" da Anthropic. Mapeie cada um dos seus fluxos de produção para um dos quatro padrões. Algum deles não se encaixa perfeitamente?

Termos-Chave

Termo O que as pessoas dizem O que realmente significa
Supervisor-worker "Roteador + especialistas" LLM central distribui tarefas para especialistas; eles não se comunicam diretamente
Swarm "Peer-to-peer" Transferências diretas por meio de ferramentas compartilhadas; sem roteador central
Hierárquico "Supervisores de supervisores" Subgrafos aninhados para grandes populações
Debate "Proponente + crítica" Proponentes paralelos, crítica cruzada (Lição 25)
Tool-call-based supervision "Supervisor sem biblioteca" Implementar o supervisor como chamadas diretas de ferramentas para controle do contexto
Crew "Equipe autônoma" Modo de colaboração do CrewAI baseado em papéis (roles)
Flow "Fluxo de trabalho determinístico" Modo de produção do CrewAI baseado em eventos

Leitura Adicional

0 lifetime access. Curriculum based on AI Engineering from Scratch by Rohit Ghumare (MIT, used under attribution).