Skip to content

Políticas de escalonamento

Políticas de escalonamento definem o que acontece quando um alerta não é confirmado dentro de um timeout especificado. Elas garantem que alertas críticos sempre cheguem a um responder, mesmo que a pessoa em plantão primário esteja indisponível.

Como funciona o escalonamento

  1. Um alerta é roteado para o responder em plantão atual.
  2. Uma contagem regressiva é iniciada com base no timeout configurado (em minutos).
  3. Se o alerta não for confirmado antes do timeout expirar, ele é roteado para o próximo alvo na política.
  4. Esse processo se repete até que o alerta seja confirmado ou a cadeia de políticas se esgote.

Criando uma política de escalonamento

Navegue até Plantão > Políticas de Escalonamento e clique em Criar Política.

Etapas da política

Cada política consiste em uma lista ordenada de etapas. Uma etapa define:

CampoDescrição
AlvoUma escala, usuário ou time para notificar
TimeoutMinutos de espera antes de escalar para a próxima etapa

Adicione quantas etapas forem necessárias. Por exemplo:

Etapa 1: Escala Backend Principal → timeout de 5 min
Etapa 2: Escala Backend Secundária → timeout de 10 min
Etapa 3: Gestor de Engenharia (usuário) → timeout de 15 min

Se ninguém confirmar em 30 minutos, o alerta chega ao gestor de engenharia diretamente.

TIP

Mantenha o primeiro timeout curto (3-5 minutos) para incidentes de alta severidade. Use timeouts mais longos para alertas de baixa severidade para dar mais tempo ao responder primário.

Triggers por tipo de incidente

Você pode anexar políticas de escalonamento a tipos de incidente específicos para que diferentes categorias de alertas sigam caminhos de escalonamento diferentes.

Por exemplo:

  • P1 - Crítico: Escalonar para o gestor de engenharia após 5 minutos.
  • P2 - Aviso: Escalonar para a escala secundária após 15 minutos.
  • P3 - Info: Sem escalonamento; alerta expira após 60 minutos se não confirmado.

Configure triggers por tipo de incidente nas configurações da política em Triggers.

INFO

Se nenhum tipo de incidente for especificado, a política se aplica a todos os alertas roteados por ela. Você pode criar uma política padrão e sobrescrevê-la com políticas específicas por tipo.

Cadeias de políticas

Políticas podem referenciar outras políticas como alvo de uma etapa. Isso permite construir árvores de escalonamento aninhadas. Por exemplo, uma política em nível de time pode escalar para uma política em nível organizacional depois de esgotar suas próprias etapas.

Evite aninhamento profundo. Dois ou três níveis de encadeamento são suficientes para a maioria das organizações.

Comportamento do timeout

A contagem regressiva do timeout começa quando o alerta é entregue ao alvo, não quando o alerta é criado. Se a entrega for atrasada (ex.: devido a uma queda no serviço de notificação), a contagem não começa até que a notificação seja enviada.

Testando políticas

Use o botão Testar na página de detalhes da política para enviar um alerta simulado por toda a cadeia. Isso verifica que cada etapa dispara corretamente sem criar um incidente real.

Built by the Batida team