Alertas
Alertas são notificações geradas por sistemas de monitoramento, integrações ou submissões manuais. Eles são roteados para os responders em plantão com base em escalas e políticas de escalonamento.
Ciclo de vida do alerta
Todo alerta passa por um conjunto definido de status:
Pendente → Confirmado
↓
Escalonado| Status | Descrição |
|---|---|
| Pendente | Alerta foi criado e roteado para um responder. Aguardando confirmação. |
| Confirmado | Um responder assumiu o alerta e está trabalhando nele ativamente. |
| Escalonado | O timeout de confirmação expirou. Alerta foi encaminhado para o próximo alvo de escalonamento. |
INFO
Um alerta pode voltar de Confirmado para Pendente se o responder designado se desatribuir explicitamente.
Confirmando alertas
Confirmação individual
Clique no botão Confirmar em um alerta para assumir a responsabilidade. O alerta para de escalar e é atribuído a você. Os outros membros do time veem que o alerta está sendo tratado.
Confirmação em massa
Quando múltiplos alertas disparam simultaneamente (ex.: durante uma falha em cascata), use ações em massa para confirmá-los de uma vez:
- Selecione os alertas usando a coluna de checkbox.
- Clique em Confirmar em Massa.
- Confirme a ação.
Todos os alertas selecionados mudam para o status Confirmado e são atribuídos a você.
WARNING
Confirme somente alertas que você pretende resolver. Confirmar alertas em massa sem resolvê-los cria ruído e dificulta o acompanhamento real do progresso pelo time.
Roteamento por severidade
Alertas carregam um nível de severidade que influencia como são roteados e quão rápido precisam ser confirmados:
| Severidade | Timeout típico |
|---|---|
| Crítica (SEV1) | 5 minutos |
| Aviso (SEV2) | 15 minutos |
| Info (SEV3) | 60 minutos |
Esses timeouts são configurados na política de escalonamento anexada à escala do alerta.
Página de detalhes do alerta
Cada alerta tem uma página de detalhes mostrando:
- Timeline -- todas as mudanças de status, confirmações e escalonamentos com timestamps.
- Responder designado -- quem é o responsável atual.
- Tipo de incidente -- a categoria (SEV1, SEV2, SEV3 ou customizada).
- Incidentes vinculados -- incidentes criados a partir deste alerta.
Use a timeline durante revisões de incidentes para reconstruir a sequência de resposta.