Incidentes de simulacao
Incidentes de simulacao (mock) permitem que sua equipe pratique a resposta a incidentes sem consequencias reais. Eles simulam o ciclo de vida completo de um incidente em um ambiente isolado, sendo ideais para treinamento, onboarding e exercicios de prontidao.
Como funcionam os incidentes de simulacao
Incidentes mock se comportam de forma identica aos incidentes reais com tres diferencas-chave:
- Criacao somente por admins -- apenas admins da organizacao podem criar incidentes de simulacao. Isso evita confusao acidental com incidentes reais.
- Sem notificacoes reais -- incidentes mock nao acionam escalonamentos do PagerDuty, alertas do Slack para canais externos ou atualizacoes de status page. O comportamento de notificacao interna depende das configuracoes da sua organizacao.
- Timer de auto-resolucao -- cada incidente mock inclui um timer de contagem regressiva configuravel. Quando o timer expira, o incidente e automaticamente resolvido independentemente do seu status atual.
Criando um incidente de simulacao
- Navegue ate Incidentes e clique em Novo Incidente.
- Ative o switch Incidente de simulacao no topo do formulario.
- Preencha titulo, severidade, tipo e descricao como faria para um incidente real.
- Defina o timer de auto-resolucao (padrao: 60 minutos, maximo: 8 horas).
- Clique em Criar.
Incidentes mock sao claramente identificados com um banner na pagina de detalhes do incidente, para que nao haja ambiguidade durante o exercicio.
Cenarios de treinamento
Aqui estao cenarios recomendados para incidentes mock:
Cenario 1: Queda de servico P1
Simule uma queda completa de um servico central. A equipe pratica atribuicao rapida de Comandante, comunicacao com stakeholders e coordenacao entre multiplos responders. Defina o timer para 30 minutos para criar urgencia.
Cenario 2: Degradação de performance P2
Simule aumento de latencia em uma API publica. A equipe trabalha na investigacao, analise de causa raiz e recuperacao gradual. Bom para praticar a transicao de Investigando para Identificado. Defina o timer para 45 minutos.
Cenario 3: Evento de seguranca P3
Simule a deteccao de um padrao de login suspeito. A equipe pratica a coordenacao entre engenharia e seguranca. Defina o timer para 60 minutos.
Revisando a performance de incidentes mock
Apos a resolucao de um incidente mock, o Comandante e os participantes podem revisar a timeline como em um incidente real. Use o fluxo de feedback de incidentes para coletar avaliacoes e notas sobre o que funcionou bem e o que melhorar.
Os dados de incidentes mock sao claramente separados das metricas de incidentes reais no dashboard de analytics da sua organizacao.
Melhores praticas
- Agende exercicios regulares (mensal e um bom ponto de partida).
- Rotacione a funcao de Comandante para que diferentes membros ganhem experiencia.
- Apos cada exercicio, faca um debrief curto para discutir licoes aprendidas.
- Aumente gradualmente a complexidade introduzindo complicacoes no meio do exercicio.
- Acompanhe metricas de incidentes mock ao longo do tempo para medir a melhoria nos tempos de resposta.