Skip to content

Incidentes de simulacao

Incidentes de simulacao (mock) permitem que sua equipe pratique a resposta a incidentes sem consequencias reais. Eles simulam o ciclo de vida completo de um incidente em um ambiente isolado, sendo ideais para treinamento, onboarding e exercicios de prontidao.

Como funcionam os incidentes de simulacao

Incidentes mock se comportam de forma identica aos incidentes reais com tres diferencas-chave:

  1. Criacao somente por admins -- apenas admins da organizacao podem criar incidentes de simulacao. Isso evita confusao acidental com incidentes reais.
  2. Sem notificacoes reais -- incidentes mock nao acionam escalonamentos do PagerDuty, alertas do Slack para canais externos ou atualizacoes de status page. O comportamento de notificacao interna depende das configuracoes da sua organizacao.
  3. Timer de auto-resolucao -- cada incidente mock inclui um timer de contagem regressiva configuravel. Quando o timer expira, o incidente e automaticamente resolvido independentemente do seu status atual.

Criando um incidente de simulacao

  1. Navegue ate Incidentes e clique em Novo Incidente.
  2. Ative o switch Incidente de simulacao no topo do formulario.
  3. Preencha titulo, severidade, tipo e descricao como faria para um incidente real.
  4. Defina o timer de auto-resolucao (padrao: 60 minutos, maximo: 8 horas).
  5. Clique em Criar.

Incidentes mock sao claramente identificados com um banner na pagina de detalhes do incidente, para que nao haja ambiguidade durante o exercicio.

Cenarios de treinamento

Aqui estao cenarios recomendados para incidentes mock:

Cenario 1: Queda de servico P1

Simule uma queda completa de um servico central. A equipe pratica atribuicao rapida de Comandante, comunicacao com stakeholders e coordenacao entre multiplos responders. Defina o timer para 30 minutos para criar urgencia.

Cenario 2: Degradação de performance P2

Simule aumento de latencia em uma API publica. A equipe trabalha na investigacao, analise de causa raiz e recuperacao gradual. Bom para praticar a transicao de Investigando para Identificado. Defina o timer para 45 minutos.

Cenario 3: Evento de seguranca P3

Simule a deteccao de um padrao de login suspeito. A equipe pratica a coordenacao entre engenharia e seguranca. Defina o timer para 60 minutos.

Revisando a performance de incidentes mock

Apos a resolucao de um incidente mock, o Comandante e os participantes podem revisar a timeline como em um incidente real. Use o fluxo de feedback de incidentes para coletar avaliacoes e notas sobre o que funcionou bem e o que melhorar.

Os dados de incidentes mock sao claramente separados das metricas de incidentes reais no dashboard de analytics da sua organizacao.

Melhores praticas

  • Agende exercicios regulares (mensal e um bom ponto de partida).
  • Rotacione a funcao de Comandante para que diferentes membros ganhem experiencia.
  • Apos cada exercicio, faca um debrief curto para discutir licoes aprendidas.
  • Aumente gradualmente a complexidade introduzindo complicacoes no meio do exercicio.
  • Acompanhe metricas de incidentes mock ao longo do tempo para medir a melhoria nos tempos de resposta.

Built by the Batida team