A disponibilidade é geralmente calculada com base no tempo em que um serviço esteve indisponível durante algum período. Assumindo que não houve tempo de inatividade planejado, a Tabela 1-1 indica quanto tempo de inatividade é permitido para atingir um determinado nível de disponibilidade.
Tabela 1-1. Tabela de disponibilidade
Nível de disponibilidade | Janela de indisponibilidade permitida | |||||
por ano | por trimestre | por mês | por semana | por dia | por hora | |
90% | 36.5 dias | 9 dias | 3 dias | 16.8 horas | 2.4 horas | 6 minutos |
95% | 18.25 dias | 4.5 dias | 1.5 dias | 8.4 horas | 1.2 horas | 3 minutos |
99% | 3.65 dias | 21.6 horas | 7.2 horas | 1.68 horas | 14.4 minutos | 36 segundos |
99.5% | 1.83 dias | 10.8 horas | 3.6 horas | 50.4 minutos | 7.20 minutos | 18 segundos |
99.9% | 8.76 horas | 2.16 horas | 43.2 minutos | 10.1 minutos | 1.44 minutos | 3.6 segundos |
99.95% | 4.38 horas | 1.08 horas | 21.6 minutos | 5.04 minutos | 43.2 segundos | 1.8 segundos |
99.99% | 52.6 minutos | 12.96 minutos | 4.32 minutos | 60.5 segundos | 8.64 segundos | 0.36 segundos |
99.999% | 5.26 minutos | 1.30 minutos | 25.9 segundos | 6.05 segundos | 0.87 segundos | 0.04 segundos |
Utilizar uma métrica agregada de indisponibilidade (ou seja, “X% de todas as operações com falha”) é mais útil do que focar na duração da interrupção de serviços que podem estar parcialmente disponíveis – por exemplo, devido à existência de múltiplas réplicas, apenas algumas das quais não estão disponíveis – e para serviços cuja carga varia ao longo de um dia ou semana em vez de permanecer constante.
Ver Equações Disponibilidade baseada no tempo e Disponibilidade agregada em Adotar Risco para cálculos – capítulo 3.
Fonte: Google SRE Book