The Site Reliability Workbook
O Site Reliability Workbook é o companheiro prático do best-seller Site Reliability Engineering e usa exemplos concretos para mostrar como colocar em prática os princípios e práticas de SRE.
Capítulo 1 – Como o SRE se relaciona com o DevOps
classe SRE implementa interface DevOps Escrito por Niall Richard...
Ler maisCapítulo 2 – Implementar SLOs
Escrito por Steven Thurgood e David Ferguson com Alex Hidalgo...
Ler maisCapítulo 3 – Estudos de casos de engenharia SLO
Escrito por Ben McCormack (Evernote) e William Bonnell (The Home...
Ler maisCapítulo 4 – Monitoramento
Escrito por Jess Frame, Anthony Lenton, Steven Thurgood, Anton Tolchanov,...
Ler maisCapítulo 5 – Alerta sobre SLOs
Escrito por Steven Thurgood Com Jess Frame, Anthony Lenton, Carmela...
Ler maisCapítulo 6 – Eliminar o Toil
Escrito por David Challoner, Joanna Wijntjes, David Huska, Matthew Sartwell,...
Ler maisCapítulo 8 – De plantão
Escrito por Ollie Cook, Sara Smollett, Andrea Spadaccini, Cara Donnelly,...
Ler maisCapítulo 9 – Resposta a Incidentes
Escrito por: Jennifer Mace, Jelena Oertel, Stephen Thorne, E Arup...
Ler maisCapítulo 10 – Cultura postmortem: aprendendo com o fracasso
Por Daniel Rogers, Murali Suriar, Sue Lueder,Pranjal Deo e Divya...
Ler maisCapítulo 11 – Gerenciando a carga
Por Cooper Bethea, Gráinne Sheerin, Jennifer Mace e Ruth Kingcom...
Ler maisCapítulo 12 – Apresentando o projeto de sistemas não-abstratos em grande escala
Por Salim Virji, James Youngman, Henry Robertson, Stephen Thorne, Dave...
Ler maisCapítulo 13 – Pipelines de processamento de dados
Por Rita Sodt e Igor Maravić (Spotify) com Gary Luo,...
Ler maisCapítulo 14 – Design de configuração e melhores práticas
Por Štěpán Davidovič com Niall Richard Murphy, Christophe Kalt e...
Ler maisCapítulo 15 – Específicos da configuração
Por Dave Cunningham e Misha Brukman com Christophe Kalt e...
Ler maisCapítulo 16 – Canarying releases
Por Alec Warner e Štěpán Davidovič com Alex Hidalgo, Betsy Beyer,...
Ler maisCapítulo 17 – Identificando e recuperando-se do sobrecarregamento
Por Maria-Hendrike Peetz, Luis Quesada Torres e Marilia Melo com...
Ler maisCapítulo 18 – Modelo de engajamento SRE
Por Michael Wildpaner, Gráinne Sheerin, Daniel Rogers, e Surya Prashanth...
Ler maisCapítulo 19 – SRE: alcançando além de suas fronteiras
Por Dave Rensin com Betsy Beyer, Niall Richard Murphy e...
Ler maisCapítulo 20 – Ciclos de vida da equipe SRE
Por David Ferguson e Prashant Labhane com Shylaja Nukala ...
Ler maisCapítulo 21 – Gestão de mudanças organizacionais em SRE
Por Alex Bramley, Ben Lutch, Michelle Duffy e Nir Tarcic...
Ler maisApêndice A – Documento de exemplo de SLO
Este documento descreve os SLOs para o Serviço de Jogo...
Ler maisApêndice B – Exemplo de política de Error Budget
Status: Publicado Autor: Steven Thurgood Data: 19-02-2018 Revisores: David Ferguson ...
Ler maisApêndice C – Resultados da Análise Postmortem
No Google, temos um modelo padrão de postmortem que nos...
Ler mais