Com base nos sólidos fundamentos dos princípios de SRE abordados na Parte I, a Parte II aprofunda-se em como realizar atividades relacionadas ao SRE que o Google considerou importantes para operar em larga escala.
Alguns desses tópicos, como pipelines de processamento de dados e gerenciamento de carga, podem não se aplicar a todas as organizações. Outros temas, como lidar com mudanças de maneira segura usando configurações e canary releases, práticas de plantão (on-call) e o que fazer quando as coisas dão errado, trazem lições valiosas para qualquer equipe de SRE.
Esta parte também introduz uma habilidade importante do SRE — Design de Sistemas Grandes e Não Abstratos (NALSD) — e apresenta um exemplo detalhado de como praticar esse processo de design.
À medida que passamos dos fundamentos do SRE para as práticas, queríamos fornecer um pouco mais de contexto sobre a relação entre as responsabilidades operacionais e o trabalho de projetos, além da engenharia necessária para realizar ambos estrategicamente.