Les Cast Codeurs Podcast

LCC 243 - Interview SRE avec Nicolas Helleringer et Maxime Brugidou - partie 1

Informações:

Sinopsis

Nicolas et Maxime de Critéo partagent avec Emmanuel leur expérience de mise en place d’une organisation SRE (Site Reliability Engineering). Enregistré le 12 novembre 2020 Téléchargement de l’épisode LesCastCodeurs-Episode–243.mp3 Interview Ta vie, ton oeuvre Twotter Nicolas Twitter Maxime Criteo Labs SRE en 2 phrases Site Reliability Engineering C’est une façon de monter un salaire de sysadmin ? Pourquoi Ops et dev, pourquoi “merger” ? DevOps avec un sysadmin dans l’équipe vs SRE Cela a du sens de le faire sur un “petit projet” ou uniquement si on gère 300k machines ? SRE au quotidien Journée type Dashboard On code en quoi? Pager (pendant les horaires travails vs dehors) Les weekends Taille SRE pour pour du 24/7 Combien de fois est-on appelé par nuit ? Prod fallback Le development Livre: le projet Unicorn Concepts intéressants 50% eng SLO SLI SLA La difficulté de la valeur initiale Perf passées vs calcul théorique Error budget Blast radius Burn rate Pré conclusion C’est la fin de la partie 1 de cette interv