Cómo SRE utiliza Python para automatizar millones de máquinas y servicios
01/10, 11:30–12:05 (Europe/Madrid), Ada Lovelace (Paraninfo)
Idioma: Español

En Google, ejecutamos más de 2 mil millones de contenedores nuevos en nuestra plataforma Borg cada semana: trabajos interactivos, procesamiento batch, one-shot, etc. La orquestación es muy importante cuando necesitamos desplegar una nueva versión de una stack, como como los servicios de autenticación, cuyo fallo puede hacer que la mayoría, si no todos, los productos de Google queden inutilizables. Necesitamos validar una nueva versión, realizar un análisis canary y desplegarla progresivamente en cientos de miles de máquinas en decenas de centros de datos en todo el mundo.

Python es una herramienta central que usamos para esta multitud de propósitos. Tenemos cientos de años de ingeniería invertidos en herramientas de Python para administrar nuestros servicios. ¿Cómo evoluciona este código? ¿Cómo abordamos la mantenibilidad? ¿Cómo tratamos la optimización del rendimiento? Y la migración 2 a 3, ¿fue un dolor?

Esta charla ofrecerá información detallada sobre todo lo que SRE ha utilizado Python durante la última década para administrar los servicios más importantes y críticos del planeta.


Nivel de la propuesta

Intermedio

Temática

Sys / DevOps / Tests / Agile

Soy Dr. en Informática y Sr. Staff SRE en Google, donde lidero al equipo que soporta los servicios de autenticación de todos los productos de Google. Trabajamos en escalabilidad, fiabilidad, automatización y muchas cosas más para mantener infraestructura crítica que miles de millones de personas utilizan cada día. Uso Python a diario con nuestra pila de servicios desde hace más de una década. Anteriormente desarrollaba el sistema de batch processing de ATLAS, el mayor detector del LHC, también escrito en Python, PanDA procesa miles de trabajos de análisis a día de hoy y permitió descubrir el Bosón de Higgs en 2012.