En DCS nos encontramos en búsqueda de un perfil semi senior para desempeñarse como Software Engineer para un Proyecto de Servicio SRE.
Este perfil es eminentemente práctico y se enfoca en la implementación, sus responsabilidades se centran en la ingeniería y la ejecución de la estrategia definida por el SRE Lead y el SRE Senior.
- Ejecución de proyectos de Ingeniería y Automatización: Desarrollar y mantener los pipelines de CI/CD para los servicios de la compañía, aplicando los estándares definidos por SRE Gobierno.
Construir, probar y desplegar infraestructura utilizando las herramientas de IaC de la compañía (principalmente Terraform).
Escribir scripts y herramientas (Python/Go/Bash) para automatizar tareas operativas recurrente identificadas por el equipo.
Implementar las configuraciones de observabilidad (dashboards, alertas, logs) en Datadog para nuevos y existentes servicios, basándose en los SLOs definidos.
- Operación diaria y soporte a la fiabilidad: Trabajar embebido con los SREs en formación y los equipos de desarrollo para resolver impedimentos técnicos y aplicar las mejores prácticas de fiabilidad en sus proyectos; participando activamente en la rotación de guardias (on-call), actuando como primera o segunda línea de respuesta técnica a incidentes.
Ejecutar runbooks para la resolución de incidentes y, a su vez, identificar oportunidades para mejorar y automatizar.
Participar en los análisis post-mortem, aportando el contexto técnico detallado del incidente y colaborando en la definición de las acciones de mejora.
- Colaboración y transferencia de conocimiento práctico: Actuar como un par técnico para los SREs en formación, ayudándolos a resolver problemas del día a día y compartiendo buenas prácticas a través del ejemplo; así como, colaborar en la documentación técnica, asegurando que los procesos y las soluciones implementadas queden claramente documentados.
Y participar en los Production Readiness Reviews (PRR), validando los aspectos técnicos de la implementación contra los checklists definidos.
Tareas diarias y semanales
Se espera que el SRE Intermedio dedique su tiempo a:
- 60% - Ingeniería Práctica (Hands-on): Escribir código/scripts de automatización, configurar pipelines, desplegar infraestructura con Terraform, configurar alertas en Datadog.
- 20% - Operación y Soporte: Atender turnos on-call, resolver incidentes, apoyar a los equipos de desarrollo, ejecutar PRRs.
- 20% - Colaboración y Documentación: Trabajar en pareja con SREs en formación, documentar procedimientos, participar en reuniones de equipo y post-mortems
Conocimientos técnicos y experiencia requerida:
- Excluyente manejo de GCP: Experiencia demostrable con GKE IAM, GCE, Cloud SQL.
- Deseable manejo de AWS
- Manejo avanzado de Terraform: escritura de configuraciones y despliege de recursos.
- Manejo avanzado de Ansible (o similar)
- Manejo avanzado de Python o Go: escribir scripts robustos y funcionales para automatizacion de tareas e interacción con APIs.
- Solido domino de Bash para tareas de operativas y de scripting en Linux
- Manejo avanzado de Kubernetes y Docker
- Experiencia implementando y manteniendo pipelines de CI/CD
- Familiaridad con herramientas como GitLab CI, Jenkins, Bitbucket Pipelines.
- Experiencia práctica configurando monitoreo, dashboards y alertas en herramientas como Datadog (preferible), Prometheus/Grafana, o similares
Habilidades Blandas:
- Fuerte capacidad para trabajar en equipo y colaborar.
- Buenas habilidades de comunicación.
- Mentalidad de resolución de problemas y proactividad.
- Capacidad para operar con autonomía en tareas bien definidas