Ubicación: España (remoto o híbrido, desde España)
Contrato: Full-time
Idioma: Inglés B2+ (requerido)
Requisito: NIE España, o Pasaporte EU, residir o mudarse a España.
Buscamos un/a MLOps / DevOps Engineer para diseñar, implementar y operar la plataforma de IA/ML y GenAI de punta a punta: desde ingestión y entrenamiento hasta despliegue, monitoreo y gobernanza en la nube.
Serás clave para llevar modelos y agentes a producción de forma escalable, segura y confiable.
Diseñar, implementar y gestionar pipelines de CI/CD para modelos de IA/ML y apps de GenAI.
Construir y mantener infraestructura cloud-native (AWS/Azure/GCP) para todo el ciclo de vida de IA.
Automatizar provisión con IaC (Terraform, CloudFormation, Pulumi).
Garantizar escalabilidad, confiabilidad y alta disponibilidad en producción.
Aplicar buenas prácticas MLOps: versionado de modelos, monitoring, rollbacks, testing automatizado.
Colaborar con Data Engineering y ML para operacionalizar modelos e integrarlos a sistemas core.
Monitorear performance, investigar incidentes (RCA) y liderar su resolución.
Promover seguridad, compliance y gobernanza en todo el stack de IA.
Mejorar continuamente capacidades y tooling DevOps/MLOps del equipo.
(Nice) Actuar como referente técnico en DevOps/MLOps y fomentar cultura de automatización.
5+ años en DevOps / SRE / Platform Engineering.
Experiencia soportando workloads de ML/AI en producción.
Contenerización y orquestación: Docker, Kubernetes (microservicios).
Gestión de nubes (AWS/Azure/GCP), cost optimization y security best practices.
CI/CD con Jenkins / GitHub Actions / GitLab CI (o similares).
Familiaridad con workflows de ML, patrones de despliegue de modelos y herramientas MLOps (p.
ej., MLflow, Kubeflow, SageMaker, Vertex AI).
Inglés B2 o superior.
Certificaciones cloud/DevOps (AWS DevOps Engineer, Azure DevOps, Google Cloud DevOps).
Experiencia GenAI (LLMs/diffusion) en producción.
Conocimiento de sectores regulados (finanzas, etc.).
Contribuciones open-source o liderazgo en comunidad.
Scripting/automatización: Python, Bash (Go deseable).
Observabilidad: Prometheus, Grafana, ELK/EFK, Datadog.
Dominio de principios CI/CD e infra-as-code.
Seguridad y compliance en sistemas cloud y data/IA.
Trabajo en equipos ágiles y multifuncionales; foco en delivery continuo.
Ownership, resolución de problemas y comunicación clara con perfiles técnicos y no técnicos.