Site Reliability Engineering Manager
Trabajo disponible en:
35180, Ciudad Juárez, Durango, México
Publicado en 2026-03-10
Empresa:
Apex Systems
Tiempo completo
puesto Publicado en 2026-03-10
Especializaciones laborales:
-
TI/Tecnología
Ingeniería de confiabilidad del sitio/Confiabilidad del sitio, Ingeniero de sistemas
Descripción del trabajo
Core Responsibilities
Infrastructure & Reliability
Own and manage shared AWS infrastructure used across the company
Maintain and operate EKS clusters
Ensure reliability, scalability, and performance of production systems
Monitor infrastructure health and proactively address issues
Observability & Monitoring
Own monitoring, logging, and alerting across infrastructure and applications
Heavy use of:
Grafana
Open Search clusters
Design alerts that:
Detect infra and application issues early
Are actionable (not noisy)
Drive observability standards across teams
CI/CD & Automation
Design, build, and maintain CI/CD pipelines
Improve deployment safety, speed, and consistency
Automate infrastructure and development workflows
Partner closely with Engineering and QA to support reliable releases
Must‐Have Experience
Senior‐level experience in SRE, Dev Ops, or Platform Engineering
Strong AWS experience
Infrastructure as Code (Terraform preferred)
Kubernetes / EKS in production environments
Designing and operating CI/CD pipelines
Hands‐on experience with observability tooling
Monitoring
Logging
Alerting (Grafana or similar)
Tenga en cuenta que actualmente no se aceptan solicitudes desde su jurisdicción. Las preferencias de los candidatos son decisión del empleador o del agente reclutador.
Para buscar, ver y solicitar empleos que acepten solicitudes de su ubicación o país, toque aquí para realizar una búsqueda:
Para buscar, ver y solicitar empleos que acepten solicitudes de su ubicación o país, toque aquí para realizar una búsqueda:
Busque más trabajos aquí:
×