Site Reliability Engineer | SRE; Pleno/Sênior
South Carolina, USA
Listed on 2025-12-03
-
IT/Tech
Systems Engineer, SRE/Site Reliability
Missão:
Sua missão será garantir a confiabilidade, escalabilidade e performance das infraestruturas e aplicações de nossos clientes, atuando de forma proativa na implementação de soluções eficientes de monitoramento, otimização de custos e estabilidade dos serviços.
Buscamos uma pessoa SRE generalista, com olhar estratégico e técnico, que possa atuar de forma transversal com foco em observabilidade, Fin Ops e automation. A principal responsabilidade será colaborar com equipes multifuncionais para estruturar e evoluir práticas que garantam ambientes resilientes, eficientes e sustentáveis, apoiando tanto a operação quanto o desenvolvimento contínuo das soluções.
Responsabilidade:
- Colaborar com equipes envolvidas no projeto / poc / sustentação / serviços internos;
- Atender demandas do cliente (dentro de um ecossistema ágil);
- Implementar e configurar monitoramentos detalhados utilizando as melhores ferramentas, garantindo visibilidade em tempo real da performance e saúde dos sistemas e aplicações.
- Definir e acompanhar métricas e alertas, integrando ferramentas e fluxos de trabalho para otimizar o tempo de resposta a incidentes e assegurar a estabilidade dos serviços em produção.
- Implementar Fin Ops através das melhores ferramentas, otimizando custos e garantindo eficiência no uso de recursos.
- Gerenciar Código Fonte (git), garantindo boas práticas de versionamento e colaboração na equipe;
- Orquestrar Contêineres (Docker, Kubernetes, Terraforms), projetando e mantendo arquiteturas baseadas em contêineres, garantindo alta disponibilidade e escalabilidade com Kubernetes;
- Projetar e manter pipelines de CI/CD eficazes, automatizando testes, integração e implantação contínua;
- Selecionar, implementar e manter ferramentas de CI/CD alinhadas com os requisitos do projeto;
- Projetar, implantar e manter serviços em nuvem em plataformas como AWS, GCP e outras;
- Configurar proxies e equilibradores de carga para otimizar o desempenho e a resiliência;
- Implementar e manter soluções de monitoramento e logging para garantir a visibilidade operacional;
- Participação em troubleshooting de networking (triagem, packet loss e roteamento);
- Desenvolver scripts e automações usando linguagens como bash, Power Shell.
Requisitos:
- Experiência com ferramentas de observabilidade;
- Vivência sólida em Fin Ops
- Atuação com sistemas distribuídos (architectures, micro-services, high-availability, elections);
- Administração de containers e serviços em nuvem;
- Configuração e gerenciamento de proxies e load balancing (Nginx, HAProxy, Envoy);
- Experiência com logging (como Splunk, Sys Log, ELK Stack, Linux Journal e/ou grep);
- Versionamento de código e práticas de CI/CD;
- Sólido conhecimento em Linux (bash, debugging)
- Networking (triaging, packet loss, routing);
- Experiência com scripting em Bash e/ou Power Shell;
- Background na área de engenharia de software/desenvolvimento.
Diferenciais que farão você se destacar ainda mais:
- Experiência em Fin Ops com Cloudability e Turbonomic;
- Gerenciamento de infraestrutura com Apptio;
- Experiência com Datadog, Open Telemetry, Instana, Grafana, Elastic APM, Prometheus, Kibana e Elasticsearch.
- Treinamentos IBM e Datadog relevantes, como:
- IBM Application Performance Monitoring (APM);
- IBM Cloudability ou Premium Cloudability;
- Turbonomic;
- Apptio;
- Open Telemetry;
- Datadog observabilidade.
O que mais você encontra aqui:
- Liberdade com responsabilidade:
Trabalhamos de forma 100% remota, permitindo que você atue de qualquer lugar (anywhere office). - Cultura de Desenvolvimento:
Avaliação de desempenho, plano de desenvolvimento individual (PDI), Programa Investindo em Você, Programa de Desenvolvimento de Talentos. - Saúde e Qualidade de Vida:
Programa de Saúde e Bem-Estar, plano de saúde, plano odontológico, equilíbrio entre vida pessoal e profissional, desafios de saúde e prática esportiva. - Programa Dividir para Multiplicar:
Trabalhamos de forma colaborativa e dividimos os lucros! - Day Off de Aniversário:
Escolha um dia no mês do seu aniversário para aproveitar, comemorar e descansar. - Auxílio Equipamento/Home Office.
- Vale Flexível:
Benefício para gastos diários. - Programa de Indicação Premiada:
Indique pessoas incríveis para trabalhar conosco e ganhe $$. - Seguro de Vida:
Proteção e segurança para você e sua família. - E mais!!
Aviso de Privacidade - Processo de Recrutamento & Seleção:
Aqui na Evoluum prezamos pelaliberdade de ser vocêe todas as nossas vagas são destinadas a todas as pessoas. Valorizamos as diferenças de todas as identidades de gênero, origem, crença, religião, orientação sexual e afetiva, deficiência, raça, etnia, idade, condição de saúde e/ou social, nacionalidade, corpo e quaisquer atributos intrínsecos à pluralidade humana. Buscamos pessoas que acreditam no valor daliberdadee daconfiança, que tenhamempatiae respeitam as diferenças, que sejamcolaborativase estejam prontas paraevoluir.
#J-18808-Ljbffr(If this job is in fact in your jurisdiction, then you may be using a Proxy or VPN to access this site, and to progress further, you should change your connectivity to another mobile device or PC).