SRE FinOps & APM; Instana, Datadog | Pleno/Sênior
South Carolina, USA
Listed on 2025-10-16
-
IT/Tech
Systems Engineer, IT Support, SRE/Site Reliability, Cloud Computing
Missão: Sua missão será garantir a confiabilidade, escalabilidade e performance das infraestruturas e aplicações de nossos clientes, com foco na implementação de soluções eficientes de monitoramento, otimização de custos e estabilidade dos serviços. A principal responsabilidade será colaborar com equipes multifuncionais para implementar práticas de observabilidade, Fin Ops e Cloudability.
Requisitos:
- Experiência com ferramentas de observabilidade (Open Telemetry ou Instana);
- Vivência sólida em Fin Ops, com foco em Cloudability e Turbonomic;
- Atuação com Apptio;
- Experiência com Datadog;
- Atuação com sistemas distribuídos (architectures, micro-services, high-availability, elections);
- Administração de containers e serviços em nuvem;
- Configuração e gerenciamento de proxies e load balancing (Nginx, HAProxy, Envoy);
- Experiência com logging (como Splunk, Sys Log, ELK Stack, Linux Journal e/ou grep);
- Versionamento de código e práticas de CI/CD;
- Sólido conhecimento em Linux (bash, debugging);
- Networking (triaging, packet loss, routing);
- Experiência com scripting em Bash e/ou Power Shell;
- Background na área de engenharia de software/desenvolvimento.
Diferenciais que farão você se destacar ainda mais:
- Experiência com Grafana, Elastic APM, Prometheus, Kibana e Elasticsearch.
- Certificações relevantes, como:
- IBM Application Performance Monitoring (APM)
- IBM Cloudability ou Premium Cloudability
- Turbonomic
- Apptio
- Datadog
- Open Telemetry
Responsabilidades principais:
- Colaborar com equipes envolvidas no projeto / poc / sustentação / serviços internos;
- Atender demandas do cliente (dentro de um ecossistema ágil);
- Implementar e configurar monitoramentos detalhados utilizando as melhores ferramentas, garantindo visibilidade em tempo real da performance e saúde dos sistemas e aplicações.
- Definir e acompanhar métricas e alertas, integrando ferramentas e fluxos de trabalho para otimizar o tempo de resposta a incidentes e assegurar a estabilidade dos serviços em produção.
- Implementar Fin Ops através das melhores ferramentas, otimizando custos e garantindo eficiência no uso de recursos.
Demais responsabilidades:
- Gerenciar Código Fonte (git), garantindo boas práticas de versionamento e colaboração na equipe;
- Orquestrar Contêineres (Docker, Kubernetes, Terraform), projetando e mantendo arquiteturas baseadas em contêineres, garantindo alta disponibilidade e escalabilidade com Kubernetes;
- Projetar e manter pipelines de CI/CD eficazes, automatizando testes, integração e implantação contínua;
- Selecionar, implementar e manter ferramentas de CI/CD alinhadas com os requisitos do projeto;
- Projetar, implantar e manter serviços em nuvem em plataformas como AWS, GCP e outras;
- Configurar proxies e equilibradores de carga para otimizar o desempenho e a resiliência;
- Implementar e manter soluções de monitoramento e logging para garantir a visibilidade operacional;
- Participação em troubleshooting de networking (triagem, packet loss e roteamento);
- Desenvolver scripts e automações usando linguagens como bash, Power Shell.
O que mais você encontra aqui:
- Liberdade com responsabilidade:
Trabalhamos de forma 100% remota, permitindo que você atue de qualquer lugar (anywhere office). - Cultura de Desenvolvimento:
Avaliação de desempenho, plano de desenvolvimento individual (PDI), Programa Investindo em Você, Programa de Desenvolvimento de Talentos. - Saúde e Qualidade de Vida:
Programa de Saúde e Bem-Estar, plano de saúde, plano odontológico, equilíbrio entre vida pessoal e profissional, desafios de saúde e prática esportiva. - Programa Dividir para Multiplicar:
Trabalhamos de forma colaborativa e dividimos os lucros! - Day Off de Aniversário:
Escolha um dia no mês do seu aniversário para aproveitar, comemorar e descansar. - Auxílio Equipamento/Home Office.
- Vale Flexível:
Benefício para gastos diários. - Programa de Indicação Premiada:
Indique pessoas incríveis para trabalhar conosco e ganhe $$. - Seguro de Vida:
Proteção e segurança para você e sua família. - E mais!!
Aviso de Privacidade - Processo de Recrutamento & Seleção:
Conheça a Evoluum:
Conduzimos a transformação digital de empresas, atuando com squad as a service, outsourcing, discovery, consultorias de arquitetura de software e soluções…
(If this job is in fact in your jurisdiction, then you may be using a Proxy or VPN to access this site, and to progress further, you should change your connectivity to another mobile device or PC).