Senior Data Scientist, Brazil
Listed on 2026-06-07
-
Science
Research Scientist, Data Scientist
Somos especialistas em transformação tecnológica
, unindo expertise humana à IA para criar soluções tech escaláveis. Com mais de 8,000 CI&Ters ao redor do mundo, já formamos parcerias com mais de 1,000 clientes durante nossos 30 anos de história. Inteligência Artificial é nossa realidade.
Importante
: se você reside na Região Metropolitana de Campinas, sua presença nos escritórios da cidade será obrigatória, conforme a política de frequencia vigente.
A CI&T está buscando um Data Scientist para integrar um programa estratégico de dados para um cliente do setor financeiro com foco em crédito agrícola. O projeto visa transformar uma operação hoje altamente manual e fragmentada — em uma Plataforma de Inteligência de Dados escalável, com capacidade preditiva e integrada ao ecossistema tecnológico do cliente.
O profissional atuará em um ciclo iterativo de desenvolvimento: começa com dados estruturados disponíveis e evolui progressivamente para incorporar variáveis externas (clima, safra, cenário macroeconômico, dados não estruturados). Operará em um modelo de entrega IA-native, com Databricks, onde agentes de IA apoiam a geração de código e pipelines de modelagem, e o Data Scientist é responsável pela definição metodológica, seleção de features, validação estatística e ciclos de melhoria contínua.
Responsabilidades- Desenvolvimento de Modelos Preditivos:
Desenvolver modelos de propensão a default utilizando técnicas de ML tradicional (classificação binária, modelos ensemble como Random Forest, Gradient Boosting e equivalentes), com foco em precisão, recall e estabilidade em produção. - Seleção e Engenharia de Features:
Conduzir análise exploratória de dados (EDA), identificar e selecionar variáveis relevantes a partir de dados contratuais estruturados e, progressivamente, incorporar variáveis externas (clima, safra, cenário macroeconômico, dados de recuperação judicial e fontes de notícias). - Experimentação no Databricks:
Desenvolver e versionar experimentos de modelagem utilizando Databricks e MLflow, garantindo rastreabilidade de runs, parâmetros, métricas e artefatos de modelos ao longo dos ciclos iterativos. - Validação e Avaliação de Modelos:
Projetar e executar estratégias robustas de validação (cross-validation, backtesting temporal, análise de estabilidade de score) garantindo que os modelos performem de forma confiável em janelas de projeção crescentes (3, 6 e 12 meses). - Ciclos Iterativos de Melhoria:
Participar ativamente dos ciclos iterativos de refinamento do modelo — a cada sprint, incorporar novas variáveis, reavaliar performance e documentar aprendizados na Base de Conhecimento do programa. - Colaboração com Engenharia de Dados:
Trabalhar em estreita parceria com os Data Engineers para garantir que os pipelines de dados alimentem corretamente os modelos, e que as saídas dos modelos (scores, projeções, alertas) sejam disponibilizadas nas camadas corretas da plataforma. - Comunicação de Resultados:
Traduzir resultados técnicos dos modelos para linguagem de negócio, apoiando o Data Strategist na comunicação com stakeholders do cliente (superintendências, crédito, liderança). - Documentação Técnica:
Documentar metodologias, decisões de modelagem e resultados em formatos estruturados que alimentem a Base de Conhecimento e possam ser consumidos por agentes de IA em fases subsequentes. - Monitoramento em Produção:
Acompanhar a performance dos modelos em produção, identificar desvios de distribuição (data drift, concept drift) e propor ações corretivas ou re-treinamentos.
- Experiência sólida em ciência de dados com foco em modelagem preditiva para problemas de negócio em produção.
- Experiência comprovada com modelos de classificação e ensemble (Random Forest, Gradient Boosting, XGBoost ou equivalentes) em contextos de crédito, risco ou detecção de anomalias.
- Experiência com Databricks para desenvolvimento, experimentação e versionamento de modelos (Delta Lake, MLflow, Spark MLlib ou bibliotecas equivalentes em ambiente distribuído).
- Sólido domínio de seleção de features, tratamento de dados desbalanceados e estratégias de validação temporal para modelos de risco.
- Experiência em análise e modelagem de dados no…
(If this job is in fact in your jurisdiction, then you may be using a Proxy or VPN to access this site, and to progress further, you should change your connectivity to another mobile device or PC).