More jobs:
AI DevOps/Infrastructure/Optimisation
Job in
Genf, Geneva, Switzerland
Listed on 2026-05-10
Listing for:
infomaniak | The Ethical Cloud
Full Time
position Listed on 2026-05-10
Job specializations:
-
Software Development
DevOps, AI Engineer
Job Description & How to Apply Below
Location: Genf
AI Dev Ops / Infrastructure / Optimisation
Infomaniak développe une plateforme IA open source hébergée sur ses propres datacenters suisses. Nous déployons des modèles de langage à grande échelle et construisons des agents intelligents pour nos produits (kChat, kMeet, kDrive). Nous recherchons un
· e AI Engineer pour concevoir, implémenter et optimiser nos agents IA, avec un focus sur la qualité, la fiabilité et l’expérience utilisateur.
- Déploiement & Orchestration : Déployer, maintenir et optimiser des LLM sur Kubernetes en maximisant l’efficacité des ressources GPU / Compute.
- CI/CD & Automatisation :
Améliorer et industrialiser nos pipelines Gitlab CI pour les modèles IA (build, test, déploiement, rollback). Piloter les déploiements via Flux CD (Git Ops). - Monitoring & Observabilité :
Renforcer notre stack Prometheus / Grafana / Victoria Metrics pour une visibilité fine sur les performances, la consommation GPU, la latence, la disponibilité et de manière générale la santé des services IA. - Optimisation des ressources :
Travailler sur l’efficacité des coûts et des performances (autoscaling, scheduling, gestion des quotas, optimisation des images...). - Qualité & Fiabilité :
Garantir la robustesse, la sécurité et la reproductibilité des déploiements dans un environnement critique.
- Maîtrise des frameworks modernes de serving (ex : vLLM, TGI, Tensor
RT-LLM...). - Maîtrise de Git Lab CI (pipelines, runners, variables, intégration avec Kubernetes).
- Expérience confirmée en Kubernetes (operators, Helm, CRDs, networking, autoscaling).
- Expérience avec Flux CD (Git Ops, Helm Releases, Kustomize, automatisation des déploiements).
- Expérience avec Prometheus / Grafana (dashboards, alerting, exporters).
- Connaissance des infrastructures GPU (NVIDIA, CUDA, GPU scheduling, monitoring).
- Appétence pour la qualité, la fiabilité et la performance.
- Capacité à travailler en environnement critique (SLA élevé, haute disponibilité).
- Bonne capacité à collaborer avec des équipes ML et Dev.
- Curiosité technique, goût pour les challenges innovants et l’optimisation.
- Les contributions open source ou les side projects sont appréciés.
- Tu aimes travailler en équipe, et fais preuve d’une communication positive.
- Ton humour, ta flexibilité et ton esprit d’équipe sont des atouts indispensables pour travailler dans le fun.
- Lang Chain
- Pydantic-ai
- vLLM
- FastAPI
Note that applications are not being accepted from your jurisdiction for this job currently via this jobsite. Candidate preferences are the decision of the Employer or Recruiting Agent, and are controlled by them alone.
To Search, View & Apply for jobs on this site that accept applications from your location or country, tap here to make a Search:
To Search, View & Apply for jobs on this site that accept applications from your location or country, tap here to make a Search:
Search for further Jobs Here:
×