AI DevOps/Infrastructure/Optimisation Job Geneva area,Genf Switzerland,Software Development

Position: AI DevOps / Infrastructure / Optimisation
Location: Genf

AI Dev Ops / Infrastructure / Optimisation

Infomaniak développe une plateforme IA open source hébergée sur ses propres datacenters suisses. Nous déployons des modèles de langage à grande échelle et construisons des agents intelligents pour nos produits (kChat, kMeet, kDrive). Nous recherchons un
· e AI Engineer pour concevoir, implémenter et optimiser nos agents IA, avec un focus sur la qualité, la fiabilité et l’expérience utilisateur.

Tes responsabilités

Déploiement & Orchestration : Déployer, maintenir et optimiser des LLM sur Kubernetes en maximisant l’efficacité des ressources GPU / Compute.
CI/CD & Automatisation :
Améliorer et industrialiser nos pipelines Gitlab CI pour les modèles IA (build, test, déploiement, rollback). Piloter les déploiements via Flux CD (Git Ops).
Monitoring & Observabilité :
Renforcer notre stack Prometheus / Grafana / Victoria Metrics pour une visibilité fine sur les performances, la consommation GPU, la latence, la disponibilité et de manière générale la santé des services IA.
Optimisation des ressources :
Travailler sur l’efficacité des coûts et des performances (autoscaling, scheduling, gestion des quotas, optimisation des images...).
Qualité & Fiabilité :
Garantir la robustesse, la sécurité et la reproductibilité des déploiements dans un environnement critique.

Le profil qui nous fait vibrer

Maîtrise des frameworks modernes de serving (ex : vLLM, TGI, Tensor

RT-LLM...).
Maîtrise de Git Lab CI (pipelines, runners, variables, intégration avec Kubernetes).
Expérience confirmée en Kubernetes (operators, Helm, CRDs, networking, autoscaling).
Expérience avec Flux CD (Git Ops, Helm Releases, Kustomize, automatisation des déploiements).
Expérience avec Prometheus / Grafana (dashboards, alerting, exporters).
Connaissance des infrastructures GPU (NVIDIA, CUDA, GPU scheduling, monitoring).
Appétence pour la qualité, la fiabilité et la performance.
Capacité à travailler en environnement critique (SLA élevé, haute disponibilité).
Bonne capacité à collaborer avec des équipes ML et Dev.

Un si tu as des connaissances en

Curiosité technique, goût pour les challenges innovants et l’optimisation.
Les contributions open source ou les side projects sont appréciés.
Tu aimes travailler en équipe, et fais preuve d’une communication positive.
Ton humour, ta flexibilité et ton esprit d’équipe sont des atouts indispensables pour travailler dans le fun.

La stack technique que l’on utilise

Lang Chain
Pydantic-ai
vLLM
FastAPI

#J-18808-Ljbffr

AI DevOps​/Infrastructure​/Optimisation

AI DevOps/Infrastructure/Optimisation