Senior Software Engineer-MLOps & Observability
Listed on 2026-06-01
-
Software Development
Cloud Engineer - Software, DevOps, Software Engineer, Backend Developer
Cloud Ferro jest dostawcą innowacyjnych usług przetwarzania w chmurze. Zapewnia i obsługuje chmury obliczeniowe dla wyspecjalizowanych rynków, m.in. dla europejskiego przemysłu kosmicznego, badań klimatu i nauki. Posiada duże doświadczenie w przechowywaniu i przetwarzaniu
wielkich zbiorów danych
, w tym wielopetabajtowych repozytoriów danych satelitarnych obserwacji Ziemi.
Z rozwiązań Cloud Ferro korzystają wiodące firmy i instytucje naukowe w Europie z różnych sektorów rynku, przetwarzające wielkie zbiory danych:
Europejska Agencja Kosmiczna (ESA), EUMETSAT, Europejskie Centrum Prognoz Średnioterminowych (ECMWF), Mercator Ocean International, Niemiecka Agencja Aero‑Kosmiczna (DLR), EGI
i wiele innych.
Aktualnie poszukujemy osób, które chcą z nami współtworzyć od podstaw suwerenną europejską platformę chmurową
, tworząc realną alternatywę dla globalnych hyperscalerów. Tworzymy kompletny stack PaaS oparty na Kubernetes i open source
. Od serverless i baz danych w modelu managed, po MLOps, monitoring i observability. Dołączając do nas, stajesz się częścią zespołu, który projektuje fundamenty platformy
, a nie rozwija gotowy produkt. Pracujemy w modelu pełnego ownershipu, gdzie każda decyzja architektoniczna zostaje z produktem na lata. To miejsce dla osób, które chcą realnie wpływać na kształt europejskiej chmury.
W tej roli rozwijasz ofertę MLOps i Observability dla naszej platformy chmurowej. Odpowiadasz end‑to‑end za Kubeflow
, Airflow
, Jupyter Notebooks oraz platformę monitoringową
. Od warstwy Kubernetes po API i dokumentację.Pracujesz w modelu you build it, you own it
, definiując to,
jak klienci trenują modele
, budują pipeline’y danych i monitorują swoje aplikacje
. To rola z realnym wpływem na kształt całej platformy ML.
- Pełny ownership MLOps i Observability: odpowiedzialność za Kubeflow, Airflow, Jupyter Notebooks oraz Observability as a Service w modelu you build it, you own it.
- Od architektury i kodu po API, dokumentację i stabilność operacyjną.
- Rozwój platformy monitoringowej: budowanie usług observability dla klientów na fundamencie przygotowanym przez Platform Dev Ops / SRE Engineerów.
- End‑to‑end delivery: od operatora/integracji, przez API endpoint i komendę CLI, po Terraform resource i dokumentację.
- Integracja z usługami wspólnymi: łączenie usług z IAM, billingiem i systemem quota rozwijanymi przez zespół Common Services.
- Współtworzenie standardów technicznych: praca z innymi Product Engineers nad kierunkiem rozwoju platformy i dobrymi praktykami.
- Doświadczenie z Kubernetes: samodzielne budowanie lub operowanie złożonymi systemami działającymi na K8s.
- Projektowanie systemów rozproszonych: praktyczna umiejętność tworzenia skalowalnych, niezawodnych usług.
- Biegłość w Go oraz dobra znajomość Pythona: tworzenie operatorów, kontrolerów, API i narzędzi CLI.
- Integracje i API: umiejętność budowania API wrapperów i integracji z frameworkami REST/gRPC.
- AI‑assisted development: swobodne korzystanie z narzędzi takich jak Claude Code czy Copilot jako naturalnej części codziennej pracy.
- Doświadczenie z ML platformami: Kubeflow, Jupyter Hub, GPU scheduling na Kubernetes. Znajomość Airflow lub innych narzędzi do orkiestracji workflowów.
- Monitoring multi‑tenant: ekspozycja metryk i logów per klient.
- Terraform providers: tworzenie custom resource’ów.
- Doświadczenie u cloud providera: praca w środowisku usług chmurowych.
- Kontrybucje open source: szczególnie w ekosystemie CNCF.
- Budowa platformy chmurowej: tworzysz od podstaw nowoczesny ekosystem, który wspiera europejski przemysł kosmiczny, badania klimatu i projekty naukowe o realnym znaczeniu.
- Autonomiczny zespół: dołączasz do nowo formowanej grupy działającej jak startup, ale w ramach stabilnej, dużej organizacji z dostępem do zasobów, których małe firmy nie zapewniają.
- Technologie CNCF na produkcji: pracujesz z Kubernetes, KNative, Cilium, ArgoCD, Kubeflow i innymi projektami open‑source, z możliwością kontrybuowania do nich.
- Realny wpływ: masz głos w decyzjach architektonicznych i produktowych, a Twoje…
(If this job is in fact in your jurisdiction, then you may be using a Proxy or VPN to access this site, and to progress further, you should change your connectivity to another mobile device or PC).