×
Register Here to Apply for Jobs or Post Jobs. X

Senior Engineer mit Backend- und -Expertise in Embedding- und Retrieval-Systemen; m​/w​/d

Job in Germany, Pike County, Ohio, USA
Listing for: Westhouse Group
Full Time position
Listed on 2026-01-25
Job specializations:
  • Software Development
    Software Engineer
Job Description & How to Apply Below
Position: Senior Engineer mit Backend- und Performance-Expertise in Embedding- und Retrieval-Systemen (m/w/d)
Location: Germany

Westhouse ist eines der führenden internationalen Recruitment Unternehmen für die Vermittlung von hochqualifizierten Fachexperten in Bereichen wie IT Life Cycle, SAP, Engineering, Kaufmännischem und Fachberatung.

Für unseren Kunden suchen wir aktuell eine/n Senior Engineer mit Backend- und Performance-Expertise in Embedding- und Retrieval-Systemen (m/w/d) – Remote.

Rahmeninformationen
  • Referenz: 177117
  • Start:
  • Dauer: 3 Monate + Verlängerung
  • Standort:
    Remote
  • Arbeitsumfang: full-time
Ihre Qualifikationen
  • Mehrjährige Berufserfahrung in Python-Backend-Engineering mit Fokus Performance/Throughput
  • Nachweisbare Erfahrung mit Embedding-Pipelines (Chunking, Batching, Vektorisierung, Ingestion)
  • Sehr gutes Verständnis von Concurrency/Parallelisierung und Queue/Worker-Architekturen
  • Erfahrung mit GPU-Workloads im Produktivbetrieb (CUDA-Stack nicht zwingend Low-Level, aber praxisnah)
  • Erfahrung mit Performance-Messung (Profiling, Benchmarking, SLIs/SLOs, Latenz-/Throughput-Ziele)
  • Fähigkeit, Änderungen kompatibel und schrittweise (Feature Flags, Rollouts) einzuführen
  • Teamfähigkeit und enge Zusammenarbeit mit Dev Ops- und Backend-Teams
  • Sehr gute Deutschkenntnisse und gute Englischkenntnisse
Ihre Aufgaben
  • Unser Kunde betreibt und refactort eine RAG-Pipeline (Dokumente → Chunking → Embeddings → Index/Retrieval). Ziel ist es, Bottlenecks zu eliminieren, Durchsatz und Latenz zu optimieren und die Pipeline GPU-fähig sowie betriebssicher zu machen – ohne bestehende RAG-Verträge/Interfaces zu brechen.
  • Dafür sucht unser Kunde einen Senior Engineer (m/w/d) mit starker Backend- und Performance-Expertise in Embedding- und Retrieval-Systemen.
  • Analyse der bestehenden RAG/Embedding-Pipeline (Profiling, Bottleneck-Analyse, Hotspots)
  • Optimierung von Chunking-Strategien, Batch-Größen und Parallelisierung für Embedding-Jobs
  • Erhöhung von Throughput und Senkung von End-to-End-Latenz (inkl. IO, Queueing, Index-Updates)
  • Einführung/Verbesserung von Scheduling- und Worker-Konzepten (Concurrency, Backpressure, Retry/Timeout)
  • GPU-Enablement:
    Integration GPU-gestützter Worker, effiziente Ressourcennutzung, ggf. Mixed Precision/Batches
  • Enge Abstimmung mit Dev Ops zur GPU-Deployment- und Skalierungsstrategie (Kubernetes, Ressourcenlimits, Autoscaling)
  • Umsetzung hinter Feature Flags sowie Sicherstellung der Kompatibilität zu bestehenden RAG-Contracts
  • Messbarkeit sicherstellen:
    Metriken, Benchmarks, reproduzierbare Performance-Tests, Regression-Checks
Interessiert?

Wir freuen uns auf Ihre aussagekräftigen Bewerbungsunterlagen in elektronischer Form.

Ihre Ansprechpartner

Patrick Hoening
P:
E: p.hoe

#J-18808-Ljbffr
Position Requirements
10+ Years work experience
To View & Apply for jobs on this site that accept applications from your location or country, tap the button below to make a Search.
(If this job is in fact in your jurisdiction, then you may be using a Proxy or VPN to access this site, and to progress further, you should change your connectivity to another mobile device or PC).
 
 
 
Search for further Jobs Here:
(Try combinations for better Results! Or enter less keywords for broader Results)
Location
Increase/decrease your Search Radius (miles)

Job Posting Language
Employment Category
Education (minimum level)
Filters
Education Level
Experience Level (years)
Posted in last:
Salary