Unser Kunde sucht Sie zum nächstmöglichen Zeitpunkt!
Stellenbeschreibung
* Aufbau und kontinuierliche Weiterentwicklung einer unternehmensweiten AI-Plattform auf Basis von Kubernetes
* Deployment, Betrieb und Optimierung von Large Language Models (LLMs) auf GPU-basierten Infrastrukturen
* Entwicklung und Betrieb leistungsfähiger Model-Serving- und Inference-Services
* Etablierung, Betrieb und Weiterentwicklung von MLOps-Standards sowie einer On-Premise-MLOps-Plattform (u. a. ClearML, OpenShift)
* Konzeption und Implementierung von LLMOps-Workflows für produktive GenAI-Services (inkl. Serving-/Runtime-Konfiguration, Guardrails & Policies, Evaluierung, Regressionstests sowie Kosten- und Qualitätsmonitoring)
* Containerisierung und Deployment von AI-Services mittels Docker und Kubernetes
* Skalierung sowie Performance-Optimierung von GPU- und CPU-basierten Workloads
* Entwicklung robuster und skalierbarer AI-APIs und Services für interne Anwendungen
* Aufbau und Weiterentwicklung von Monitoring-, Logging- und Observability-Lösungen für AI-Systeme
* Automatisierung von Infrastruktur-, Plattform- und Modell-Releases mithilfe von CI/CD, GitOps und Infrastructure-as-Code (inkl. sicherer Rollouts, Rollbacks und Standardisierung von Deployments)
* Analyse sowie kontinuierliche Optimierung von Performance, Skalierbarkeit und Systemstabilität
Profil
* Erfolgreich abgeschlossenes Studium (mind. Bachelor) in Informatik, Wirtschaftsinformatik oder einer vergleichbaren Qualifikation
* Verhandlungssichere Deutsch- und Englischkenntnisse in Wort und Schrift
* Erfahrung im Aufbau und/oder Betrieb von Cloud-, Plattform- oder Infrastruktur-Systemen
* Fundierte Kenntnisse in Kubernetes sowie in Container-Technologien
* Praxiserfahrung im Umgang mit Microservices, APIs und verteilten Systemen
* Erfahrung im Bereich MLOps und/oder LLMOps (z. B. Model-/Prompt-Lifecycle, Serving, Evaluierung und Monitoring) sowie mit produktiven AI-Systemen
* Kenntnisse in DevOps-Praktiken wie CI/CD, GitOps und Infrastructure-as-Code sowie im Betrieb und Release-Management von Vorteil
* Erfahrung im Umgang mit GPU-Workloads oder High-Performance-Systemen von Vorteil
Das Angebot
* Teamspirit und Diversität
* Work-Life-Balance
* Attraktive Vergütung
* Sozialleistungen
* Vielseitige Weiterbildungsmöglichkeiten
* Team- und Sportevents
* Globales Netzwerk
* Attraktives MitarbeiterempfehlungsprogrammAI Plattform Engineer (m/w/d) – Akkodis Germany Tech Experts GmbH | Job.bo