Back

Data Engineer (m/w/d)

Worldwide Salaried Open
Um zuverlässige KI-Automatisierung im großen Maßstab zu ermöglichen, suchen wir einen Data Engineer (m/w/d), der robuste Datenpipelines für den produktiven Einsatz, verteilte Datenverarbeitungssysteme und hochwertige Datenstrukturen für unsere KI-Plattform entwickelt. Du spielst eine zentrale Rolle dabei, sicherzustellen, dass KI-Systeme schnell, sicher und strukturiert auf die benötigten Daten zugreifen können.
  • Design und Aufbau skalierbarer Datenpipelines zur Aufnahme, Transformation und Bereitstellung strukturierter und unstrukturierter Daten
  • Entwicklung verteilter Datenverarbeitungs-Workflows zur Unterstützung von KI-Features wie Wissensabruf, Automatisierungsprozessen und Analytics
  • Aufbau und Betrieb von Daten-Ingestionssystemen zur Anbindung von Enterprise-APIs, Datenbanken, File Storage und Streaming-Quellen
  • Modellierung und Optimierung von Datensätzen für KI-Anwendungen, inklusive Embeddings-Pipelines und Vektorindexierung
  • Sicherstellung von Datenqualität, Konsistenz und Observability über alle Pipelines und Speicherlösungen hinweg
  • Optimierung von Abfrageperformance, Datenaktualität und Kosteneffizienz in großen Datensystemen
  • Enge Zusammenarbeit mit AI Engineers zur Umsetzung von Retrieval-Augmented Generation (RAG) und wissensbasierten KI-Features
  • Implementierung von Batch- und Echtzeitverarbeitung mittels Queues, Streaming-Systemen oder eventgetriebenen Architekturen
  • Design und Betrieb von Datenspeicherlösungen wie relationalen Datenbanken, Object Storage und Vektordatenbanken
  • Umsetzung von Data-Governance-Praktiken (z. B. Zugriffskontrolle, Datenherkunft/Lineage und Monitoring)
  • Zusammenarbeit mit DevOps bei containerisierten Deployments, Infrastrukturautomatisierung und Cloud-Datenservices
  • Zusammenarbeit mit unserem Data-Research-Team
  • Fundierte Erfahrung im Aufbau von Datenpipelines im produktiven Einsatz
  • Gutes Verständnis von verteilten Systemen und skalierbaren Datenarchitekturen
  • Erfahrung im Umgang mit großen Datenmengen und deren Performance-Optimierung
  • Vertrautheit mit modernen Daten-Tools und Workflow-Orchestrierung
  • Erfahrung in der Bereitstellung von Daten für AI/ML- oder Analytics-Anwendungen
  • Pragmatistische Arbeitsweise mit Fokus auf Zuverlässigkeit und Wartbarkeit
  • Fähigkeit zur Zusammenarbeit mit Backend-, AI- und Infrastruktur-Teams
  • Interesse an KI-getriebenen Datensystemen und neuen Entwicklungen im Bereich Dateninfrastruktur
Unser Tech Stack & Bereiche
  • SQL (mindestens 5 Jahre Erfahrung)
  • Praktische Erfahrung mit Python
  • PostgreSQL / analytische Datenbanken
  • Konzepte der verteilten Datenverarbeitung
  • Streaming- / Messaging-Systeme
  • Datenmodellierung & Pipeline-Orchestrierung
  • Vektordatenbanken & Embeddings-Pipelines
  • Cloud-Plattformen (Azure, GCP oder AWS)
  • Docker & CI/CD
  • Impact: Aufbau intelligenter produktiver Systeme, die den Einsatz von KI in Unternehmen neu definieren
  • Innovation: Arbeit mit modernsten Frameworks und Modell-Ökosystemen
  • Kultur: Kollaboratives, kreatives und eigenverantwortliches Team
  • Flexibilität: Remote-first und flexible Arbeitszeiten
  • Wachstum: Zugang zu KI-Ressourcen, Tools und Weiterbildungen
  • Beteiligung: Virtual Stock Option Plan (VSOP)
neuland.ai ist ein innovatives deutsches Unternehmen mit umfassender KI-Expertise und Digitaltransformation. Basierend auf unserer umfangreichen Erfahrung aus zahlreichen KI-Projekten haben wir den neuland.ai HUB entwickelt - die vertrauenswürdige KI-Plattform „Made in Germany“. Mit unseren eigenentwickelten und zum Patent angemeldeten Technologien ist der neuland.ai HUB mehr als eine Plattform: Er ist der sichere Raum für souveräne, kontextgenaue KI-Nutzung in Wirtschaft, Politik und Wissenschaft. Unser Commitment zu Diversität: neuland.ai lebt von unterschiedlichen Perspektiven. Wir bewerten dich nach deinen Fähigkeiten und deiner Leidenschaft – unabhängig von Herkunft, Geschlecht, Alter, Religion oder Identität. Um unser Team noch vielfältiger aufzustellen, werden Kandidat:innen aus unterrepräsentierten Gruppen bei gleicher Eignung bevorzugt eingestellt. Trau dich und bewirb dich, auch wenn du (noch) nicht 100 % der Anforderungen erfüllst! Apply To This Job

More jobs

QA & Testing Automation Engineer — neuland.ai | Cologne / Remote (Germany)

Worldwide Salaried

DevOps / Platform Engineer (Kubernetes / AI Infrastructure)

Worldwide Salaried

RCM QA Specialist - Cash Posting

Worldwide Salaried

RCM QA Specialist - Adjustments / Refunds

Worldwide Salaried

RCM QA Specialist - Cash Posting

Worldwide Salaried

RCM QA Specialist - Adjustments / Refunds

Worldwide Salaried

Loss Control - Consultant

Worldwide Salaried

Inside Sales Supervisor

Worldwide Salaried

Case Manager

Worldwide Salaried

Case Manager

Worldwide Salaried

Experienced Online Chat Support Specialist – Deliver Exceptional Customer Experiences at arenaflex

Worldwide Salaried

Experienced Senior Software Engineer – Wells Fargo Job Application Status Interview for Remote Location with Competitive Salary Package and Comprehensive Benefits

Worldwide Salaried

Dental Biller for a USA Client (Remote)

Worldwide Salaried

Business Development Representative, Informatics - Minnesota/Wisconsin/Michigan

Worldwide Salaried

Experienced Customer Service Representative – Remote Opportunity for Delivering Exceptional Client Experiences and Driving Business Growth at arenaflex

Worldwide Salaried

Senior Product Designer

Worldwide Salaried

Real Estate Portfolio Manager

Worldwide Salaried

Experienced Remote Customer Service Representative – Call Center and Technical Support Specialist for Dynamic Work-From-Home Environment

Worldwide Salaried

[Remote/WFM] Amazon Flex Delivery – Newark, NJ

Worldwide Salaried

Require Arts Learning Coordinator in Richland County, SC

Worldwide Salaried