Wir laden Sie ein, unserem Team als Lead Data Engineer beizutreten.Aufgaben: Design und Bereitstellung von On-Prem Data Lakehouse und Bildung von Datenflüssen (Stream/Batch) für CV/Recsys/Forecast, mit garantierter Qualität/Verfügbarkeit, Beobachtbarkeit und Kontrolle Kosten.Verantwortungsbereiche: Datenarchitektur und -modellierung, Zonierung (roh/kuratiert/Feature), Datenverträge; Stream- und Batch-Pipelines, Showcases (Feature Store/Data Marts), SLA/SLO; Integration von Quellen: POS/ERP/WMS/e
Wir laden Sie ein, unserem Team als Lead Data Engineer beizutreten.
Aufgaben: Design und Bereitstellung von On-Prem Data Lakehouse und Bildung von Datenflüssen (Stream/Batch) für CV/Recsys/Forecast, mit garantierter Qualität/Verfügbarkeit, Beobachtbarkeit und Kontrolle Kosten.
Verantwortungsbereiche:
- Datenarchitektur und -modellierung, Zonierung (roh/kuratiert/Feature), Datenverträge;
- Stream- und Batch-Pipelines, Showcases (Feature Store/Data Marts), SLA/SLO;
- Integration von Quellen: POS/ERP/WMS/e-com/mobile, CDC (Debezium), Schemata/Katalog;
- Datenqualität/Herkunft/Metadaten: DQ-Regeln, automatische Tests, Katalogisierung, PII-Kontrolle;
- Produktivität/Zuverlässigkeit: Kanäle nahezu in Echtzeit, Speicher-/Berechnungsoptimierung, kostenbewusstes Design;
- Vektorebene für Personalisierung: Versionen von Einbettungen, SLA-Updates, Kompatibilität mit Online-Bereitstellung;
- Interaktion mit DS/MLOps: Funktionsanforderungen, Versionierung, Servicelevel.
OKR (Beispiele):
- DQ-Regelstabilität 99 % bei kritischen Tabellen;
- SLA der Funktionsverfügbarkeit für Inferenz ist zu 99,5 % erfüllt;
- Keine SRM-Vorfälle in Experimenten; vollständige Rückverfolgbarkeit.
Anforderungen (Muss):
- 5+ Jahre in Data Engineering, 2+ Jahre in Design und Betrieb von On-Prem-Plattformen;
- Produktionserfahrung in Streaming (Kafka/Redpanda, CDC über Debezium) und Batch-Verarbeitung;
- Design von Lakehouse auf Iceberg/Delta/Hudi mit ACID, Schemaentwicklung und Zeitreise;
- Orchestrierung (Airflow oder Dagster), dbt Core-Transformationen;
- Schaufenster auf ClickHouse und SQL-Ebene (PostgreSQL/Trino/Presto); praktiziert DQ (Great Expectations oder ähnlich), Abstammung (OpenLineage), Verzeichnis/Metadaten (OpenMetadata oder DataHub);
- Infrastruktur: Kubernetes/OpenShift, Docker/Containerd, Terraform/Ansible, GitLab CI; Beobachtbarkeit: Prometheus/Grafana/Loki, OpenTelemetry;
- Führende SQL- und Abfrageoptimierung;
- Zugriff/PII- und Audit-Erfahrung.
Wäre ein Pluspunkt:
- Lebensmitteleinzelhandel/FMCG, SLO für Kassen-/Preisereignisse, Integration mit ERP/WMS;
- ClickHouse-Replikation/Sharding, Datenverträge als Code, FinOps (Einheitsökonomie auf Tabellen-/Jobebene);
- Vektorindizes (pgvector/FAISS/Milvus) zur Personalisierung;
Technischer Stack (on-prem):
Speicher und Formate
- Objekt: MinIO | CEPH
- Lakehouse-Tabellen: Apache Iceberg | Deltasee | Apache Hudi
- Dateiformate: Parquet| ORC
Verarbeitung und Transformationen
- Cluster: Apache Spark oder Apache Flink oder Apache Beam
- Orchestrierung: Apache Airflow | Dagster
- SQL-Transformationen: dbt Core
Streaming und Integrationen
- Event Bus: Apache Kafka | Redpanda
- CDC: Debezium
Storefronts und SQL-Ebene
- Analytisches DBMS: ClickHouse
- Betrieblich/OLTP und Zeitreihen: PostgreSQL oder TimescaleDB
- Federated SQL Engine: Trino | Presto
Datenqualität, Katalog und Herkunft
- Datenqualität: Great Expectations oder Soda
- Herkunft: OpenLineage
- Katalog/Metadaten: OpenMetadata oder DataHub
Infrastruktur und Betrieb
- Container und Orchestrierung: Docker, Kubernetes oder OpenShift
- Infrastruktur als Code: Terraform | Ansible
- CI/CD: GitLab CI
- Beobachtbarkeit: Prometheus, Grafana, Loki, OpenTelemetry
Sicherheit und Zugriffskontrolle
- Geheimnisse: HashiCorp Vault | Sealed Secrets
- Zugriffsrichtlinien: Policy-as-Code (OPA/Gatekeeper oder Kyverno)
Das Unternehmen bietet:
- remote oder hybrid Formatarbeit;
- Anstellung im Rahmen eines Gig-Vertrags oder im Land (Reservierung möglich);
- bezahlter Jahresurlaub von 24 Kalendertagen, bezahlter Krankheitsurlaub;
- regelmäßige Lohnzahlung ohne Verzögerungen und in festgelegten Beträgen, regelmäßige Gehaltsüberprüfung;
- Möglichkeit zur beruflichen und beruflichen Weiterentwicklung;
- Schulungen.
Kontaktperson: Kateryna, Tel. data-vacancyphone="">0984567857 (t.me/KaterynaB_HR)