Następna praca

Główny inżynier danych w ATB-market

Opublikowano ponad 30 dni temu

5 wyświetleń

ATB-market

ATB-market

0
0 recenzji
Brak doświadczenia
lviv
Pełny etat

Przetłumaczone przez Google

Zapraszamy do dołączenia do naszego zespołu Główny Inżynier DanychZadania: projektowanie i wdrażanie lokalnego jeziora danych oraz tworzenie przepływów danych (strumień/partia) dla CV/Recsys/Forecast, z gwarancją jakości/dostępności, obserwowalność i kontrolowany koszt.Obszary odpowiedzialności: Architektura i modelowanie danych, podział na strefy (surowe/wyselekcjonowane/funkcje), kontrakty dotyczące danych; Potoki strumieniowe i wsadowe, prezentacje (sklepy z funkcjami/zestawy danych), SLA/SLO

Zapraszamy do dołączenia do naszego zespołu Główny Inżynier Danych

Zadania: projektowanie i wdrażanie lokalnego jeziora danych oraz tworzenie przepływów danych (strumień/partia) dla CV/Recsys/Forecast, z gwarancją jakości/dostępności, obserwowalność i kontrolowany koszt.

Obszary odpowiedzialności:

  • Architektura i modelowanie danych, podział na strefy (surowe/wyselekcjonowane/funkcje), kontrakty dotyczące danych; 
  • Potoki strumieniowe i wsadowe, prezentacje (sklepy z funkcjami/zestawy danych), SLA/SLO; 
  • Integracja źródeł: POS/ERP/WMS/e-com/mobile, CDC (Debezium), schematy/katalog; 
  • Jakość/pochodzenie/metadane danych: reguły DQ, testy automatyczne, katalogowanie, kontrola PII; 
  • Produktywność/niezawodność: kanały działające w czasie niemal rzeczywistym, optymalizacja przechowywania/obliczeń, projektowanie uwzględniające koszty; 
  • Warstwa wektorowa do personalizacji: wersje osadzania, aktualizacje SLA, kompatybilność z serwowaniem online; 
  • Interakcja z DS/MLOps: wymagania dotyczące funkcji, wersjonowanie, poziomy usług.

OKR (przykłady):

  1. Stabilność reguły DQ 99% na tabelach krytycznych; 
  2. SLA dotycząca dostępności funkcji na potrzeby wnioskowania jest spełniona w 99,5%; 
  3. Incydenty o zerowym SRM w eksperymentach; pełna identyfikowalność.

Wymagania (niezbędne):

  • 5 lat w inżynierii danych, ponad 2 lata w projektowaniu i obsłudze platform on-prem;
  • Doświadczenie produkcyjne w zakresie przesyłania strumieniowego (Kafka/Redpanda, CDC przez Debezium) i przetwarzania wsadowego;
  • Projekt domku nad jeziorem na Iceberg/Delta/Hudi z ACID, ewolucją schematu i podróże w czasie;
  • Orkiestracja (Airflow lub Dagster), transformacje dbt Core;
  • Okna sklepowe w warstwie ClickHouse i SQL (PostgreSQL/Trino/Presto); praktyki DQ (Wielkie Oczekiwania lub podobne), pochodzenie (OpenLineage), katalog/metadane (OpenMetadata lub DataHub); 
  • Infrastruktura: Kubernetes/OpenShift, Docker/Containerd, Terraform/Ansible, GitLab CI; obserwowalność: Prometheus/Grafana/Loki, OpenTelemetry; 
  • Wiodąca optymalizacja SQL i zapytań; 
  • Dostęp do danych osobowych i doświadczenie w audycie.

Będzie dodatkowym atutem: 

  • Handel detaliczny żywnością/FMCG, SLO dla zdarzeń związanych z kasą/ceną, integracja z ERP/WMS; 
  • Replikacja/fragmentowanie ClickHouse, kontrakty na dane jako kod, FinOps (ekonomika jednostkowa na poziomie tabeli/zadania); 
  • Indeksy wektorowe (pgvector/FAISS/Milvus) do personalizacji; 

Stos techniczny (lokalny):

Pamięć i formaty

  1. Obiekt: MinIO | CEPH
  2. Stoły Lakehouse: Apache Iceberg | Jezioro Delty | Apache Hudi
  3. Formaty plików: Parkiet| ORC

Przetwarzanie i transformacje

  1. Klastry: Apache Spark lub Apache Flink lub Apache Beam
  2. Orkiestracja: Apache Airflow | Dagster
  3. Transformacje SQL: rdzeń dbt

Streaming i integracje

  1. Magistrala zdarzeń: Apache Kafka | Redpanda
  2. CDC: Debezium

Witryny sklepowe i warstwa SQL

  1. Analityczny DBMS: ClickHouse
  2. Operacyjny/OLTP i szeregi czasowe: PostgreSQL lub TimescaleDB
  3. Stowarzyszony silnik SQL: Trino | Presto

Jakość danych, katalog i pochodzenie

  1. Jakość danych: Wielkie oczekiwania lub Soda
  2. Pochodzenie: OpenLineage
  3. Katalog/metadane: OpenMetadata lub DataHub

Infrastruktura i działanie

  1. Kontenery i orkiestracja: Docker, Kubernetes lub OpenShift
  2. Infrastruktura jako kod: Terraform | Ansible
  3. CI/CD: GitLab CI
  4. Obserwowalność: Prometheus, Grafana, Loki, OpenTelemetry

Bezpieczeństwo i kontrola dostępu

  1. Sekrety: HashiCorp Vault | Zapieczętowane tajemnice
  2. Zasady dostępu: policy-as-code (OPA/Gatekeeper lub Kyverno)

Firma oferuje:

  • zdalnym lub hybrydowym;
  • zatrudnienie na warunkach kontraktu koncertowego lub w państwie (możliwa rezerwacja);
  • płatny urlop wypoczynkowy w wymiarze 24 dni kalendarzowych, płatne zwolnienie lekarskie;
  • regularna wypłata wynagrodzeń bez opóźnień i w ustalonych kwotach, regularna kontrola wynagrodzeń;
  • możliwość rozwoju zawodowego i kariery;
  • szkolenia.


Osoba kontaktowa: Kateryna, tel. data-vacancyphone="">0984567857 (t.me/KaterynaB_HR)

Przetłumaczone przez Google

Brak doświadczenia
lviv
Pełny etat
Czy chcesz znaleźć odpowiednią pracę?
Nowe oferty pracy w Twoim Telegram
Subskrybuj
używamy cookies
Akceptować