Patexia, przyszłościowo myśląca firma technologiczna specjalizująca się w rozwiązaniach związanych z własnością intelektualną i patentami, poszukuje potencjalnego klienta Inżynier danych , aby dołączyć do naszego zdalnego zespołu. Jako główny inżynier danych będziesz kierować wykorzystaniem zaawansowanych narzędzi NLP i technologii sztucznej inteligencji do rozwiązywania skomplikowanych wyzwań związanych z restrukturyzacją podmiotów i analizą danych patentowych.
Kluczowe obowiązki:
- Przewodzij szybkim inicjatywom inżynieryjnym, wykorzystując ChatGPT OpenAI, aby skutecznie stawić czoła złożonym wyzwaniom w przetwarzaniu tekstu.
- Wykorzystaj wiedzę z zakresu inżynierii danych, koncentrując się na Google Cloud Platform ( GCP), takie jak BigQuery (BQ) i Google Cloud Storage (GCS), aby zapewnić wydajne przechowywanie i wyszukiwanie danych.
- Kieruj zespołami interdyscyplinarnymi w zrozumieniu wymagań projektu, opracowaniu innowacyjnych rozwiązań z wykorzystaniem narzędzi NLP i zapewnieniu sukces projektu.
- Bezproblemowe przechodzenie między rolami analityka danych, analityka danych i inżyniera danych w oparciu o wymagania projektu.
- Zarządzaj bazami danych (SQL/NoSQL) do celów zarządzania danymi i przetwarzaj niezbędne dane zadania inżynieryjne zgodnie z wymaganiami.
- Jasno wyrażaj ustalenia techniczne i skutecznie komunikuj złożone koncepcje interesariuszom nietechnicznym.
- Bądź na bieżąco z najnowszymi osiągnięciami technologii NLP, oceniaj ich znaczenie dla bieżących projektów i napędzaj ciągłe innowacje.
Kompleksowo dokumentuj rozwiązania i aktywnie przyczyniaj się do dzielenia się wiedzą w zespole.
Kwalifikacje i umiejętności:
Niezbędne wyposażenie:
- Udokumentowane doświadczenie w szybkiej inżynierii, ze szczególnym naciskiem na ChatGPT OpenAI.
- Umiejętność inżynierii danych potwierdzona praktycznym doświadczeniem z narzędziami GCP (BQ, GCS).
- Dogłębne zrozumienie koncepcji i metodologii NLP.
- Umiejętność płynnego przejścia między rolami naukowca danych, analityka danych i inżyniera danych.
- Doskonałe zdolności analityczne i doskonałe umiejętności rozwiązywania problemów.
- Doskonałe umiejętności komunikacji pisemnej i werbalnej.
- Zmotywowany i zdolny do pracy zarówno niezależnie, jak i zespołowo w zdalnym środowisku zespołu.
Dobry to mieć :
- Znajomość zaawansowanych technik NLP, takich jak analiza regresji, BERT, LLaMa, Transformers i LSTM.
- Doświadczenie z uczeniem maszynowym BigQuery (BQ ML) i wektorowych baz danych.
- Znajomość Google Dataflow i Google Dataproc do zadań związanych z przetwarzaniem danych.
Szczególnie interesują nas kandydaci posiadający doświadczenie czołowe zespoły inżynieryjne i doświadczenie w skutecznym wdrażaniu rozwiązań w projektach podobnych do naszego stosu technologicznego: React, Next.js, TypeScript, PHP, Python, GCP.