Patexia, ein zukunftsorientiertes Technologieunternehmen, das sich auf geistiges Eigentum und Patentlösungen spezialisiert hat, ist auf der Suche nach einem Lead Dateningenieur, um unserem Remote-Team beizutreten. Als Lead Data Engineer treiben Sie den Einsatz fortschrittlicher NLP-Tools und KI-Technologien voran, um komplexe Herausforderungen bei der Entitätsauflösung und Patentdatenanalyse zu lösen.
Hauptaufgaben:
- Speerspitze von Prompt-Engineering-Initiativen unter Nutzung von OpenAIs ChatGPT, um komplexe Herausforderungen in der Textverarbeitung effektiv zu bewältigen.
- Nutzen Sie Fachwissen im Bereich Data Engineering und konzentrieren Sie sich dabei auf die Google Cloud Platform ( GCP)-Tools wie BigQuery (BQ) und Google Cloud Storage (GCS), um eine effiziente Datenspeicherung und -abfrage sicherzustellen.
- Leiten Sie funktionsübergreifende Teams dabei, Projektanforderungen zu verstehen, innovative Lösungen mithilfe von NLP-Tools zu entwickeln und sicherzustellen Projekterfolg.
- Nahtloser Übergang zwischen den Rollen Data Scientist, Data Analyst und Data Engineer je nach Projektanforderungen.
- Verwalten Sie Datenbanken (SQL/NoSQL) für Datenverwaltungszwecke und erfassen Sie wichtige Daten Engineering-Aufgaben nach Bedarf.
- Technische Erkenntnisse klar formulieren und komplexe Konzepte effektiv an nicht-technische Stakeholder kommunizieren.
- Bleiben Sie über die neuesten Fortschritte in der NLP-Technologie auf dem Laufenden und bewerten Sie deren Relevanz für laufende Projekte und treiben kontinuierliche Innovationen voran.
Lösungen umfassend dokumentieren und aktiv zum Wissensaustausch im Team beitragen.
Qualifikationen und Fähigkeiten:
Muss vorhanden sein:
- Nachgewiesene Erfahrung im Prompt Engineering mit starkem Schwerpunkt auf OpenAIs ChatGPT.
- Kenntnisse in der Datentechnik, nachgewiesen durch praktische Erfahrung mit GCP-Tools (BQ, GCS).
- Solide Kenntnisse der NLP-Konzepte und -Methoden.
- Fähigkeit zum nahtlosen Wechsel zwischen den Rollen Data Scientist, Data Analyst und Data Engineer.
- Ausgeprägte analytische Fähigkeiten und versierte Fähigkeiten zur Problemlösung.
- Hervorragende schriftliche und mündliche Kommunikationsfähigkeiten.
- Selbstmotiviert und in der Lage, sowohl unabhängig als auch kollaborativ in einer Remote-Teamumgebung zu arbeiten.
Gut zu haben :
- Vertrautheit mit fortgeschrittenen NLP-Techniken wie Regressionsanalyse, BERT, LLaMa, Transformers und LSTM.
- Erfahrung mit BigQuery Machine Learning (BQ ML) und Vektordatenbanken.
- Kenntnisse von Google Dataflow und Google Dataproc für Datenverarbeitungsaufgaben.
Besonders interessiert sind wir an Kandidaten mit Erfahrung Führende Engineering-Teams und eine Erfolgsbilanz bei der erfolgreichen Implementierung von Lösungen in Projekten, die unserem Tech-Stack ähneln: React, Next.js, TypeScript, PHP, Python, GCP.