Nächste Arbeit

Senior/Principal ML Systems Architect (TensorFlow + Python) in IK Aktualnaya Mehanika, OOO

Gepostet vor über 30 Tagen

8 Ansichten

IK Aktualnaya Mehanika, OOO

IK Aktualnaya Mehanika, OOO

0
0 Bewertungen
keine Erfahrung
Vollzeitarbeit

übersetzt von Google

Übersicht Wir suchen einen äußerst erfahrenen ML-Systemarchitekten, der eine skalierbare, produktionstaugliche Architektur für unseren Machine-Learning-Löser entwirft und implementiert. Diese Rolle verbindet Forschungsprototypen und den kommerziellen Einsatz und stellt Zuverlässigkeit, Wartbarkeit und Leistung in einem gemischten Technologie-Stack sicher. Verantwortlichkeiten Architekt der ML Solver-Plattform: Definieren Sie eine modulare Architektur für Datenvorverarbeitung, Modellausführung, u

Übersicht 

Wir suchen einen äußerst erfahrenen ML-Systemarchitekten, der eine skalierbare, produktionstaugliche Architektur für unseren Machine-Learning-Löser entwirft und implementiert. Diese Rolle verbindet Forschungsprototypen und den kommerziellen Einsatz und stellt Zuverlässigkeit, Wartbarkeit und Leistung in einem gemischten Technologie-Stack sicher. 

Verantwortlichkeiten 

  • Architekt der ML Solver-Plattform: 

  • Definieren Sie eine modulare Architektur für Datenvorverarbeitung, Modellausführung, und Nachbearbeitung. 

  • Etablieren Sie klare API-Verträge zwischen Python/TensorFlow und C#-Diensten. 

  • ML-Workflows produzieren: 

  • Forschungscode in robuste, testbare und beobachtbare Dienste umwandeln. 

  • Implementieren Sie CI/CD-Pipelines, automatisierte Tests und Reproduzierbarkeitsstandards. 

  • Integration und Interoperabilität: 

  • Entwerfen Sie REST/gRPC-Endpunkte für die sprachübergreifende Kommunikation. 

  • Stellen Sie die Kompatibilität mit C#/.NET-Diensten sicher. 

  • Leistung und Skalierbarkeit: 

  • Optimieren Sie die GPU-/CPU-Auslastung, Batch-Strategien und die Speicherverwaltung. 

  • Planen Sie Szenarien mit mehreren Modellen und mehreren Mandanten. 

  • MLOps & Lifecycle Management: 

  • Implementieren Sie Modellversionierung, Artefaktregistrierungen und Bereitstellungsworkflows. 

  • Richten Sie Überwachung, Protokollierung und Warnungen für die Solver-Leistung ein. 

  • Sicherheit und Compliance: 

  • Wenden Sie Best Practices für die Verwaltung von Geheimnissen, das Scannen von Abhängigkeiten und die sichere Speicherung von Artefakten an. 

Erforderliche Fähigkeiten und Erfahrung 

  • ML-Frameworks: Experte für TensorFlow (TF2/Keras), Erfahrung mit ONNX Runtime für Inferenz. 

  • Programmierung: Fortgeschrittenes Python für ML; ausgeprägte Kenntnisse in Verpackung, Typprüfung und Leistungsprofilierung. 

  • Architektur: Nachgewiesene Erfahrung beim Entwerfen skalierbarer ML-Systeme für die Produktion. 

  • APIs: Kenntnisse in gRPC/Protobuf und REST für die sprachübergreifende Integration. 

  • MLOps: CI/CD-Pipelines, Containerisierung (Docker/Kubernetes), Modellregistrierungen, Reproduzierbarkeit. 

  • Leistungsoptimierung: GPU-Beschleunigung (CUDA/cuDNN), gemischte Präzision, XLA, Profilierung. 

  • Beobachtbarkeit: Metriken, Ablaufverfolgung, strukturierte Protokollierung, Dashboards. 

  • Sicherheit: SBOM, Bildsignierung, rollenbasierter Zugriff, Schwachstellenscan. 

Bevorzugte Qualifikationen 

  • Erfahrung mit ONNX Runtime Training, PyTorch oder hybriden ML-Architekturen. 

  • Vertrautheit mit verteilten Trainingsstrategien und Multi-GPU-Setups. 

  • Kenntnisse über Feature Stores und Datenvalidierungs-Frameworks. 

  • Kontakt mit regulierten Umgebungen und Compliance-Frameworks. 

Tools & Technologien 

  • ML: TensorFlow, ONNX Runtime, tf2onnx. 

  • APIs: FastAPI, gRPC. 

  • DevOps: GitLab CI/GitHub Actions, Docker, Kubernetes. 

  • Überwachung: Prometheus, Grafana, OpenTelemetry. 

  • Sicherheit: HashiCorp Vault, Sigstore. 

Warum bei uns mitmachen? 

  • Arbeiten an hochmodernen ML-Lösungen, die in kommerzielle Engineering-Software integriert sind. 

  • Architektur definieren, die sich über globale Bereitstellungen hinweg skalieren lässt. 

  • Arbeiten Sie mit einem Team von Experten für ML, Software-Engineering und UI-Entwicklung zusammen. 

Standort: Remote für UA oder vor Ort für Großbritannien Anstellungsart: Vollzeit style="font-weight: normal; font-style: normal">Wir stellen einen Senior ML Systems Architect ein, der das Design unseres TensorFlow-basierten Lösers für kommerzielle Anwendungen leitet. Sie definieren eine skalierbare Architektur, stellen die Produktionsbereitschaft sicher und integrieren ML mit C#-Diensten. Muss über umfassende Kenntnisse in TensorFlow, Python und MLOps verfügen. Bewerben Sie sich jetzt, um die Zukunft von ML in der Engineering-Software zu gestalten. 

übersetzt von Google

keine Erfahrung
Vollzeitarbeit
Wollen Sie den richtigen Job finden?
Neue Jobs in deinem Telegram
Abonnieren
wir verwenden cookies
Akzeptieren