Stellenanzeigen veröffentlichen
Ohne Provisionen einstellen
8 Ansichten
IK Aktualnaya Mehanika, OOO
Übersicht
Wir suchen einen äußerst erfahrenen ML-Systemarchitekten, der eine skalierbare, produktionstaugliche Architektur für unseren Machine-Learning-Löser entwirft und implementiert. Diese Rolle verbindet Forschungsprototypen und den kommerziellen Einsatz und stellt Zuverlässigkeit, Wartbarkeit und Leistung in einem gemischten Technologie-Stack sicher.
Verantwortlichkeiten
Architekt der ML Solver-Plattform:
Definieren Sie eine modulare Architektur für Datenvorverarbeitung, Modellausführung, und Nachbearbeitung.
Etablieren Sie klare API-Verträge zwischen Python/TensorFlow und C#-Diensten.
ML-Workflows produzieren:
Forschungscode in robuste, testbare und beobachtbare Dienste umwandeln.
Implementieren Sie CI/CD-Pipelines, automatisierte Tests und Reproduzierbarkeitsstandards.
Integration und Interoperabilität:
Entwerfen Sie REST/gRPC-Endpunkte für die sprachübergreifende Kommunikation.
Stellen Sie die Kompatibilität mit C#/.NET-Diensten sicher.
Leistung und Skalierbarkeit:
Optimieren Sie die GPU-/CPU-Auslastung, Batch-Strategien und die Speicherverwaltung.
Planen Sie Szenarien mit mehreren Modellen und mehreren Mandanten.
MLOps & Lifecycle Management:
Implementieren Sie Modellversionierung, Artefaktregistrierungen und Bereitstellungsworkflows.
Richten Sie Überwachung, Protokollierung und Warnungen für die Solver-Leistung ein.
Sicherheit und Compliance:
Wenden Sie Best Practices für die Verwaltung von Geheimnissen, das Scannen von Abhängigkeiten und die sichere Speicherung von Artefakten an.
Erforderliche Fähigkeiten und Erfahrung
ML-Frameworks: Experte für TensorFlow (TF2/Keras), Erfahrung mit ONNX Runtime für Inferenz.
Programmierung: Fortgeschrittenes Python für ML; ausgeprägte Kenntnisse in Verpackung, Typprüfung und Leistungsprofilierung.
Architektur: Nachgewiesene Erfahrung beim Entwerfen skalierbarer ML-Systeme für die Produktion.
APIs: Kenntnisse in gRPC/Protobuf und REST für die sprachübergreifende Integration.
MLOps: CI/CD-Pipelines, Containerisierung (Docker/Kubernetes), Modellregistrierungen, Reproduzierbarkeit.
Leistungsoptimierung: GPU-Beschleunigung (CUDA/cuDNN), gemischte Präzision, XLA, Profilierung.
Beobachtbarkeit: Metriken, Ablaufverfolgung, strukturierte Protokollierung, Dashboards.
Sicherheit: SBOM, Bildsignierung, rollenbasierter Zugriff, Schwachstellenscan.
Bevorzugte Qualifikationen
Erfahrung mit ONNX Runtime Training, PyTorch oder hybriden ML-Architekturen.
Vertrautheit mit verteilten Trainingsstrategien und Multi-GPU-Setups.
Kenntnisse über Feature Stores und Datenvalidierungs-Frameworks.
Kontakt mit regulierten Umgebungen und Compliance-Frameworks.
Tools & Technologien
ML: TensorFlow, ONNX Runtime, tf2onnx.
APIs: FastAPI, gRPC.
DevOps: GitLab CI/GitHub Actions, Docker, Kubernetes.
Überwachung: Prometheus, Grafana, OpenTelemetry.
Sicherheit: HashiCorp Vault, Sigstore.
Warum bei uns mitmachen?
Arbeiten an hochmodernen ML-Lösungen, die in kommerzielle Engineering-Software integriert sind.
Architektur definieren, die sich über globale Bereitstellungen hinweg skalieren lässt.
Arbeiten Sie mit einem Team von Experten für ML, Software-Engineering und UI-Entwicklung zusammen.
Standort: Remote für UA oder vor Ort für Großbritannien Anstellungsart: Vollzeit style="font-weight: normal; font-style: normal">Wir stellen einen Senior ML Systems Architect ein, der das Design unseres TensorFlow-basierten Lösers für kommerzielle Anwendungen leitet. Sie definieren eine skalierbare Architektur, stellen die Produktionsbereitschaft sicher und integrieren ML mit C#-Diensten. Muss über umfassende Kenntnisse in TensorFlow, Python und MLOps verfügen. Bewerben Sie sich jetzt, um die Zukunft von ML in der Engineering-Software zu gestalten.