Playson ist ein führender Online-Gaming-Anbieter mit weltweiter Anerkennung, der 2012 gegründet wurde. Wir bieten komplette Gaming-Lösungen basierend auf den neuesten Technologien und detaillierten Marktanalysen für die führenden iGaming-Betreiber. Wir sind auf der Suche nach einem Site Reliability Engineer/DevOps. Es handelt sich um eine Position im Platform Tribe, SRE Stream und FireXSquad, die für die Automatisierung und Wartung der Hochlast-Infrastruktur verantwortlich ist. Um in der ausgesc
Playson ist ein führender Online-Gaming-Anbieter mit weltweiter Anerkennung, der 2012 gegründet wurde. Wir bieten komplette Gaming-Lösungen basierend auf den neuesten Technologien und detaillierten Marktanalysen für die führenden iGaming-Betreiber. Wir sind auf der Suche nach einem Site Reliability Engineer/DevOps. Es handelt sich um eine Position im Platform Tribe, SRE Stream und FireXSquad, die für die Automatisierung und Wartung der Hochlast-Infrastruktur verantwortlich ist. Um in der ausgeschriebenen Rolle erfolgreich zu sein, verfügen Sie über:― Umfangreiche Erfahrung in der Problembearbeitung (RCA, Postmortems-Praktiken).― Ausgeprägtes Verständnis von Kubernetes (K8s) – einschließlich Bereitstellung, Skalierung, Fehlerbehebung und Verwaltung von Containeranwendungen.― Kenntnisse in AWS-Diensten – insbesondere Fachwissen in Amazon Elastic Kubernetes Service (EKS), EC2, RDS, CloudFront und andere relevante Dienste.― Infrastructure asCode (IAC) – Terraform muss über― Containerisierungstechnologien – Kenntnisse von Docker, einschließlich der Erstellung und Verwaltung von Docker-Images und Containern.― CI/CD – Vertrautheit mit Tools für kontinuierliche Integration und kontinuierliche Bereitstellung wie Jenkins, GitLab CI/CD oder GitHub Actions.― Überwachung und Beobachtbarkeit – Erfahrung mit Überwachungstools wie DataDog, Prometheus, Grafana und Protokollierungslösungen wie Elasticsearch, Logstash und Kibana (ELK Stack) oder AWS CloudWatch .― Netzwerke – Starke Kenntnisse von Netzwerkkonzepten wie DNS, Lastausgleich und Firewalls sowie Netzwerkprotokollen wie TCP/IP, HTTP und HTTPS und gRPCas sind ein großes Plus. ― Skript- und Programmiersprachen – Kenntnisse in mindestens einer Skriptsprache (z. B. Python, NodeJS, Go). ― Konfigurationsmanagement – Erfahrung mit Tools wie FluxCD/ArgoCD. ― Versionskontrollsysteme – Kenntnisse im Umgang mit Git oder anderen Versionskontrollsystemen. ― Vorfallmanagement – Vertrautheit mit Incident-Response- und Management-Tools wie PagerDuty, Opsgenie oder VictorOps.― Ausgeprägte Fähigkeiten zur Problemlösung und Fehlerbehebung – Die Fähigkeit, komplexe technische Probleme zu diagnostizieren und zu lösen.― Starke Eigenverantwortung, Proaktivität, Beharrlichkeit und Leidenschaft für die Pflege einer der größten Online-Glücksspielplattformen Die Bedeutung der Rolle liegt in:― Täglicher Verwaltung von Warnungen, Überprüfung von Systemen und Eskalation von Problemen bei Bedarf.― Werden Sie Teil eines Teams, das rund um die Uhr Bereitschaftsunterstützung für kritische SaaS-Ereignisse bietet.― Verfügbar bei Notfällen, wenn Teammitglieder nicht verfügbar sind oder benötigt werden Hilfe.― Dokumentation von Problemen und Behebungsschritten.― Erstellen Sie proaktiv geeignete Monitore im EKS/K8S-Ökosystem.― Bereitstellung im EKS/K8s-Cluster mit Terraform und Helm/Flux.― Verbessern Sie den Zustand der vorhandenen Infrastruktur durch Implementierung von Prüfungen und Skripten, um bekannte Probleme zu beheben.― Wartung und Entwicklung des Bereitstellungscodes.― Implementieren/integrieren Sie neue Technologien in unserer Cloud-Infrastruktur.― Arbeiten Sie mit anderen Teams und Abteilungen zusammen, um ein Höchstmaß an Support und Unterstützung zu bieten.― Wenden Sie bei der Planung von Bereitstellungen/Updates echte Kundenorientierung an, wobei Sie den Kunden im Vordergrund haben und berücksichtigen Nehmen Sie Einfluss auf sie, bevor Sie Änderungen vornehmen.― Arbeiten Sie bei Lösungen eng mit Support-, Kundenerfolgs-, Migrations- und Professional Services-Teams zusammen, um unseren Kunden den besten SaaS-Service seiner Klasse zu bieten.― Führen Sie RCA durch und ergreifen Sie die erforderlichen Korrekturmaßnahmen― Erstellen Sie warnungsbezogene Aktionen und weisen Sie sie nach der Untersuchung dem entsprechenden Team zu.― Behandeln Sie Supportanfragen für umgebungsspezifische Aktionen. Was Sie als Gegenleistung erhalten: 🎰 Transparentes Bonussystem vierteljährlich🎰 Flexibilität in Ihrem Zeitplan (Sie entscheiden, wann es Ihnen am besten passt damit Sie ins Büro kommen, solange es unsere Entwicklungspläne nicht beeinträchtigt)🎰 Möglichkeit, aus der Ferne zu arbeiten🎰 Krankenversicherung für Sie und Ihre +1🎰 Unbegrenzter bezahlter Urlaub und ukrainische Feiertage🎰 Unbegrenzter bezahlter Krankheitsurlaub bei Bedarf🎰 Entwicklungskurse/Schulungserstattung🎰 Online-Englischkurse für Unternehmen🎰 Teambuilding-Events für Unternehmen, Firmenfeiern🎰 Bonusprogramm für Mitarbeiterempfehlungen. Klingt nach einer Gelegenheit, die Sie sich nicht entgehen lassen sollten? 👉 Lassen Sie uns über Ihre berufliche Weiterentwicklung bei Playson sprechen