SRM – Technical Manager SaaS

La production est une responsabilité clé et visible. Vous aurez la responsabilité de bout en bout de la disponibilité, des performances et de l’évolutivité de la plateforme. Après une période d’adaptation / audit d’une 100 jours, définir avec votre management une organisation idéale et la mettre en œuvre.

 

Vous formerez et dirigerez une équipe d’ingénieurs et de techniciens. Vous serez responsable de l’embauche, des processus et de la définition de la technologie de votre organisation. L’établissement de relations efficaces avec d’autres entités sera un facteur essentiel de votre rôle.

 

Votre rôle sera dédié à l’amélioration et à la mise à l’échelle de la fiabilité de notre infrastructure au travers des défis techniques et opérationnels complexes que vous aurez à relever.

 

Nous engageons notre équipe à être autonome et motivée dans son travail. Si vous vous épanouissez dans cet environnement et que nos valeurs fondamentales résonnent avec les votre – établir la confiance, questionner les hypothèses et valider la bonne direction – vous vous intégrerez !

La mission

  • Créer et diriger la fonction et l’équipe de production en charge de la disponibilité et des performances des applications. Créer et compléter les outils d’automatisation et les alertes proactives / prédictives, mettre en place un ensemble d’outils d’analyse de données solides pour identifier les domaines à améliorer
  • Porter la responsabilité de la disponibilité et la performance de bout en bout des services critiques. Automatiser pour éviter la récurrence des problèmes
  • Définir, mesurer et atteindre les principaux objectifs de niveau de service, comprenant la disponibilité, les performances, la capacité, les incidents et les problèmes chroniques
  • Travailler en étroite collaboration avec les développeurs applicatifs pour trier les problèmes de production et déterminer la correction appropriée
  • Aider à déterminer la future direction technique de nos outils de déploiement, en mettant l’accent sur l’amélioration de la fiabilité et des performances.
  • Mettre en œuvre une surveillance complète des services pour assurer la disponibilité et les performances (vues synthétiques sur les performances, RUM, système, application, tableaux de bord, etc.
  • Appliquer un raisonnement pragmatique pour naviguer dans des défis complexes et des intérêts concurrents
  • Travailler en partenariat avec les parties prenantes de l’application et de l’entreprise pour garantir que des produits de haute qualité sont développés et mis en production
  • Manager l’équipe Production (DevOps et techniciens), promouvoir la culture SRE pour fournir une haute qualité, des opérations continues et un support actif aux exigences des clients et la tenue des objectifs financiers.
  • Encourager et bâtir des équipes qui travaillent ensemble sans silos
  • Diriger des équipes axées sur la productivité, l’efficacité, le respect et la sensibilité culturelle

 

Votre Profil

  • Une expérience significative de la résolution des problèmes de fiabilité des systèmes distribués.
  • Une expérience de la gestion d’une équipe d’ingénieurs SRE ou DevOps.
  • Une solide expérience de résolution de problèmes de production combinant systèmes distribués, code, stockage, réseau et de systèmes d’exploitation.
  • Une expérience de participation à une astreinte 24×7.
  • Une expérience de programmation modérée à avancée, de préférence dans un langage de haut niveau comme Perl ou Python.
  • De solides compétences organisationnelles et sens aigu du détail.
  • Des compétences en gestion de projet, avec un historique de projets lancés avec succès depuis le début jusqu’à la production.
  • Une capacité à communiquer régulièrement vers à un éventail d’interlocuteurs, à la fois internes et externes. Plus de 5 ans d’expérience technique pratique combinée à de solides compétences en gestion et en communication.
  • Une solide compréhension des technologies cloud modernes et des méthodologies standard de monitoring et de journalisation.
  • L’expérience de la création, de la mise à l’échelle et de l’exécution d’opérations de production.
  • Une capacité à insuffler, cultiver et soutenir une solide culture opérationnelle: une excellente technologie axée sur le client / service; implémentations de haute qualité; innovation motivée et résolution de problèmes.
  • Une capacité démontrée à établir et maintenir l’amélioration des processus basée sur des mesures
  • Une capacité démontrée à développer des alliances solides avec des personnes extérieures à votre organisation immédiate
  • D’excellentes compétences en communication, organisation et gestion du temps.

 

Notre environnement technique

Applications

  • Tomcat, Nginx, Apache
  • Java, Javascript
  • Kafka
  • Cassandra
  • Elastic Search
  • Storm
  • Oracle

Infrastructure

  • Rundeck
  • Docker, Linux
  • Puppet, Hiera, Ansible
  • AWS, Terraform
  • Vmware

Graphite, Sensu, Grafana

Postuler