Hays

Expert Incident Management (nur für SV-pflichtige) (m/w/d)

  • Remote
  • Festanstellung
  • Vollzeit

Bitte beziehen Sie sich bei Ihrer Bewerbung auf DEUTSCHLAND.JOBS – Kennziffer: 1718696

Bild zu Expert Incident Management (nur für SV-pflichtige) (m/w/d) Bild zu Expert Incident Management (nur für SV-pflichtige) (m/w/d)

Aufgaben

  • Eigenverantwortliche Annahme, Priorisierung und Koordination von Incidents und Problems aus Test- und Produktivsystemen
  • Durchführung von Voranalysen und technische Bewertung eingehender Störungen
  • Ursachenanalyse und Ableitung von Lösungsansätzen
  • Monitoring von priorisierten Incidents und Problems bis zur abschließenden Behebung
  • Initiierung und Koordination kurzfristiger Maßnahmen zur Stabilisierung des Systembetriebs
  • Erstellung Analysen und Berichte über relevante Incidents und Problems
  • Dokumentation von Ursachen, Maßnahmen, Lösungswegen und Lessons Learned
  • Aufbereitung von Kennzahlen (KPIs) zur Bewertung der Systemstabilität und Incident-Performance
  • Nachverfolgung und Kontrolle der Wirksamkeit umgesetzter Maßnahmen
  • Aufbau und Pflege eines übergreifenden Incident- und Problemmanagements
  • Aufbau, Optimierung und Weiterentwicklung des System- und Betriebsmanagements (Eigenentwicklung)
  • Identifikation von Verbesserungspotenzialen in Prozessen, Monitoring und Incident-Handling

Profil

  • Erfahrung im Incident-, Problem- oder Betriebsmanagement komplexer IT-Systeme (idealerweise im Energie- oder Konzernumfeld)
  • Erfahrung in der Ursachenanalyse und Fehlerbehebung von Systemstörungen in verteilten Plattformen (z. B. Portale, Middleware, Backend-Systeme)
  • Praxis in der Implementierung und Weiterentwicklung von Incident-Management-Prozessen nach ITIL- oder vergleichbaren Standards
  • Erfahrung im Aufbau und Betrieb von Monitoring- und Reporting-Strukturen zur Sicherstellung der Systemverfügbarkeit
  • Nachweisliche Erfahrung in der Koordination von Stabilitäts- und Optimierungsmaßnahmen über mehrere technische Teilbereiche hinweg
  • Stark ausgeprägte Analyse- und Problemlösungsfähigkeit bei technischen Incidents und Systemstörungen
  • Fähigkeit zur Priorisierung, Steuerung und Koordination von Incidents in komplexen IT-Landschaften
  • Sicherer Umgang mit Monitoring-, Ticket- und Reporting-Tools (z. B. Jira, ServiceNow, Kibana, Grafana)
  • Kompetenz in der Erstellung von Berichten und KPIs zur Bewertung der Systemstabilität

Benefits

  • Remote-Möglichkeit
  • Möglichkeit, an spannenden Projekten in interessanten Unternehmen mitzuwirken
Alle Personenbezeichnungen beziehen sich auf alle Geschlechter gleichermaßen. Weitere Informationen.