Zum Inhalt

5. SLA-Gestaltung

Kapitel Übersicht

Kapitel 5/8" Lesezeit: ~9 Min Modul 10: Planung II**

🎯 Lernziele

Nach diesem Kapitel können Sie: - Service Level Agreements professionell gestalten - SLA-Metriken und KPIs definieren - Service Credits und Strafregeln vereinbaren - SLA-Monitoring und Reporting durchführen

📋 Einführung

Service Level Agreements (SLAs) sind die quantitativen Verpflichtungen zwischen Dienstleister und Kunde. Sie definieren, was "gute Leistung" ist und was passiert, wenn diese nicht erbracht wird. Ohne SLAs gibt es keine objektive Basis für die Beurteilung der Lieferantenqualität – was "gut" ist, bleibt subjektiv und führt zu Konflikten.

Praxisbeispiel: E-Commerce-Hosting-SLA

Ein Online-Händler vereinbart mit seinem Hosting-Provider ein SLA: "Verfügbarkeit 99.9% pro Monat". Der Provider fällt 4 Stunden aus – das entspricht 0.55% Ausfallzeit. Der SLA wurde nicht eingehalten, und der Händler erhält Service Credits (Gutschriften). Ohne SLA gäbe es keine rechtliche Handhabe.

🎯 Bestandteile eines SLA

Ein professionelles SLA umfasst folgende Abschnitte:

Abschnitt Inhalt Beispiel
1. Service Definition Was wird bereitgestellt? "Hosting des E-Commerce-Shops inkl. Datenbank"
2. Service Level Targets Welche Metriken mit welchen Werten? "Verfügbarkeit ≥ 99.9%, Antwortzeit < 500ms"
3. Messung & Monitoring Wie wird gemessen? "24/7 Monitoring, monatliche Reports"
4. Service Credits Was passiert bei Nichteinhaltung? "1% Gutschrift je 0.1% SLA-Verletzung"
5. Ausnahmen Was wird nicht gemessen? "Geplante Wartungsfenster (max. 2h/Monat)"
6. Reporting Wie oft wird berichtet? "Monatliche SLA-Reports"

📊 Typische SLA-Metriken

Verfügbarkeit (Uptime)

Die wichtigste Metrik für IT-Services. Wird meist in Prozent pro Zeitraum angegeben:

Service Typische SLA-Availability Bedeutung
Standard-SaaS 99.9% Bis zu 43 Minuten Ausfall pro Monat
Enterprise-Cloud 99.95% Bis zu 21 Minuten Ausfall pro Monat
Mission-Critical 99.99% Bis zu 4 Minuten Ausfall pro Monat
Financial Services 99.999% Bis zu 26 Sekunden Ausfall pro Monat

SLA-Realität vs. Marketing

Viele Anbieter bewerben "99.99% Availability", aber im Vertrag steht "99.9% excluding planned maintenance". Prüfen Sie genau, was im Kleingedruckten steht. Plante Wartung ist oft der Grund für SLA-Verletzungen.

Performance

Antwortzeiten und Durchsatz:

Metrik Beispiel Messung
Response Time < 500ms (95. Perzentil) Zeit vom Request bis zur Antwort
Throughput 1000 req/s Anzahl der Requests pro Sekunde
Latency < 100ms Netzwerk-Verzögerung
Error Rate < 0.1% Anteil fehlerhafter Requests

Support-Reaktionszeiten

Reaktionszeiten bei Support-Tickets:

Priorität Reaktionszeit Lösungsdauer Beispiel
P1 (Kritisch) < 15 Minuten < 4 Stunden Systemausfall, keine Verfügbarkeit
P2 (Hoch) < 1 Stunde < 8 Stunden Teilweise Ausfälle, Performance-Probleme
P3 (Mittel) < 4 Stunden < 24 Stunden Funktionale Fehler
P4 (Niedrig) < 24 Stunden < 72 Stunden Anfragen, Verbesserungswünsche

💰 Service Credits und Sanktionen

Service Credits sind finanzielle Sanktionen bei SLA-Verletzungen. Sie haben zwei Zwecke: 1. Kompensation: Der Kunde wird für den Ausfall entschädigt 2. Anreiz: Der Anbieter hat einen finanziellen Anreiz, SLAs einzuhalten

Service Credit-Formel

Ein typisches SLA sieht vor:

Service Credit = (Monatliche Gebühr) × (Prozentualer SLA-Verletzung) × (Faktor)

Beispiel:
- Monatliche Gebühr: 5.000 €
- Tatsächliche Verfügbarkeit: 99.7% (SLA: 99.9%)
- SLA-Verletzung: 0.2%
- Faktor: 10

Service Credit = 5.000 € × 0.2% × 10 = 100 €
SLA-Verletzung Service Credit Beispiel (5.000 €/Monat)
0.1% - 0.5% 5% monatliche Gebühr 250 €
0.5% - 1.0% 10% monatliche Gebühr 500 €
1.0% - 2.0% 25% monatliche Gebühr 1.250 €
> 2.0% 50% monatliche Gebühr 2.500 €

!!! tip "Service Credits vs. Schadenersatz** Service Credits sind keine Schadenersatzansprüche. Sie entschädigen den Kunden, decken aber nicht den gesamten Schaden ab (z.B. Umsatzverluste bei einem Ausfall). Für kritische Systeme sollten Sie zusätzlich Schadenersatzklauseln (Liability Cap) vereinbaren.

📈 SLA-Monitoring und Reporting

Monitoring-Tools

Verwenden Sie professionelle Tools zur Überwachung:

Tool Art Vorteile
Uptime-Robot, Pingdom Externe Überwachung Unabhängig vom Anbieter
New Relic, Datadog APM (Application Performance Monitoring) Deep-Dive in Performance
Prometheus, Grafana Open-Source-Monitoring Kostenlos, flexibel
AWS CloudWatch Cloud-spezifisch Enge Integration mit AWS

Reporting-Etikette

Ein guter SLA-Report enthält:

  1. Zusammenfassung: War der SLA eingehalten?
  2. Metrik-Werte: Detaillierte Werte pro Metrik
  3. Vorfälle: Liste der SLA-Verletzungen mit Ursachen
  4. Trends: Entwicklung über die Zeit (Verbesserung/Verschlechterung)
  5. Maßnahmen: Was wird getan, um SLA-Verletzungen zu vermeiden?

SLA-Report-Auszug

=== SLA-Report: Januar 2026 ===

Zusammenfassung: SLA eingehalten ✓
- Verfügbarkeit: 99.92% (Target: 99.9%)
- Antwortzeit: 420ms (Target: < 500ms)
- Support-Reaktionszeit: P1: 12min, P2: 45min (Targets: <15min, <1h)

Vorfälle:
- 15.01.2026, 14:30-15:10: Datenbank-Timeout (SLA-Verletzung: 0.05%)
  Ursache: Fehlende Indizes nach Update
  Maßnahmen: Indizes hinzugefügt, Update-Check erweitert

Trends:
- Verfügbarkeit: 99.91% (Dez) → 99.92% (Jan) ✓ Verbesserung
- Antwortzeit: 450ms (Dez) → 420ms (Jan) ✓ Verbesserung

Maßnahmen:
- Geplante Wartung auf Nachtstunden verlegt (Reduktion Ausfallzeit)
- Performance-Monitoring erweitert

⚖️ SLA vs. OLA vs. UC

Es gibt drei Arten von Vereinbarungen, die oft verwechselt werden:

Begriff Bedeutung Beispiel
SLA (Service Level Agreement) Zwischen Anbieter und Kunde "Hosting-Provider verspricht 99.9% Verfügbarkeit an den Kunden"
OLA (Operational Level Agreement) Zwischen internen Teams "Das IT-Operations-Team verspricht Datenbank-Backup innerhalb von 2h"
UC (Underpinning Contract) Zwischen Anbieter und Unterlieferant "Hosting-Provider mietet Rechenzentrum von Equinix mit SLA 99.99%"

SLA-Cascade-Falle

Ein Anbieter verspricht SLA 99.9% gegenüber dem Kunden, hat aber mit seinem Unterlieferanten nur SLA 99.5% vereinbart. Der Anbieter kann sein SLA nicht einhalten, wenn der Unterlieferant ausfällt. Prüfen Sie, ob der SLA "end-to-end" (inkl. Unterlieferanten) gilt oder ob es ein SLA-Cascade-Risiko gibt.

📋 Checkliste: SLA-Gestaltung

✅ Service Definition
  ✅ Services klar definiert
  ✅ Umfang (In-Scope und Out-of-Scope) bestimmt

✅ Service Level Targets
  ✅ Metriken gewählt (Verfügbarkeit, Performance, Support)
  ✅ Ziele festgelegt (numerisch, messbar)
  ✅ Messintervalle definiert (monatlich, quartalsweise)

✅ Messung & Monitoring
  ✅ Wie wird gemessen? (Tools, Methoden)
  ✅ Wer misst? (Anbieter, unabhängiger Dritter, Kunde)
  ✅ Wann wird gemessen? (24/7, Geschäftszeiten)

✅ Service Credits
  ✅ Service Credit-Formel vereinbart
  ✅ Obergrenze für Credits definiert (z.B. max. 50% der monatlichen Gebühr)
  ✅ Bedingungen für Credits geklärt (ab wann gilt SLA als verletzt?)

✅ Ausnahmen
  ✅ Geplante Wartung definiert (Maximaldauer, Benachrichtigungsfrist)
  ✅ Force Majeure (Höhere Gewalt) berücksichtigt

✅ Reporting
  ✅ Berichtsrhythmus vereinbart
  ✅ Berichtsformat festgelegt
  ✅ Review-Meetings geplant

🚀 Fazit

SLAs sind das quantitative Herzstück von Lieferantenbeziehungen. Ohne SLAs gibt es keine objektive Basis für die Beurteilung der Qualität. Professionelle SLAs sind messbar, überwachbar und sanktionsfähig. Investieren Sie Zeit in die SLA-Gestaltung – es ist die Versicherung gegen schlechte Service-Qualität.

➔ Weiter zum nächsten Kapitel

Im nächsten Kapitel 6. Claim- und Change-Management erfahren Sie, wie Sie mit Änderungen und Nachforderungen umgehen.