5. SLA-Gestaltung
Kapitel Übersicht
Kapitel 5/8" Lesezeit: ~9 Min Modul 10: Planung II**
🎯 Lernziele
Nach diesem Kapitel können Sie: - Service Level Agreements professionell gestalten - SLA-Metriken und KPIs definieren - Service Credits und Strafregeln vereinbaren - SLA-Monitoring und Reporting durchführen
📋 Einführung
Service Level Agreements (SLAs) sind die quantitativen Verpflichtungen zwischen Dienstleister und Kunde. Sie definieren, was "gute Leistung" ist und was passiert, wenn diese nicht erbracht wird. Ohne SLAs gibt es keine objektive Basis für die Beurteilung der Lieferantenqualität – was "gut" ist, bleibt subjektiv und führt zu Konflikten.
Praxisbeispiel: E-Commerce-Hosting-SLA
Ein Online-Händler vereinbart mit seinem Hosting-Provider ein SLA: "Verfügbarkeit 99.9% pro Monat". Der Provider fällt 4 Stunden aus – das entspricht 0.55% Ausfallzeit. Der SLA wurde nicht eingehalten, und der Händler erhält Service Credits (Gutschriften). Ohne SLA gäbe es keine rechtliche Handhabe.
🎯 Bestandteile eines SLA
Ein professionelles SLA umfasst folgende Abschnitte:
| Abschnitt | Inhalt | Beispiel |
|---|---|---|
| 1. Service Definition | Was wird bereitgestellt? | "Hosting des E-Commerce-Shops inkl. Datenbank" |
| 2. Service Level Targets | Welche Metriken mit welchen Werten? | "Verfügbarkeit ≥ 99.9%, Antwortzeit < 500ms" |
| 3. Messung & Monitoring | Wie wird gemessen? | "24/7 Monitoring, monatliche Reports" |
| 4. Service Credits | Was passiert bei Nichteinhaltung? | "1% Gutschrift je 0.1% SLA-Verletzung" |
| 5. Ausnahmen | Was wird nicht gemessen? | "Geplante Wartungsfenster (max. 2h/Monat)" |
| 6. Reporting | Wie oft wird berichtet? | "Monatliche SLA-Reports" |
📊 Typische SLA-Metriken
Verfügbarkeit (Uptime)
Die wichtigste Metrik für IT-Services. Wird meist in Prozent pro Zeitraum angegeben:
| Service | Typische SLA-Availability | Bedeutung |
|---|---|---|
| Standard-SaaS | 99.9% | Bis zu 43 Minuten Ausfall pro Monat |
| Enterprise-Cloud | 99.95% | Bis zu 21 Minuten Ausfall pro Monat |
| Mission-Critical | 99.99% | Bis zu 4 Minuten Ausfall pro Monat |
| Financial Services | 99.999% | Bis zu 26 Sekunden Ausfall pro Monat |
SLA-Realität vs. Marketing
Viele Anbieter bewerben "99.99% Availability", aber im Vertrag steht "99.9% excluding planned maintenance". Prüfen Sie genau, was im Kleingedruckten steht. Plante Wartung ist oft der Grund für SLA-Verletzungen.
Performance
Antwortzeiten und Durchsatz:
| Metrik | Beispiel | Messung |
|---|---|---|
| Response Time | < 500ms (95. Perzentil) | Zeit vom Request bis zur Antwort |
| Throughput | 1000 req/s | Anzahl der Requests pro Sekunde |
| Latency | < 100ms | Netzwerk-Verzögerung |
| Error Rate | < 0.1% | Anteil fehlerhafter Requests |
Support-Reaktionszeiten
Reaktionszeiten bei Support-Tickets:
| Priorität | Reaktionszeit | Lösungsdauer | Beispiel |
|---|---|---|---|
| P1 (Kritisch) | < 15 Minuten | < 4 Stunden | Systemausfall, keine Verfügbarkeit |
| P2 (Hoch) | < 1 Stunde | < 8 Stunden | Teilweise Ausfälle, Performance-Probleme |
| P3 (Mittel) | < 4 Stunden | < 24 Stunden | Funktionale Fehler |
| P4 (Niedrig) | < 24 Stunden | < 72 Stunden | Anfragen, Verbesserungswünsche |
💰 Service Credits und Sanktionen
Service Credits sind finanzielle Sanktionen bei SLA-Verletzungen. Sie haben zwei Zwecke: 1. Kompensation: Der Kunde wird für den Ausfall entschädigt 2. Anreiz: Der Anbieter hat einen finanziellen Anreiz, SLAs einzuhalten
Service Credit-Formel
Ein typisches SLA sieht vor:
Service Credit = (Monatliche Gebühr) × (Prozentualer SLA-Verletzung) × (Faktor)
Beispiel:
- Monatliche Gebühr: 5.000 €
- Tatsächliche Verfügbarkeit: 99.7% (SLA: 99.9%)
- SLA-Verletzung: 0.2%
- Faktor: 10
Service Credit = 5.000 € × 0.2% × 10 = 100 €
| SLA-Verletzung | Service Credit | Beispiel (5.000 €/Monat) |
|---|---|---|
| 0.1% - 0.5% | 5% monatliche Gebühr | 250 € |
| 0.5% - 1.0% | 10% monatliche Gebühr | 500 € |
| 1.0% - 2.0% | 25% monatliche Gebühr | 1.250 € |
| > 2.0% | 50% monatliche Gebühr | 2.500 € |
!!! tip "Service Credits vs. Schadenersatz** Service Credits sind keine Schadenersatzansprüche. Sie entschädigen den Kunden, decken aber nicht den gesamten Schaden ab (z.B. Umsatzverluste bei einem Ausfall). Für kritische Systeme sollten Sie zusätzlich Schadenersatzklauseln (Liability Cap) vereinbaren.
📈 SLA-Monitoring und Reporting
Monitoring-Tools
Verwenden Sie professionelle Tools zur Überwachung:
| Tool | Art | Vorteile |
|---|---|---|
| Uptime-Robot, Pingdom | Externe Überwachung | Unabhängig vom Anbieter |
| New Relic, Datadog | APM (Application Performance Monitoring) | Deep-Dive in Performance |
| Prometheus, Grafana | Open-Source-Monitoring | Kostenlos, flexibel |
| AWS CloudWatch | Cloud-spezifisch | Enge Integration mit AWS |
Reporting-Etikette
Ein guter SLA-Report enthält:
- Zusammenfassung: War der SLA eingehalten?
- Metrik-Werte: Detaillierte Werte pro Metrik
- Vorfälle: Liste der SLA-Verletzungen mit Ursachen
- Trends: Entwicklung über die Zeit (Verbesserung/Verschlechterung)
- Maßnahmen: Was wird getan, um SLA-Verletzungen zu vermeiden?
SLA-Report-Auszug
=== SLA-Report: Januar 2026 ===
Zusammenfassung: SLA eingehalten ✓
- Verfügbarkeit: 99.92% (Target: 99.9%)
- Antwortzeit: 420ms (Target: < 500ms)
- Support-Reaktionszeit: P1: 12min, P2: 45min (Targets: <15min, <1h)
Vorfälle:
- 15.01.2026, 14:30-15:10: Datenbank-Timeout (SLA-Verletzung: 0.05%)
Ursache: Fehlende Indizes nach Update
Maßnahmen: Indizes hinzugefügt, Update-Check erweitert
Trends:
- Verfügbarkeit: 99.91% (Dez) → 99.92% (Jan) ✓ Verbesserung
- Antwortzeit: 450ms (Dez) → 420ms (Jan) ✓ Verbesserung
Maßnahmen:
- Geplante Wartung auf Nachtstunden verlegt (Reduktion Ausfallzeit)
- Performance-Monitoring erweitert
⚖️ SLA vs. OLA vs. UC
Es gibt drei Arten von Vereinbarungen, die oft verwechselt werden:
| Begriff | Bedeutung | Beispiel |
|---|---|---|
| SLA (Service Level Agreement) | Zwischen Anbieter und Kunde | "Hosting-Provider verspricht 99.9% Verfügbarkeit an den Kunden" |
| OLA (Operational Level Agreement) | Zwischen internen Teams | "Das IT-Operations-Team verspricht Datenbank-Backup innerhalb von 2h" |
| UC (Underpinning Contract) | Zwischen Anbieter und Unterlieferant | "Hosting-Provider mietet Rechenzentrum von Equinix mit SLA 99.99%" |
SLA-Cascade-Falle
Ein Anbieter verspricht SLA 99.9% gegenüber dem Kunden, hat aber mit seinem Unterlieferanten nur SLA 99.5% vereinbart. Der Anbieter kann sein SLA nicht einhalten, wenn der Unterlieferant ausfällt. Prüfen Sie, ob der SLA "end-to-end" (inkl. Unterlieferanten) gilt oder ob es ein SLA-Cascade-Risiko gibt.
📋 Checkliste: SLA-Gestaltung
✅ Service Definition
✅ Services klar definiert
✅ Umfang (In-Scope und Out-of-Scope) bestimmt
✅ Service Level Targets
✅ Metriken gewählt (Verfügbarkeit, Performance, Support)
✅ Ziele festgelegt (numerisch, messbar)
✅ Messintervalle definiert (monatlich, quartalsweise)
✅ Messung & Monitoring
✅ Wie wird gemessen? (Tools, Methoden)
✅ Wer misst? (Anbieter, unabhängiger Dritter, Kunde)
✅ Wann wird gemessen? (24/7, Geschäftszeiten)
✅ Service Credits
✅ Service Credit-Formel vereinbart
✅ Obergrenze für Credits definiert (z.B. max. 50% der monatlichen Gebühr)
✅ Bedingungen für Credits geklärt (ab wann gilt SLA als verletzt?)
✅ Ausnahmen
✅ Geplante Wartung definiert (Maximaldauer, Benachrichtigungsfrist)
✅ Force Majeure (Höhere Gewalt) berücksichtigt
✅ Reporting
✅ Berichtsrhythmus vereinbart
✅ Berichtsformat festgelegt
✅ Review-Meetings geplant
🚀 Fazit
SLAs sind das quantitative Herzstück von Lieferantenbeziehungen. Ohne SLAs gibt es keine objektive Basis für die Beurteilung der Qualität. Professionelle SLAs sind messbar, überwachbar und sanktionsfähig. Investieren Sie Zeit in die SLA-Gestaltung – es ist die Versicherung gegen schlechte Service-Qualität.
➔ Weiter zum nächsten Kapitel
Im nächsten Kapitel 6. Claim- und Change-Management erfahren Sie, wie Sie mit Änderungen und Nachforderungen umgehen.