Sternschema
Dimensionales Datenmodell für analytische Systeme, das eine Faktentabelle mit mehreren Dimensionstabellen verbindet und Abfragen für Reporting und OLAP optimiert.
Klassifikation
- KomplexitätMittel
- AuswirkungTechnisch
- EntscheidungstypArchitektur
- OrganisationsreifeFortgeschritten
Technischer Kontext
Prinzipien & Ziele
Use Cases & Szenarien
Kompromisse
- Dateninkonsistenzen bei unzureichender ETL-Logik
- Performance-Probleme bei sehr großen Dimensionen
- Versteckte Komplexität durch historische Dimensionen
- Grain früh festlegen und dokumentieren
- Surrogatschlüssel statt natürlichen Schlüsseln verwenden
- SCD-Strategien klar pro Dimension bestimmen
I/O & Ressourcen
- Operative Quellsysteme (Transaktionen, Logs)
- Stammdaten (Produkte, Kunden, Zeit)
- ETL-Werkzeuge und Scheduling
- Fakten- und Dimensionsdaten zur Analyse
- Dashboards und Standardreports
- Aggregierte Kennzahlen für BI-User
Beschreibung
Das Sternschema ist ein dimensionales Modell für Data-Warehouses, das eine zentrale Faktentabelle mit mehreren Dimensionstabellen verbindet und Abfragen für analytische Reports optimiert. Durch Denormalisierung und einfache Joins verbessert es Performance, hat aber Auswirkungen auf Speicherbedarf und Änderungsflexibilität. Einsatzfelder sind BI, Reporting und OLAP-Workloads.
✔Vorteile
- Verbesserte Abfrageperformance durch einfache Joins
- Einfachere Verständlichkeit für Business-Analysten
- Gute Eignung für Aggregation und OLAP
✖Limitationen
- Erhöhter Speicherverbrauch durch Denormalisierung
- Weniger flexibel bei häufigen Strukturänderungen
- Nicht ideal für hochtransaktionale Systeme
Trade-offs
Metriken
- Abfrage-Latenz (p50/p95)
Mittlere und obere Latenzwerte für typische Reporting-Abfragen.
- Speicherbedarf
Gesamtspeicher für Fakt- und Dimensionstabellen inkl. Indexe.
- ETL-Dauer
Zeitdauer für Datenladeprozesse und Historisierungen.
Beispiele & Implementierungen
Einzelhandel: Sales-Data-Mart
Kundendaten, Produktkatalog und Bestellungen modelliert in Sternschema zur schnellen Report-Auswertung.
Finanzen: Monatsabschlüsse
Fakten zu Buchungen kombiniert mit Konten- und Zeitdimensionen zur Monatsabschlussanalyse.
E-Commerce: Marketing-Attribution
Klick- und Conversion-Daten als Faktentabellen, Dimensionen für Kampagnen, Kanal und Kunde.
Implementierungsschritte
Geschäftsprozesse analysieren und Grain definieren.
Fakt- und Dimensionstabellen entwerfen und Schlüssel festlegen.
ETL/ELT-Pipelines implementieren, SCDs behandeln und Tests ausführen.
⚠️ Technische Schulden & Engpässe
Tech Debt
- Unzureichende Dokumentation der Grain- und Mapping-Regeln
- Ad-hoc-Transformationen im Data Mart statt zentraler Pipeline
- Veraltete Dimensionstabellen ohne Pflege der Historie
Bekannte Engpässe
Beispiele für Missbrauch
- Sternschema als Ersatz für OLTP in Echtzeitsystemen
- Ignorieren von Historisierung und Überschreiben historischer Dimensionen
- Keine Surrogatschlüssel einsetzen und natürliche Schlüssel duplizieren
Typische Fallen
- Unbeachtete Kardinalität großer Dimensionen beeinflusst Joins stark
- Fehlende Indizes auf Fakt- und Dimensionsschlüsseln
- Komplexe SCD-Logik ohne Tests führt zu inkonsistenten Reports
Erforderliche Fähigkeiten
Drivers (Architectural Drivers)
Constraints
- • Begrenzte Flexibilität bei Schema-Änderungen
- • Abhängigkeit von stabilen Quellsystemen
- • Notwendigkeit von ETL-Kapazitäten und Scheduling