Data Mesh
Organisatorisches und architektonisches Paradigma zur dezentralen Verantwortlichkeit für Daten als Produkt durch domänenorientierte Teams.
Klassifikation
- KomplexitätHoch
- AuswirkungOrganisatorisch
- EntscheidungstypOrganisation
- OrganisationsreifeReif
Technischer Kontext
Prinzipien & Ziele
Use Cases & Szenarien
Kompromisse
- Fragmentierung der Datenlandschaft ohne klare Standards.
- Ungleichmäßige Reife der Domänen führt zu Qualitätsunterschieden.
- Fehlende Plattform-Features verursachen operativen Mehraufwand in den Domänen.
- Start klein mit klaren Erfolgskriterien und iterativem Aufbau
- Automatisiere wiederkehrende Aufgaben in der Plattform
- Definiere maschinenlesbare Verträge und dokumentiere im Katalog
I/O & Ressourcen
- Domänenwissen und fachliche Ansprechpartner
- Rohdatenquellen und bestehende Datenpipelines
- Plattform-Tooling (Catalog, CI/CD, Monitoring)
- Versionierte, dokumentierte Datenprodukte mit SLAs
- Metadaten und Verträge zur automatischen Integration
- Messbare Verbesserungen in Durchlaufzeit und Datenqualität
Beschreibung
Data Mesh ist ein organisatorisches und architektonisches Paradigma zur dezentralen Bereitstellung und Verantwortung von Daten als Produkt durch domänenorientierte Teams. Es betont Domänenverantwortung, interoperable Datenprodukte, Self-Serve-Plattformen und föderierte Governance. Die Einführung erfordert organisatorische Veränderungen, klare Schnittstellen und Investitionen in Plattformen und Automatisierung.
✔Vorteile
- Skalierbare Teamorganisation mit klarer Datenverantwortung.
- Schnellere, domänennahe Datenlieferungen und bessere Produktqualität.
- Reduzierte zentrale Engpässe und bessere Kontextkenntnis bei Datenprodukten.
✖Limitationen
- Erfordert hohe organisatorische Reife und veränderte Verantwortungsmodelle.
- Investitionen in Plattform- und Automatisierungsfunktionen sind notwendig.
- Interoperabilität und Konsistenz über Domänen sind anspruchsvoll sicherzustellen.
Trade-offs
Metriken
- Zeit bis zur Bereitstellung eines Datenprodukts
Messung der durchschnittlichen Dauer von Anforderung bis zur Produktion eines Datenprodukts.
- Anzahl produktiver Datenprodukte pro Domäne
Zählt die aktiven, dokumentierten und SLA-getesteten Datenprodukte einer Domäne.
- Datenqualitäts- und SLA-Erfüllungsrate
Prozentsatz der Datenprodukte, die definierte Qualitätsmetriken und SLAs einhalten.
Beispiele & Implementierungen
Zalando — domänenorientierte Datenteams
Zalando berichtet über domänennahe Teams und Plattformansätze zur Verteilung von Datenverantwortung.
ThoughtWorks Pilotprojekte
ThoughtWorks hat das Konzept popularisiert und Anleitungen für Piloten und Prinzipien veröffentlicht.
Community-Implementierungen und Open-Source-Beispiele
Mehrere Open-Source-Projekte und Community-Sammlungen zeigen Patterns, Tools und Best Practices.
Implementierungsschritte
Pilotdomäne auswählen und ein Kern-Datenprodukt definieren
Self-Serve-Plattform-Bausteine bereitstellen (CI/CD, Catalog, Observability)
Vertrags- und Qualitätsmetriken einführen (Schemas, SLAs, Tests)
Föderierte Governance-Strukturen implementieren und skalieren
⚠️ Technische Schulden & Engpässe
Tech Debt
- Inkonsistente Schemas in frühen Datenprodukten
- Temporäre Integrationen ohne Automatisierung
- Fehlende Observability führt zu manuellen Fehlersuchen
Bekannte Engpässe
Beispiele für Missbrauch
- Einführung ohne Plattformunterstützung führt zu Wildwuchs
- Delegation von Verantwortung ohne notwendige Fähigkeiten in Domänen
- Alle Governance-Aufgaben zentralisieren und trotzdem Dezentralität postulieren
Typische Fallen
- Überschätzung der Fähigkeit von Domänen, sofort produktreife Daten bereitzustellen
- Unklare Schnittstellen zwischen Plattform und Domänen
- Vernachlässigung der Metadaten- und Katalogpflege
Erforderliche Fähigkeiten
Drivers (Architectural Drivers)
Constraints
- • Organisatorische Zustimmung für Rollen- und Verantwortungsänderungen erforderlich
- • Budget und Ressourcen für Plattformaufbau und Betrieb müssen bereitgestellt werden
- • Vorhandene Legacy-Systeme können Integration und Modernisierung erschweren