Katalog
concept#Daten#Architektur#Integration#Beobachtbarkeit

Streaming

Architekturparadigma zur kontinuierlichen Verarbeitung und Übertragung von Datenströmen in Echtzeit zur Unterstützung niedriger Latenz und entkoppelter Integrationen.

Streaming beschreibt die kontinuierliche Verarbeitung und Übertragung von Ereignissen oder Datenströmen in Echtzeit.
Etabliert
Hoch

Klassifikation

  • Hoch
  • Technisch
  • Architektur
  • Fortgeschritten

Technischer Kontext

Apache KafkaFlink / Spark Streaming / ksqlDBSchema-Registry (z. B. Confluent Schema Registry)

Prinzipien & Ziele

Ereignisse sind erste Bürger; Design um Events herum.Entkopplung von Produzenten und Konsumenten für Skalierbarkeit.Explizite Zustandsmodelle und Schemata für Kompatibilität.
Umsetzung
Unternehmen, Domäne, Team

Use Cases & Szenarien

Kompromisse

  • Dateninkonsistenzen bei fehlerhaften Retry-Strategien.
  • Kostensteigerung durch dauerhafte Infrastruktur und Speicherbedarf.
  • Operationaler Overhead bei Schemata und Backups.
  • Ereignisevolution mit abwärtskompatiblen Schemata planen.
  • Idempotente Konsumenten und klare Retry-Strategien einsetzen.
  • Metriken für Latenz, Durchsatz und Consumer-Lag kontinuierlich messen.

I/O & Ressourcen

  • Ereigniserzeuger (Microservices, Geräte, externe Systeme)
  • Schema-Registry oder Datenmodell
  • Streaming-Plattform (Broker, Connectors, Stream-Processor)
  • Kontinuierliche Ereignisströme für Konsumenten
  • Echtzeit-Aggregationen und Metriken
  • Persistente Ereignisspeicherung für Auditing und Replays

Beschreibung

Streaming beschreibt die kontinuierliche Verarbeitung und Übertragung von Ereignissen oder Datenströmen in Echtzeit. Es ermöglicht niedrige Latenz, stetige Auswertung und entkoppelte Integration zwischen Produzenten und Konsumenten und unterstützt Skalierung, Fehlertoleranz sowie Zustandsspeicherung. Effektiver Einsatz erfordert Architekturentscheidungen, geeignete Betriebsprozesse und Observability.

  • Niedrige Latenz für Echtzeit-Entscheidungen.
  • Bessere Skalierbarkeit durch asynchrone Entkopplung.
  • Flexiblere Integration heterogener Systeme.

  • Erhöhter Betriebsaufwand für Zustandsverwaltung und Replikation.
  • Komplexere Fehleranalyse und Wiederherstellungsszenarien.
  • Nicht immer nötig für einfache, latenztolerante Batch-Workloads.

  • End-to-End-Latenz

    Zeit zwischen Produktion eines Events und dessen Verarbeitung durch Verbraucher.

  • Durchsatz (Events/s)

    Anzahl der verarbeiteten Ereignisse pro Sekunde.

  • Consumer-Lag

    Verzögerung oder Rückstand zwischen Produzent und Konsument.

LinkedIn und Apache Kafka

LinkedIn entwickelte Kafka zur zuverlässigen Verteilung von Ereignisströmen über Dienste hinweg.

Netflix Echtzeit-Streaming

Netflix nutzt Streaming-Pipelines für Monitoring, Personalisierung und Betreibbarkeit in Echtzeit.

IoT-Telemetrie in der Industrie

Fabriken streamen Sensordaten zur kontinuierlichen Analyse und vorausschauenden Wartung.

1

Bedarfsanalyse und Latenz-/Durchsatz-Anforderungen definieren.

2

Ereignisschemata und Versionierungsregeln etablieren.

3

Streaming-Plattform auswählen und Proof-of-Concept implementieren.

4

Stateful Processing und Fault-Tolerance testen und monitoren.

5

Betriebshandbuch, Runbooks und Observability aufbauen.

⚠️ Technische Schulden & Engpässe

  • Ad-hoc-Topic-Strukturen statt klarer Namenskonventionen.
  • Unzureichende Archivierung alter Events und Wachstum des Speichers.
  • Fehlende automatisierte Tests für Event-Processing-Pipelines.
NetzwerkdurchsatzPartition-SkewZustandsgröße
  • Echtzeit-SLA erreichen wollen, obwohl Batch-Lösungen ausreichend wären.
  • Direktes Schreiben von Produzenten in Konsumentendatenbanken ohne Events.
  • Unkontrollierte Topic-Erstellung ohne Governance und Kostenabschätzung.
  • Unterschätzen der Komplexität von zustandsbehafteten Operatoren.
  • Fehlende Backpressure-Mechanismen bei hohen Lastspitzen.
  • Nicht berücksichtigte Schema-Inkompatibilitäten zwischen Teams.
Verständnis verteilter Systeme und PartitionierungKenntnisse zu Zustandsverwaltung und Exactly-Once-ProcessingBetriebs- und Observability-Fähigkeiten für Streaming-Plattformen
LatenzanforderungenSkalierbarkeit und PartitionierungZustandsmanagement und Speicherstrategie
  • Begrenzter Speicher für zustandsbehaftete Operatoren
  • Netzwerkbandbreite zwischen Rechenzonen
  • Kompatibilitätsanforderungen für Ereignisschemata