DevOps & Plattform-Engineering
DevOps und Plattform-Engineering sind Ansätze, die darauf abzielen, die Zusammenarbeit zwischen Softwareentwicklung und IT-Betrieb zu verbessern.
- Wissensbereiche
- /Themenbereiche
- /Segmente
- /Bausteine
Zuverlässigkeit & Beobachtbarkeit
Dieses Segment umfasst Konzepte und Ansätze zur Sicherstellung eines stabilen und nachvollziehbaren Systemverhaltens im Betrieb. Dazu zählen Mechanismen zur Messung und Bewertung von Zuverlässigkeit, zur Erfassung von Zuständen und Ereignissen sowie zur Analyse von Abweichungen und Störungen. Es beschreibt, wie Plattformen und Services beobachtbar gemacht werden, um ihr Verhalten über Zeit zu verstehen und einzuordnen, ohne sich auf konkrete Infrastrukturdefinitionen oder Auslieferungsprozesse zu konzentrieren. Themen der Plattformbereitstellung, der Softwareauslieferung oder der fachlichen Logik werden in anderen Segmenten behandelt.
Ursachen Analyse (RCA)
Ein strukturierter Ansatz zur Identifizierung der Grundursachen von Problemen.
Metriken
Metriken helfen dabei, die Leistung und Effizienz von Prozessen zu messen und zu analysieren.
Observabilität
Observabilität ermöglicht es, den Zustand komplexer Systeme durch Minderungen wie Metriken, Logs und Traces zu verstehen.
Service Level Agreement (SLA)
Ein Service Level Agreement (SLA) definiert die Erwartungen an die Dienstleistungen eines Anbieters.
Service Level Indicator (SLI)
Ein Service Level Indicator (SLI) misst die Qualität eines Service gemäß vordefinierten Kriterien.
Service Level Objective (SLO)
Ein Service Level Objective (SLO) definiert spezifische Leistungserwartungen für einen Dienst.
Zuverlässigkeit
Zuverlässigkeit ist ein entscheidendes Konzept in der Systementwicklung, das sicherstellt, dass Systeme konstant die erwartete Leistung erbringen.
Grafana
Grafana ist ein Open-Source-Tool zur Visualisierung und Analyse von Daten.
ELK Stack (Elasticsearch, Logstash, Kibana)
Der ELK Stack kombiniert Elasticsearch, Logstash und Kibana zur effizienten Verarbeitung und Visualisierung von Daten.
Prometheus
Prometheus ist ein Open-Source-System zur Überwachung und Alarmierung.