Data Cleaning
Data Cleaning ist ein strukturiertes Verfahren zur Identifikation, Korrektur und Entfernung fehlerhafter, unvollständiger oder inkonsistenter Daten in Datensätzen. Es umfasst Validierung, Standardisierung, Dublettenerkennung, Datenprofiling und fehlende Wertebehandlung sowie regelbasierte Transformationen. Ziel ist eine zuverlässige, dokumentierte Datenbasis für Analysen, ML-Modelle und operative Prozesse; es reduziert Risiken und verbessert Entscheidungen.
Dieser Baustein bündelt Grundinformationen, Kontext und Beziehungen – als neutrale Referenz im Modell.
Definition · Einordnung · Trade-offs · Beispiele
Worum geht es hier?
Diese Seite bietet einen neutralen Einstieg mit Kerndaten, Strukturkontext und direkten Beziehungen – unabhängig von Lern- oder Entscheidungswegen.
Basisdaten
Kontext im Modell
Strukturelle Einordnung
Verortung in der Struktur.
Keine Strukturpfade verfügbar.
Beziehungen
Verknüpfte Bausteine
Direkt verbundene Content-Elemente.