Maschinelles Lernen (ML)
Maschinelles Lernen extrahiert Muster und trifft Vorhersagen aus Daten mithilfe statistischer Modelle und Algorithmen.
Klassifikation
- KomplexitätHoch
- AuswirkungTechnisch
- EntscheidungstypArchitektur
- OrganisationsreifeFortgeschritten
Technischer Kontext
Prinzipien & Ziele
Use Cases & Szenarien
Kompromisse
- Bias und Diskriminierung durch ungeeignete Trainingsdaten
- Überanpassung an Trainingsdaten (Overfitting)
- Unsachgemäße Nutzung ohne Monitoring führt zu Fehlentscheidungen
- Versionierung von Daten, Features und Modellen
- Kontinuierliches Monitoring auf Drift und Leistungseinbußen
- Transparente Dokumentation von Datenquellen und Entscheidungen
I/O & Ressourcen
- Rohdaten und Label für Trainingssets
- Feature-Definitionen und Domänenwissen
- Infrastruktur für Training und Deployment
- Trainierte Modelle und Validierungsberichte
- Metriken zur Modellqualität
- Produktionsfähige Inferenzendpunkte
Beschreibung
Maschinelles Lernen ist ein Teilgebiet der KI, das statistische Modelle und Algorithmen nutzt, um aus Daten Muster zu erkennen und Vorhersagen zu treffen. Es ermöglicht automatisierte Entscheidungsunterstützung und kontinuierliche Modellverbesserung durch Training mit Beispieldaten. Einsatzfelder reichen von Vorhersage über Personalisierung bis zur Anomalieerkennung.
✔Vorteile
- Automatisierte Mustererkennung reduziert manuellen Aufwand
- Verbesserte Vorhersagegenauigkeit gegenüber heuristischen Regeln
- Skalierbarkeit für große Datenmengen
✖Limitationen
- Abhängigkeit von der Verfügbarkeit und Qualität von Trainingsdaten
- Begrenzte Erklärbarkeit komplexer Modelle
- Pflegeaufwand für Daten- und Modell-Drift
Trade-offs
Metriken
- Genauigkeit (Accuracy)
Anteil der korrekt vorhergesagten Fälle an allen Fällen.
- F1-Score
Harmonisches Mittel aus Präzision und Recall für unausgeglichene Klassen.
- Modell-Latenz
Zeit zwischen Eingabe und Vorhersage in Produktionsinferenz.
Beispiele & Implementierungen
Vorhersagemodelle in der Windkraft
Anwendung von ML zur Vorhersage von Leistungseinbrüchen und Wartungsbedarf bei Turbinen.
Personalisierte Empfehlungen im Handel
Empfehlungssysteme verbessern Konversionsraten durch Nutzersignale und Browsing-Daten.
Anomalieerkennung im Finanzwesen
Einsatz von ML-Algorithmen zur Erkennung ungewöhnlicher Transaktionsmuster und Betrugsversuche.
Implementierungsschritte
Problemdefinition und Zielmetrik festlegen
Datenaufbereitung, Explorative Analyse und Feature-Engineering
Modellauswahl, Training und Cross-Validation
Deployment, Monitoring und Modellpflege
⚠️ Technische Schulden & Engpässe
Tech Debt
- Hartkodierte Features in Produktionspipelines
- Unzureichende Tests für Modelle und Datenänderungen
- Monolithische Infrastruktur ohne Reproduzierbarkeit
Bekannte Engpässe
Beispiele für Missbrauch
- Verwendung historischer, biasbehafteter Daten für Kreditentscheidungen
- Automatisches Blockieren von Nutzern basierend auf unvalidierten Modellen
- Einführung in Produktivumgebung ohne Monitoring
Typische Fallen
- Unterschätzung des Aufwands für Datenaufbereitung
- Ignorieren von Hidden Bias bei Trainingsdaten
- Fehlende Governance für Modell-Lifecycle
Erforderliche Fähigkeiten
Drivers (Architectural Drivers)
Constraints
- • Gesetzliche Vorgaben zum Datenschutz
- • Begrenzte Menge beschrifteter Trainingsdaten
- • Infrastrukturkapazitäten für Training und Inferenz