Speech-to-Text
Speech-to-Text bezeichnet Verfahren zur Transkription gesprochener Sprache in geschriebenen Text. Es umfasst akustische Modelle, Sprachmodelle und Decoder sowie Vorverarbeitung und Postprocessing. Eingesetzt wird es in Diktaten, Untertiteln, Sprachassistenten und Transkriptionspipelines. Typische Herausforderungen sind Rauschrobustheit, Mehrsprachigkeit und Echtzeitlatenz; Evaluationsmetriken sind WER und Latenz.
Dieser Baustein bündelt Grundinformationen, Kontext und Beziehungen – als neutrale Referenz im Modell.
Definition · Einordnung · Trade-offs · Beispiele
Worum geht es hier?
Diese Seite bietet einen neutralen Einstieg mit Kerndaten, Strukturkontext und direkten Beziehungen – unabhängig von Lern- oder Entscheidungswegen.
Basisdaten
Kontext im Modell
Strukturelle Einordnung
Verortung in der Struktur.
Keine Strukturpfade verfügbar.
Beziehungen
Verknüpfte Bausteine
Direkt verbundene Content-Elemente.