Automatische Spracherkennung: Sprachmodelle

Podcast

Play an AI-generated podcast conversation about this lesson

Download our mobile app to listen on the go

Get App

Questions and Answers

Welche der folgenden Aussagen beschreibt am besten die Hauptaufgabe von Sprachmodellen in hybriden Spracherkennungssystemen?

Die Reduzierung des Rechenaufwands bei der Merkmalsextraktion.
Die Umwandlung von akustischen Signalen in phonetische Darstellungen.
Die Schätzung der Wahrscheinlichkeit von Wortfolgen oder Sätzen. (correct)
Die Optimierung der HMM-Struktur und Parameter.

Wie beeinflusst die Perplexität die Leistung eines Sprachmodells?

Die Perplexität misst die Anzahl der benötigten Trainingsdaten.
Eine höhere Perplexität führt zu einer geringeren Wortfehlerrate.
Die Perplexität hat keinen direkten Einfluss auf die Wortfehlerrate.
Eine niedrigere Perplexität deutet auf eine bessere Vorhersagefähigkeit des Modells hin. (correct)

Die Wortfehlerrate (WER) steht in welcher Beziehung zur Perplexität?

WER ist umgekehrt proportional zur Quadratwurzel der Perplexität.
WER ist direkt proportional zur Perplexität.
WER ist unabhängig von der Perplexität.
WER ist ungefähr proportional zur Quadratwurzel der Perplexität. (correct)

Welche der folgenden Formeln wird verwendet, um die Perplexität (Q) eines Sprachmodells basierend auf seiner Entropie (H(p)) zu berechnen?

$Q = 2^{H(p)}$ (C) Signup and view all the answers

Was kennzeichnet stochastische Grammatikmodelle?

Sie sind allgemein verwendbar und müssen aus Daten gelernt werden. (D) Signup and view all the answers

Was ist ein wesentlicher Unterschied zwischen stochastischen und formalen Grammatiken im Kontext von Spracherkennungssystemen?

Formale Grammatiken sind spezifisch für eine bestimmte Aufgabe, während stochastische Grammatiken allgemein anwendbar sind. (C) Signup and view all the answers

Welche der folgenden Approximationen wird in einer Bigram-Grammatik verwendet?

$p(w_k | w_{k-1}, ..., w_1) ≈ p(w_k | w_{k-1})$ (B) Signup and view all the answers

Welche Aussage trifft auf N-Gramm-Grammatiken zu, wenn N größer als 2 ist?

Sie passen nicht zur First-Order-Markov-Eigenschaft. (D) Signup and view all the answers

Welche Art von Information wird für die statistische Schätzung von N-Gramm-Sprachmodellen hauptsächlich genutzt?

Relative Häufigkeiten von Wortfolgen in einem Korpus. (C) Signup and view all the answers

Was bedeutet die Interpolation im Kontext von N-Gramm-Sprachmodellen?

Die Kombination von Wahrscheinlichkeiten verschiedener N-Gramm-Ordnungen mit Gewichtungsfaktoren. (D) Signup and view all the answers

Welchen Vorteil bietet das Masked LM Training bei Transformer-Modellen?

Es ermöglicht ein Selbstüberwachtes Lernen auf großen, ungelabelten Datenmengen. (B) Signup and view all the answers

Was beschreibt der Begriff 'Perplexität' im Kontext von Sprachmodellen?

Ein Maß für die Unsicherheit oder Verzweigung in einem Sprachmodell. (B) Signup and view all the answers

Was sind LLMs (Large Language Models) im Kontext der Sprachmodellierung?

Resultierende Modelle, die oft auf der Basis von Transformer trainiert wurden. (A) Signup and view all the answers

Wie funktioniert das Masked LM Training?

Es maskiert zufällig ausgewählte Wörter in einem Satz und trainiert das Modell, diese vorherzusagen. (D) Signup and view all the answers

Was sind formale Grammatiken?

Grammatiken, die spezifisch für eine bestimmte Erkennungsaufgabe sind. (C) Signup and view all the answers

Was ist die 'First-Order Markov Property'?

Beschränkt die Wahrscheinlichkeit eines Wortes nur auf das vorhergehende Wort. (C) Signup and view all the answers

Welchen Vorteil haben Transformer-Modelle, die mit Masked LM Training trainiert wurden?

Sie ermöglichen ein Selbstüberwachtes Lernen auf großen Datenmengen. (D) Signup and view all the answers

Welche Formel wird verwendet, um ein Bigram-Sprachmodell unter Verwendung relativer Häufigkeiten zu schätzen?

$p(w_k | w_{k-1}) = \frac{\text{Anzahl von } w_k \text{ gefolgt von } w_{k-1}}{\text{Anzahl von } w_{k-1}}$ (A) Signup and view all the answers

Welche sind die Hauptbestandteile der Architektur eines Transformer-Modells für die Sprachmodellierung?

Attention-Mechanismen und Feedforward-Netzwerke. (A) Signup and view all the answers

Was ist die Interpretation der Perplexität als 'mittlerer Verzweigungsfaktor'?

Die mittlere Anzahl an möglichen folgenden Wörtern an jeder Position in einem Satz. (C) Signup and view all the answers

Welche Aussage beschreibt am besten, wie Transformer-Modelle trainiert werden?

Sie werden typischerweise durch Selbstüberwachtes Lernen trainiert. (D) Signup and view all the answers

Welche Aufgabe haben Sprachmodelle in der automatischen Spracherkennung?

Sie bewerten die Wahrscheinlichkeit von Wortfolgen. (D) Signup and view all the answers

Welche der folgenden Aussagen beschreibt korrekt den Nutzen von Sprachmodellen in Spracherkennungssystemen?

Sprachmodelle verbessern die Genauigkeit der Spracherkennung durch die Berücksichtigung grammatikalischer und semantischer Zusammenhänge. (B) Signup and view all the answers

Was ist der Unterschied zwischen Unigram-, Bigram- und N-Gramm-Modellen in Bezug auf die Berücksichtigung von Kontext?

Unigram-Modelle betrachten keinen Kontext, Bigram-Modelle berücksichtigen das vorherige Wort, und N-Gramm-Modelle berücksichtigen N-1 vorherige Wörter. (C) Signup and view all the answers

Welche Rolle spielt die Größe des Vokabulars (Wortschatzes) bei der Erzeugung der Input-Layer in einem N-Gramm-basierten neuronalen Netzwerk?

Die Größe des Vokabulars bestimmt die Anzahl der Neuronen im Input-Layer. (B) Signup and view all the answers

Welchen Vorteil bietet es Transformer-Modelle via Transformer-Training zu schätzen?

Es ermöglicht eine effizientere Nutzung von großen und komplexen Datensätzen. (C) Signup and view all the answers

Was ist der Unterschied zwischen einer Test-Set-Perplexität und der normalen Perplexität?

Die Test-Set-Perplexität wird mithilfe eines separaten Datensatzes berechnet, der nicht zum Trainieren verwendet wurde. (D) Signup and view all the answers

Welche der folgenden Aussagen beschreibt die Rolle von Sprachmodellen bei der Konstruktion von Verbundwort-HMMs (Hidden Markov Models) am besten?

Sprachmodelle bestimmen die Übergangswahrscheinlichkeiten zwischen den Wortmodellen innerhalb des Verbundwort-HMMs. (C) Signup and view all the answers

Welchen Vorteil bietet die Verwendung von Transformer-Modellen anstelle von traditionellen N-Gramm-Modellen?

Transformer-Modelle berücksichtigen globale Abhängigkeiten in Sequenzen. (D) Signup and view all the answers

Wie unterscheidet sich die Berechnung der Wahrscheinlichkeit einer Wortfolge in einem Unigram-Modell von der in einem Bigram-Modell?

Im Unigram-Modell werden die Wahrscheinlichkeiten der einzelnen Wörter multipliziert, während im Bigram-Modell bedingte Wahrscheinlichkeiten berücksichtigt werden. (B) Signup and view all the answers

Was bedeutet es, dass ein Sprachmodell 'die Wahrscheinlichkeit von Wortfolgen schätzt'?

Das Modell ordnet jeder möglichen Wortfolge eine Wahrscheinlichkeit zu, die angibt, wie wahrscheinlich diese Folge in der betrachteten Sprache ist. (B) Signup and view all the answers

Welche Auswirkung hat die 'Lattice Rescoring'-Technik auf die Leistung eines Spracherkennungssystems?

Sie verbessert die Genauigkeit, indem sie mehrere Hypothesen gleichzeitig berücksichtigt und neu bewertet. (C) Signup and view all the answers

Welche der folgenden Aufgaben kann direkt durch die Anwendung von N-Gramm-Modellen unterstützt werden?

Rechtschreibprüfung. (C) Signup and view all the answers

Inwiefern unterscheidet sich die Funktionsweise von Transformer-basierten Sprachmodellen von traditionellen N-Gramm-Modellen?

Transformer Basierte Sprachmodelle lernen aus weit mehr Informationen als N-Gramm Modelle. (A) Signup and view all the answers

Wozu dient der Projection-Layer in einem neuronalen Netzwerk, das für N-Gramm-Sprachmodellierung verwendet wird?

Die Dimensionalität des Eingangs zu reduzieren. (C) Signup and view all the answers

Wie beeinflusst die Größe des Trainingsdatensatzes die Leistung von N-Gramm-Sprachmodellen?

Ein größerer Datensatz ermöglicht eine bessere Schätzung der Wahrscheinlichkeiten und reduziert die Perplexität, jedoch nur bis zu einem gewissen Punkt. (C) Signup and view all the answers

Welche der folgenden Aussagen beschreibt am besten den Prozess der 'Lattice Rescoring' im Kontext der Spracherkennung?

Ein Verfahren zur nachträglichen Bewertung verschiedener Hypothesen (Lattices) unter Verwendung eines komplexeren Sprachmodells. (B) Signup and view all the answers

Wie beeinflusst die 'First-Order Markov Property' die Modellierung von Sprache in N-Gramm-Modellen?

Sie vereinfacht die Berechnung, indem sie annimmt, dass die Wahrscheinlichkeit eines Wortes nur vom unmittelbar vorhergehenden Wort abhängt (Bigram-Modell). (B) Signup and view all the answers

Welche Rolle spielen formale Grammatiken bei der Erstellung von Suchgraphen für Command-&-Control-Anwendungen?

Sie definieren die zulässigen Satzstrukturen und Befehle, die das System verstehen kann. (C) Signup and view all the answers

Warum ist die Interpolation eine nützliche Technik bei der Arbeit mit N-Gramm-Sprachmodellen?

Sie kombiniert Wahrscheinlichkeiten verschiedener N-Gramm-Ordnungen, um die Generalisierung zu verbessern und Daten-Sparsamkeit zu adressieren. (D) Signup and view all the answers

Was ist der Hauptvorteil der Verwendung von Transformer-Modellen anstelle von DNNs (Deep Neural Networks) für die Sprachmodellierung?

Transformer-Modelle können längere Abhängigkeiten in Texten besser erfassen und parallelisiert werden. (C) Signup and view all the answers

Wie unterscheidet sich das Training von Transformer-Modellen durch Masked LM von traditionellen Methoden?

Masked LM Training zielt darauf ab, fehlende Wörter in einem Satz vorherzusagen, was dem Modell erlaubt, Kontext besser zu verstehen. (D) Signup and view all the answers

Welche der folgenden Aussagen beschreibt das Hauptziel der statistischen Schätzung in N-Gramm-Sprachmodellen?

Die Wahrscheinlichkeiten von Wortfolgen basierend auf Trainingsdaten zu bestimmen. (C) Signup and view all the answers

Welche der folgenden Optionen ist ein Vorteil der Verwendung von stochastischen Grammatikmodellen?

Sie sind allgemein verwendbar und können aus Daten gelernt werden. (A) Signup and view all the answers

Wie kann die Perplexität eines Sprachmodells interpretiert werden?

Als Maß für die durchschnittliche Anzahl möglicher folgender Wörter an jeder Position im Text. (C) Signup and view all the answers

Wie beeinflusst die Ordnung eines N-Gramm-Modells die Genauigkeit der Vorhersage und den Bedarf an Trainingsdaten?

Höhere Ordnung erfordert mehr Daten und kann zu höherer Genauigkeit führen, solange genügend Daten vorhanden sind. (C) Signup and view all the answers

Welche der folgenden Aussagen beschreibt am besten die Beziehung zwischen der Perplexität eines Sprachmodells und der Wortfehlerrate (WER) in einem Spracherkennungssystem?

Die Wortfehlerrate ist proportional zur Quadratwurzel der Perplexität. (D) Signup and view all the answers

Inwiefern unterscheidet sich ein Unigram-Sprachmodell von einem Bigram-Sprachmodell hinsichtlich der Kontextberücksichtigung?

Ein Bigram-Modell berücksichtigt den vorhergehenden Kontext, während ein Unigram-Modell jedes Wort unabhängig behandelt. (A) Signup and view all the answers

Wie beeinflusst das Masked LM Training in Transformer-Modellen die Fähigkeit des Modells, Sprache zu verstehen?

Es ermöglicht dem Modell, bidirektionale Kontexte zu lernen, was zu einem besseren Verständnis der Wortbedeutung im Kontext führt. (B) Signup and view all the answers

Was sind die typischen Bestandteile eines Verbundwort-HMMs (Hidden Markov Model) für die Spracherkennung?

Einzelne Wortmodelle, kombiniert gemäß einem Sprachmodell. (C) Signup and view all the answers

Welche Rolle spielt das 'Development-Set' bei der Optimierung der Gewichte (λ) in interpolierten N-Gramm-Sprachmodellen?

Es wird verwendet, um die Gewichte der verschiedenen N-Gramm-Ordnungen so anzupassen, dass die Perplexität minimiert wird. (C) Signup and view all the answers

Wie wirkt sich die Verwendung einer regulären Grammatik im Vergleich zu einer kontextfreien Grammatik auf die Komplexität eines Spracherkennungssystems aus?

Reguläre Grammatiken sind einfacher zu verarbeiten und führen zu effizienteren Spracherkennungssystemen, sind aber weniger ausdrucksstark. (C) Signup and view all the answers

Welche Eigenschaft von Transformer-Modellen ermöglicht es ihnen, lange Abhängigkeiten in Sequenzen effektiver zu modellieren als traditionelle rekurrenten neuronalen Netze (RNNs)?

Die Implementierung von Aufmerksamkeitsmechanismen (Attention Mechanisms). (C) Signup and view all the answers

Was ist der Hauptunterschied zwischen einem stochastischen und einem formalen Grammatikmodell?

Stochastische Grammatiken lernen aus Daten, während formale Grammatiken vordefiniert sind. (D) Signup and view all the answers

Warum ist es wichtig, die Perplexität auf einem Testdatensatz und nicht nur auf den Trainingsdaten zu messen?

Die Perplexität auf dem Testdatensatz gibt eine Schätzung der Generalisierungsfähigkeit des Modells auf unbekannte Daten. (A) Signup and view all the answers

Welche der folgenden Formeln beschreibt die Interpolation eines Trigramm-Sprachmodells am genauesten, wobei $P_{interp}(w_k | w_{k-1}, w_{k-2})$ die interpolierte Wahrscheinlichkeit, $\lambda$ die Gewichte und $P$ die jeweiligen N-Gramm-Wahrscheinlichkeiten sind?

$P_{interp}(w_k | w_{k-1}, w_{k-2}) = \lambda_{trigram} \cdot P(w_k | w_{k-1}, w_{k-2}) + \lambda_{bigram} \cdot P(w_k | w_{k-1}) + \lambda_{unigram} \cdot P(w_k)$ (C) Signup and view all the answers

Warum ist die Verwendung von Sprachmodellen in hybriden Spracherkennungssystemen wichtig?

Sprachmodelle helfen, plausible Wortfolgen zu identifizieren und die Erkennungsgenauigkeit zu verbessern. (D) Signup and view all the answers

Welche Aussage trifft auf N-Gramm-Modelle höherer Ordnung (N > 2) im Vergleich zu Bigram-Modellen zu?

Sie modellieren Abhängigkeiten über weitere Distanzen im Satz. (B) Signup and view all the answers

Was ist das Hauptziel des Masked Language Model (MLM) Trainings bei Transformer-basierten Sprachmodellen?

Dem Modell beizubringen, fehlende Wörter in einem Satz basierend auf dem umgebenden Kontext vorherzusagen. (C) Signup and view all the answers

Was ist ein entscheidender Unterschied zwischen formalen und stochastischen Grammatiken im Kontext der automatischen Spracherkennung?

Formale Grammatiken beschreiben explizit syntaktische Strukturen, während stochastische Grammatiken Wahrscheinlichkeiten für verschiedene Wortfolgen zuordnen. (A) Signup and view all the answers

Welche der folgenden Aussagen charakterisiert am besten die Anwendung von N-Gramm-Modellen in der Praxis, insbesondere bei begrenzten Datenmengen?

Die Verwendung von Interpolationstechniken ist entscheidend, um die Leistung zu verbessern und das Problem der Datensparsamkeit zu mildern. (B) Signup and view all the answers

Welche der folgenden Methoden wird verwendet, um die Leistung von Sprachmodellen in Bezug auf ihre Fähigkeit, unbekannte Sätze zu verarbeiten, zu bewerten?

Berechnung der Perplexität auf einem separaten Testdatensatz. (A) Signup and view all the answers

Warum werden stochastische Grammatikmodelle als 'allgemein verwendbar' im Kontext der Spracherkennung beschrieben?

Weil sie aus Daten gelernt werden können und somit an verschiedene Sprachen und Domänen anpassbar sind. (C) Signup and view all the answers

Was geschieht bei der 'Interpolation' in N-Gramm-Sprachmodellen?

Die Wahrscheinlichkeiten verschiedener N-Gramm-Ordnungen werden kombiniert, um bessere Vorhersagen zu treffen. (A) Signup and view all the answers

In welchen Bereichen der Forschung und Entwicklung werden N-Gramm-Modelle typischerweise eingesetzt?

In verschiedenen Bereichen wie maschinelle Übersetzung, Spracherkennung und Rechtschreibkorrektur. (D) Signup and view all the answers

Welche Auswirkung hat eine hohe Perplexität auf die Leistung eines Spracherkennungssystems?

Sie deutet auf eine schlechtere Erkennungsgenauigkeit hin, da das Modell unsicher ist. (D) Signup and view all the answers

Welche der folgenden Architekturen wird typischerweise für die neuronale Modellierung von N-Gramm-Sprachmodellen verwendet, um die Dimensionalität der Eingabe zu reduzieren?

Projection Layer (C) Signup and view all the answers

Flashcards

Was sind Sprachmodelle?

Verbindungen von Wortmodellen durch statistische Grammatiken.

Was ist Perplexität?

Die durchschnittliche Anzahl möglicher verschiedener Worte in jedem Dialogschritt.