Grundlagen der automatischen Spracherkennung

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Welche der folgenden Aussagen bezüglich der Verwendung von Phonemen als Einheiten in der hybriden Spracherkennung sind korrekt? (Mehrere Antworten möglich)

Phoneme können alle Worte des Vokabulars konstruieren. (correct)
Phoneme ermöglichen eine präzise Abbildung der Aussprache, z.B. in „Buch“ und „Richtig“.
Phoneme benötigen ausreichend Trainingsmaterial für die Robustheit der Modelle. (correct)
Phoneme können auch neue Worte der Sprache konstruieren. (correct)

Welche der folgenden Aussagen über Sentencepiece und andere Tokenizer sind falsch?

Breite Abdeckung der Sprache und Repräsentativität des Trainingsmaterials sind nicht entscheidend. (correct)
Die Größe des Trainingsmaterials beeinflusst die Performance des Modells.
Das Trainingsmaterial bestimmt, wie gut das endgültige Modell funktioniert.
Textnormalisierung ist wichtig, um irrelevante Aspekte aus den Textdaten zu entfernen.

Welche der folgenden Vorteile bietet die Verwendung von Wortteilen als Einheit in der Spracherkennung?

Ermöglicht die Konstruktion aller Wörter des Vokabulars durch die Kombination von Buchstaben.
Ermöglicht eine hohe Präzision bei der Aussprache.
Erlaubt die Konstruktion neuer Wörter, die in der Sprache existieren.
Alle oben genannten Optionen. (correct)

Welches Argument spricht gegen die Verwendung von Wortteilen als Einheit in der Spracherkennung?

Die Tokenisierung von Wortteilen ist anfällig für Fehler. (A) Signup and view all the answers

Was ist der Hauptvorteil der Verwendung von Sentencepiece als Tool für die Tokenisierung?

Sentencepiece ist sehr flexibel. (F) Signup and view all the answers

Welche der folgenden Aussagen zum Konzept der Textnormalisierung ist wahr?

Textnormalisierung dient zur Entfernung von irrelevantem Inhalt aus Textdaten. (A) Signup and view all the answers

Was ist das Hauptkriterium für die Auswahl der ’besten’ Frage beim Bau eines Entscheidungsbaums?

Die Frage, die zur größten Likelihood führt, wenn man alle Daten in den beiden Zweigen des Baums durch ein statistisches Modell beschreibt. (A) Signup and view all the answers

Welche Aussage beschreibt am besten den Zusammenhang zwischen der Gini-Impurity und Entscheidungsbäumen?

Die Gini-Impurity ist nur für diskrete Merkmale anwendbar, nicht für kontinuierliche. (D) Signup and view all the answers

Welches ist kein Vorteil der Verwendung von Triphon-Clustern als Einheiten in der hybriden Spracherkennung?

Vereinfachung der Berechnung der Wahrscheinlichkeit im Hidden Markov Model (HMM) durch die Verwendung von Triphon-Clustern. (A) Signup and view all the answers

Was ist die Idee hinter der Verwendung von Graphemen (Buchstaben/Zeichen) als Einheiten in der hybriden Spracherkennung?

Grapheme können direkt mit den entsprechenden Audiosequenzen abgeglichen werden, ohne vorherige Phonetisierung. (B) Signup and view all the answers

Welche Aussage über den Prozess der Entscheidungsbaum-Bildung ist falsch?

Der Prozess ist unabhängig vom verwendeten statistischen Modell und kann für alle Datentypen verwendet werden. (B) Signup and view all the answers

Was ist der Hauptvorteil der Verwendung von Triphon-Clustern in der hybriden Spracherkennung?

Alle oben genannten Punkte sind Vorteile von Triphon-Clustern. (D) Signup and view all the answers

Welches Konzept spiegelt die Aussage wider, dass Triphone-Cluster die Konstruktion neuer Wörter ermöglichen?

Transfer (A) Signup and view all the answers

Welche Aussage beschreibt die falsche Anwendung der Gini-Impurity?

Die Gini-Impurity ist ein Maß für die Homogenität in einer Menge von Datenpunkten. (D) Signup and view all the answers

Welche der folgenden Anforderungen an Spracherkennungseinheiten ist nicht in dem Text erwähnt?

Skalierbarkeit (C) Signup and view all the answers

Welche Aussage über phonetische Wörterbücher ist falsch?

Sie garantieren eine perfekte Übereinstimmung zwischen der gesprochenen und der geschriebenen Form eines Wortes. (C) Signup and view all the answers

Welches Problem stellt sich bei der Verwendung von Phonemen als Spracherkennungseinheiten?

Die Aussprache von Phonemen ist kontextunabhängig und variiert nicht. (C) Signup and view all the answers

Welche Aussage über die Gesamtstruktur hybrider Spracherkennungssysteme ist richtig?

Die Auswahl der optimalen sprachlichen Einheiten für die Ausgangsschicht des DNN ist entscheidend. (D) Signup and view all the answers

Welches der folgenden Merkmale ist kein Kriterium für die Auswahl geeigneter Spracherkennungseinheiten?

Die Anzahl der Einheiten sollte möglichst gering sein. (C) Signup and view all the answers

Was ist der Hauptvorteil der Verwendung von Phonemen als Spracherkennungseinheiten?

Phoneme ermöglichen die Erkennung einer großen Anzahl von Wörtern. (C) Signup and view all the answers

Welche Komponente ist nicht Bestandteil eines hybriden Spracherkennungssystems?

Grammatik-Analyse (A) Signup and view all the answers

Welche Aussage über die Robustheit von Spracherkennungseinheiten ist richtig?

Alle oben genannten Aussagen sind richtig. (D) Signup and view all the answers

Welche der folgenden Aussagen über die Nachteile der Verwendung von Graphemen (Buchstaben/Zeichen) in der hybriden Spracherkennung ist falsch?

Die Erkennungsraten sind im Vergleich zu anderen Einheiten nicht optimal, weil die Modellierung von Pronunziationsvarianten für verschiedene Wörter schwierig ist. (C) Signup and view all the answers

Welches der folgenden Argumente spricht nicht für die Verwendung von Graphemen als Einheiten in der hybriden Spracherkennung?

Die benötigte Menge an Trainingsdaten ist geringer im Vergleich zu anderen Ansätzen. (B) Signup and view all the answers

Welche der folgenden Aussagen über Byte-Pair Encoding (BPE) im Kontext der hybriden Spracherkennung ist richtig?

BPE verwendet zusätzlich zu Buchstaben die häufigsten Paare aus dem Text als weitere Token. (D) Signup and view all the answers

Welche der folgenden Aussagen über Sentencepiece ist falsch?

Sentencepiece basiert auf einem anderen Algorithmus als Byte-Pair Encoding. (D) Signup and view all the answers

Welche der folgenden Aussagen über die Verwendung von Wortteilen in der hybriden Spracherkennung ist falsch?

Wortteile werden immer auf Basis der Wortgrenzen im Text generiert. (C) Signup and view all the answers

Welche der folgenden Aussagen über die hybriden Spracherkennungssysteme mit Wortteilen ist richtig?

Die Verwendung von Wortteilen ist immer effektiver als die Verwendung von Graphemen. (D) Signup and view all the answers

Warum ist die Verwendung von Wortteilen in der hybriden Spracherkennung besonders effektiv bei der Erkennung von Wörtern mit ähnlicher Aussprache?

Weil Wortteile die Unterscheidung zwischen ähnlichen Wörtern auf Basis ihrer phonetischen Unterschiede erleichtern können. (A) Signup and view all the answers

Welche der folgenden Aussagen über die hybriden Spracherkennungssysteme mit Wortteilen ist falsch?

Die Auswahl der Wortteile hängt von der Größe des Modells ab. (A) Signup and view all the answers

Flashcards

Hybride Spracherkennung

Ein Ansatz zur automatischen Spracherkennung, der verschiedene Methoden kombiniert.

Modularität

Die Fähigkeit, alle Worte des Vokabulars konstruierbar zu machen.