Podcast
Questions and Answers
Was ist der Unterschied zwischen Intrasprechervariabilität und Intersprechervariabilität?
Was ist der Unterschied zwischen Intrasprechervariabilität und Intersprechervariabilität?
Welche der folgenden Faktoren könnten zu Intrasprechervariabilität führen?
Welche der folgenden Faktoren könnten zu Intrasprechervariabilität führen?
Welche der folgenden Aussagen über die Merkmalsextraktion ist korrekt?
Welche der folgenden Aussagen über die Merkmalsextraktion ist korrekt?
Welche der folgenden Merkmalsextraktionsmethoden wird im Zeitbereich verwendet?
Welche der folgenden Merkmalsextraktionsmethoden wird im Zeitbereich verwendet?
Signup and view all the answers
Welche der folgenden Merkmalsextraktionsmethoden wird im Frequenzbereich verwendet?
Welche der folgenden Merkmalsextraktionsmethoden wird im Frequenzbereich verwendet?
Signup and view all the answers
Welche der folgenden Aussagen über die Interprechervariabilität ist korrekt?
Welche der folgenden Aussagen über die Interprechervariabilität ist korrekt?
Signup and view all the answers
Welche der folgenden Aussagen über den Merkmalsextraktions-Prozess ist korrekt?
Welche der folgenden Aussagen über den Merkmalsextraktions-Prozess ist korrekt?
Signup and view all the answers
Was sind die zwei Arten von Fehlern, die bei der Quantisierung auftreten?
Was sind die zwei Arten von Fehlern, die bei der Quantisierung auftreten?
Signup and view all the answers
Wie wirkt sich ein kleinerer Maximalpegel $s_{max}$ auf den Gesamtfehler aus?
Wie wirkt sich ein kleinerer Maximalpegel $s_{max}$ auf den Gesamtfehler aus?
Signup and view all the answers
Welche der folgenden Quantisierungskennlinien ist asymmetrisch?
Welche der folgenden Quantisierungskennlinien ist asymmetrisch?
Signup and view all the answers
Welches Einflussfaktor sinkt mit einem niedrigeren Maximalpegel im Arbeitsbereich?
Welches Einflussfaktor sinkt mit einem niedrigeren Maximalpegel im Arbeitsbereich?
Signup and view all the answers
Was passiert, wenn die Amplitude konstant null ist?
Was passiert, wenn die Amplitude konstant null ist?
Signup and view all the answers
Was stellt die Herausforderung bei der ersten Realisierung des Channel Vocoders dar?
Was stellt die Herausforderung bei der ersten Realisierung des Channel Vocoders dar?
Signup and view all the answers
Wie wird die Lösung zur Problematik der phasenabhängigen Auslöschungen im Channel Vocoder dargestellt?
Wie wird die Lösung zur Problematik der phasenabhängigen Auslöschungen im Channel Vocoder dargestellt?
Signup and view all the answers
Was beschreibt die Mel-Frequenzanalyse?
Was beschreibt die Mel-Frequenzanalyse?
Signup and view all the answers
Welche Rolle spielt die Arbeit von Homer Dudley bei der Entwicklung des Channel Vocoders?
Welche Rolle spielt die Arbeit von Homer Dudley bei der Entwicklung des Channel Vocoders?
Signup and view all the answers
Was beschreibt die Gleichung xMel(m, τ) in Bezug auf den Channel Vocoder?
Was beschreibt die Gleichung xMel(m, τ) in Bezug auf den Channel Vocoder?
Signup and view all the answers
Welche der folgenden Methoden ist für große Datenmengen geeignet?
Welche der folgenden Methoden ist für große Datenmengen geeignet?
Signup and view all the answers
Welches Merkmal ist typisch für die analytische Berechnung?
Welches Merkmal ist typisch für die analytische Berechnung?
Signup and view all the answers
Wofür ist die neutrale Berechnung optimal angepasst?
Wofür ist die neutrale Berechnung optimal angepasst?
Signup and view all the answers
Welche Funktion hat die Flexibilität bei der Implementierung in Bezug auf die Merkmalsextraktion?
Welche Funktion hat die Flexibilität bei der Implementierung in Bezug auf die Merkmalsextraktion?
Signup and view all the answers
Welche Aussage beschreibt die Parameterberechnung in der Merkmalsextraktion?
Welche Aussage beschreibt die Parameterberechnung in der Merkmalsextraktion?
Signup and view all the answers
Wofür ist die Zeitbereichsanalyse hauptsächlich geeignet?
Wofür ist die Zeitbereichsanalyse hauptsächlich geeignet?
Signup and view all the answers
Was charakterisiert die definierte Funktion in der analytischen Berechnung?
Was charakterisiert die definierte Funktion in der analytischen Berechnung?
Signup and view all the answers
Welcher der folgenden Bereiche ist nicht direkt mit der Merkmalsextraktion verbunden?
Welcher der folgenden Bereiche ist nicht direkt mit der Merkmalsextraktion verbunden?
Signup and view all the answers
Was beschreibt der Mid-Rise-Quantisierer?
Was beschreibt der Mid-Rise-Quantisierer?
Signup and view all the answers
Wie beeinflusst das Quantisierungsrauschen die Qualität des Signals?
Wie beeinflusst das Quantisierungsrauschen die Qualität des Signals?
Signup and view all the answers
Welche Fehlerarten treten bei der Quantisierung auf?
Welche Fehlerarten treten bei der Quantisierung auf?
Signup and view all the answers
Was sind die zwei Entscheidungen, die bei der Quantisierung getroffen werden müssen?
Was sind die zwei Entscheidungen, die bei der Quantisierung getroffen werden müssen?
Signup and view all the answers
Was geschieht mit dem Einfluss des Überlastungsrauschens, wenn der Maximalpegel smax gesenkt wird?
Was geschieht mit dem Einfluss des Überlastungsrauschens, wenn der Maximalpegel smax gesenkt wird?
Signup and view all the answers
Wie wird die Fehleranalyse bei der Quantisierung durchgeführt?
Wie wird die Fehleranalyse bei der Quantisierung durchgeführt?
Signup and view all the answers
Was unterscheidet die Mid-Tread-Quantisierung von der Mid-Rise-Quantisierung?
Was unterscheidet die Mid-Tread-Quantisierung von der Mid-Rise-Quantisierung?
Signup and view all the answers
Welcher Aspekt wird im Zusammenhang mit der Wortbreite w berücksichtigt?
Welcher Aspekt wird im Zusammenhang mit der Wortbreite w berücksichtigt?
Signup and view all the answers
Was beschreibt die Intersprechervariabilität?
Was beschreibt die Intersprechervariabilität?
Signup and view all the answers
Was hat keinen Einfluss auf die Merkmale im Zeit- und Frequenzbereich?
Was hat keinen Einfluss auf die Merkmale im Zeit- und Frequenzbereich?
Signup and view all the answers
Warum ist die Analyse im Frequenzbereich wichtig?
Warum ist die Analyse im Frequenzbereich wichtig?
Signup and view all the answers
Welche Frequenz ist bei der Analyse der Sprachsignale am häufigsten relevant?
Welche Frequenz ist bei der Analyse der Sprachsignale am häufigsten relevant?
Signup and view all the answers
Welches der folgenden Elemente ist Teil der Merkmalsextraktion im Zeitbereich?
Welches der folgenden Elemente ist Teil der Merkmalsextraktion im Zeitbereich?
Signup and view all the answers
Was könnte den Frequenzbereich einer Sprachaufnahme beeinflussen?
Was könnte den Frequenzbereich einer Sprachaufnahme beeinflussen?
Signup and view all the answers
Welche Komponente ist typischerweise nicht Teil der Anspracheanalyse?
Welche Komponente ist typischerweise nicht Teil der Anspracheanalyse?
Signup and view all the answers
In welchem Kontext spielt die Analyse der Intersprechervariabilität eine essentielle Rolle?
In welchem Kontext spielt die Analyse der Intersprechervariabilität eine essentielle Rolle?
Signup and view all the answers
Wie kann die Variation der Aussprache zwischen Sprechern gemessen werden?
Wie kann die Variation der Aussprache zwischen Sprechern gemessen werden?
Signup and view all the answers
Was könnte die Sprecheridentifikation in einer Analyse erschweren?
Was könnte die Sprecheridentifikation in einer Analyse erschweren?
Signup and view all the answers
Flashcards
Intrasprechervariabilität
Intrasprechervariabilität
Variation der Aussprache bei demselben Sprecher.
Intersprechervariabilität
Intersprechervariabilität
Variation der Aussprache zwischen verschiedenen Sprechern.
Zeitbereich
Zeitbereich
Bereich, in dem Merkmale im Zeitverlauf analysiert werden.
Frequenzbereich
Frequenzbereich
Signup and view all the flashcards
Merkmalsextraktion
Merkmalsextraktion
Signup and view all the flashcards
Aussprachevariation
Aussprachevariation
Signup and view all the flashcards
Sprecher
Sprecher
Signup and view all the flashcards
Akzent
Akzent
Signup and view all the flashcards
Signalbeispiel
Signalbeispiel
Signup and view all the flashcards
Amplitude
Amplitude
Signup and view all the flashcards
Sprachsignal
Sprachsignal
Signup and view all the flashcards
Akustische Analysen
Akustische Analysen
Signup and view all the flashcards
Frequenzachse
Frequenzachse
Signup and view all the flashcards
Grafische Darstellung
Grafische Darstellung
Signup and view all the flashcards
Channel Vocoder
Channel Vocoder
Signup and view all the flashcards
Phasenabhängige Auslöschungen
Phasenabhängige Auslöschungen
Signup and view all the flashcards
Summation der Beträge
Summation der Beträge
Signup and view all the flashcards
Mel-Frequenzanalyse
Mel-Frequenzanalyse
Signup and view all the flashcards
Quantisierungsfehler
Quantisierungsfehler
Signup and view all the flashcards
Mid-Rise Quantisierer
Mid-Rise Quantisierer
Signup and view all the flashcards
Mid-Tread Quantisierer
Mid-Tread Quantisierer
Signup and view all the flashcards
Quantisierungsrauschen
Quantisierungsrauschen
Signup and view all the flashcards
Überlastungsfehler
Überlastungsfehler
Signup and view all the flashcards
Aussteuergrenze smax
Aussteuergrenze smax
Signup and view all the flashcards
Wortbreite w
Wortbreite w
Signup and view all the flashcards
Kennlinie sq(k)
Kennlinie sq(k)
Signup and view all the flashcards
Analytische Berechnung
Analytische Berechnung
Signup and view all the flashcards
Neuronale Berechnung
Neuronale Berechnung
Signup and view all the flashcards
Geeignet für große Datenmengen
Geeignet für große Datenmengen
Signup and view all the flashcards
Geeignet für kleine/mittlere Datenmengen
Geeignet für kleine/mittlere Datenmengen
Signup and view all the flashcards
Flexibler Einsatz
Flexibler Einsatz
Signup and view all the flashcards
Spracherkennung
Spracherkennung
Signup and view all the flashcards
Emotionserkennung
Emotionserkennung
Signup and view all the flashcards
Mid-Rise Quantisierung
Mid-Rise Quantisierung
Signup and view all the flashcards
Mid-Tread Quantisierung
Mid-Tread Quantisierung
Signup and view all the flashcards
$s_{max}$
$s_{max}$
Signup and view all the flashcards
Study Notes
Grundlagen der automatischen Spracherkennung - Kapitel 3: Merkmale im Zeit- und Frequenzbereich
- Kapitel: 3, Thema: Merkmale im Zeit- und Frequenzbereich, Datum: 12. November 2024, Dozentin: Prof. Dr.-Ing. Dorothea Kolossa, Fachgebiet: Elektronische Systeme der Medizintechnik (mtec)
- Ziel der Merkmalsextraktion: Starke Korrelation mit phonetischem Inhalt; Reduktion von: Intrasprechervariabilität, Intersprechervariabilität, nicht wahrnehmbaren Signalanteilen, Stimmungs- und Intonationsabhängigkeiten, Raumabhängigkeiten.
- Intrasprechervariabilität: Variation der Aussprache desselben Sprechers. Beispiele (auf den Präsentationen) wurden gezeigt, um diese Variation zu veranschaulichen.
- Intersprechervariabilität: Variation der Aussprache zwischen verschiedenen Sprechern. Beispiele (auf den Präsentationen) wurden gezeigt, um diese Variation zu veranschaulichen.
- Quantisierung (I): Darstellung eines reellen Eingangssignals mit fester Wortbreite. Wichtig ist dabei die Linearität der Quantisierung. Eine einfache Option ist die gleichmäßige Quantisierung.
- Quantisierung (II): Zwei wesentliche Entscheidungen: Aussteuergrenze (Smax) und Wortbreite (w) der Quantisierung. Eine Analyse der durch die Quantisierung entstehenden Fehler ist notwendig.
- Quantisierung (III): Konzept der Überlastungs- und Quantisierungsrauschen wird grafisch illustriert
- Quantisierung (V): Anforderungen in der Spracherkennung: Clipping vermeiden, gleichzeitig möglichst geringes Quantisierungsrauschen. Ein geeigneter Kompromiss ergibt sich aus der Verteilungsdichtefunktion der Sprachamplituden, wobei Smax= 40x oft eine gute Wahl für die Quantisierung ist.
- Parameterberechnung: Zwei grundlegende Arten der Berechnung von Parametern gibt es:
- Analytische Berechnung: Definierte Funktion, optimal für kleine/mittlere Datensätze, geradlinige Implementierung, flexibel einsetzbar (Spracherkennung, Sprechererkennung, Emotionserkennung, technische Diagnose).
- Neuronale Berechnung: Automatisch gelernt, geeignet für große Datensätze, hoher Trainingsaufwand, optimal für den jeweiligen Aufgabentyp angepasst.
- Analytische Parameterberechnung: Die Berechnung beinhaltet Schritte wie Zeitbereichsanalyse, ggf. Zeitbereichs-Featureanalyse, Frequenzanalyse, Cepstral-Analyse, Dimensionsreduktion und Vektorquantisierung.
- Fensterfunktion: Ein Transformationspaar w(t) und W(jw) stellt eine Fensterfunktion dar, die bestimmte Eigenschaften (reell, symmetrisch, begrenzter Bereich ungleich Null, normalisiert, schmalbandig) aufweist. Fensterung im Zeitbereich entspricht einer Faltung im Frequenzbereich. Wichtige Fensterfunktionen sind Rechteck-, Hamming-, Hann- und Blackman-Fenster.
- Wahl der Fensterlänge für Sprachanalyse: Ein Kompromiss zwischen breit- und schmalbandigen Spektrogrammen ist notwendig. Die Zeitlänge der Fenster ist wichtig, um die Kurzzeitstationarität der Sprache zu berücksichtigen (ca. 20-25ms).
- Mel-Frequenzanalyse: Eine hörorientierten Analyse zur Annäherung menschlicher Wahrnehmung, inspiriert durch die Arbeiten von Homer Dudley (Bell Labs, 1930er Jahre). Phasenabhängige Auslöschung der Signale ist ein Problem, welches durch Summierung der Beträge gelöst werden kann. Mel-Filterbank-Design beinhaltet Dreiecksfilter.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
In diesem Quiz werden die Merkmale im Zeit- und Frequenzbereich behandelt, die in der automatischen Spracherkennung eine wesentliche Rolle spielen. Besonderes Augenmerk liegt auf der Intrasprechervariabilität und der Intersprechervariabilität. Beispiele verdeutlichen die Variation der Aussprache und deren Einfluss auf die Merkmalsextraktion.