Einführung in die Spracherkennung - Kapitel 1
76 Questions
7 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Welche Aussage über das Vokalviereck ist falsch?

  • Das Vokalviereck stellt die Position der Zunge im Mundraum dar.
  • Das Vokalviereck zeigt die Vokale und Diphtonge der deutschen Sprache.
  • Der Punkt "u" im Vokalviereck repräsentiert den Vokal "geschlossen"
  • Die horizontale Achse des Vokalvierecks zeigt die Zungenhöhe an. (correct)
  • Welches Sprachorgan wird im Vokalviereck durch die vertikale Achse dargestellt?

  • Gaumen
  • Zungenspitze
  • Zungenrücken (correct)
  • Kiefer
  • Welche der folgenden Phoneme befinden sich im Bereich der "hinten" und "geschlossen" im Vokalviereck?

  • i, u (correct)
  • ö, ü
  • e, o
  • a, ä
  • Welcher Diphtong ist im Vokalviereck nicht dargestellt?

    <p>eu (C)</p> Signup and view all the answers

    Welches Symbol im Internationalen Phonetischen Alphabet (IPA) wird für den Vokal "u" verwendet?

    <p>/u/ (B)</p> Signup and view all the answers

    Welche der folgenden Konsonanten sind Plosive?

    <p>p, b, t, d, k, g, Q (B)</p> Signup and view all the answers

    Welche Artikulationsart wird mit einem vollständigen Abschluss des Luftstroms im Mund gebildet?

    <p>Plosive (B)</p> Signup and view all the answers

    Welche Konsonanten in der Tabelle sind labiodental?

    <p>f, v (A)</p> Signup and view all the answers

    Wie werden Vokale im Gegensatz zu Konsonanten erzeugt?

    <p>Vokale werden ohne wesentliche Engstellen im Mund erzeugt. (B)</p> Signup and view all the answers

    Welche der folgenden Konsonanten werden durch den Zungenrücken am Gaumen gebildet?

    <p>k, g (D)</p> Signup and view all the answers

    Welche der folgenden Konsonanten werden durch den Zungenrücken am harten Gaumen gebildet?

    <p>t, d (C)</p> Signup and view all the answers

    Welche der folgenden Konsonanten werden durch die Zungenspitze an den Zahnhöckern gebildet?

    <p>t, d (D)</p> Signup and view all the answers

    Wie werden Nasale erzeugt?

    <p>Durch einen vollständigen Verschluss im Mund, aber der Luftstrom entweicht durch die Nase. (D)</p> Signup and view all the answers

    Was ist der Unterschied zwischen einem Phonem und einem Phone?

    <p>Phoneme sind die kleinsten bedeutungsunterscheidenden Einheiten einer Sprache, während Phone die tatsächlichen Laute sind, die wir produzieren. (B)</p> Signup and view all the answers

    Welche Methode zum Feststellen von Phonemen basiert auf der Suche nach Paaren von Wörtern, die sich nur in einem einzigen Laut unterscheiden?

    <p>Minimalpaaranalyse (A)</p> Signup and view all the answers

    Was ist das Kernprinzip der "Komplementären Distribution" im amerikanischen Strukturalismus?

    <p>Laute, die in denselben Kontexten vorkommen und die Bedeutung nicht verändern, werden als ein einziges Phonem betrachtet. (C)</p> Signup and view all the answers

    Welcher der folgenden Aspekte würde am ehesten zur Unterscheidung von "Phoneme" versus "Phone" beitragen?

    <p>Ob der Laut die Bedeutung eines Wortes beeinflusst. (D)</p> Signup and view all the answers

    Welche der folgenden Aussagen beschreibt die zentrale Idee des europäischen Strukturalismus?

    <p>Die Analyse von minimalen Paaren erlaubt die Unterscheidung von Phonemen anhand ihrer Fähigkeit, die Bedeutung von Wörtern zu verändern. (C)</p> Signup and view all the answers

    Welche der folgenden Anwendungen der Spracherkennung werden im Text erwähnt?

    <p>Steuerung von Fahrzeugen (D)</p> Signup and view all the answers

    Welches Unternehmen hat Jibbigo gekauft?

    <p>Facebook (B)</p> Signup and view all the answers

    Welches Unternehmen bietet die Software "Dragon Naturally Speaking" an?

    <p>Nuance (C)</p> Signup and view all the answers

    Welches Feature von Apple Vision Pro wird im Text erwähnt?

    <p>Spracherkennung (B)</p> Signup and view all the answers

    Welche der folgenden Anwendungen von Spracherkennung werden im Text nicht erwähnt?

    <p>Spielekonsolen (C)</p> Signup and view all the answers

    Welches Unternehmen bietet einen "Open-Source Whisper Alternative" an?

    <p>CMU (D)</p> Signup and view all the answers

    Welche der folgenden Aussagen zum Einsatz der Spracherkennung in Callcentern ist richtig?

    <p>Spracherkennung wird hauptsächlich zur Abwicklung von Kundenanfragen eingesetzt. (C)</p> Signup and view all the answers

    Welche der folgenden Aussagen zur Entwicklung der Spracherkennung ist richtig?

    <p>Die Entwicklung der Spracherkennung hat bereits vor mehreren Jahrzehnten begonnen. (B)</p> Signup and view all the answers

    Welche der folgenden Konsonanten sind Beispiele für eigenschaftliche Plosiven?

    <p>Bilabial plosiv (C)</p> Signup and view all the answers

    Welche dieser Vokalkategorien ist für eine geöffnete Mundstellung charakteristisch?

    <p>Open (D)</p> Signup and view all the answers

    Was kennzeichnet ejective Konsonanten?

    <p>Sie entstehen durch eine plötzliche Freisetzung von Luft. (D)</p> Signup and view all the answers

    Welche der folgenden Beispiele ist ein bilabialer Vokal?

    <p>Bilabial Frikativ (D)</p> Signup and view all the answers

    Welche Kategorie beschreibt diakritische Zeichen über einem Symbol mit einem Abstieg?

    <p>Suprasegmentals (C)</p> Signup and view all the answers

    Welches symbolisiert eine sekundäre Betonung in der Phonetik?

    <p>Secondary stress (D)</p> Signup and view all the answers

    Was ist ein primäres Merkmal einer alveolaren Frikative?

    <p>Sie entstehen durch einen Luftstrom über die Zunge. (C)</p> Signup and view all the answers

    Welches Signal weist auf Long oder Half-long Vokale hin?

    <p>Diakritik (C)</p> Signup and view all the answers

    Welche der folgenden Optionen beschreibt nicht eine Art von stimmhaften Lauten?

    <p>Voiceless (A)</p> Signup and view all the answers

    Welcher Begriff beschreibt einen Laut, der eine Sprachenpause zwischen Silben anzeigt?

    <p>Syllable break (D)</p> Signup and view all the answers

    Was beschreibt die Position der Zunge bei der Erzeugung eines Lautes?

    <p>Advanced Tongue Root (D)</p> Signup and view all the answers

    Welcher Typ von Laut führt zu einer höheren Stimmbänder-vibration?

    <p>Voiced (B)</p> Signup and view all the answers

    Welches Wort beschreibt das Fehlen einer hörbaren Pause zwischen den Wörtern?

    <p>Linking (B)</p> Signup and view all the answers

    Welche Aussage beschreibt einen stimmhaften Nasallaut?

    <p>Nasal release (A)</p> Signup and view all the answers

    Was bedeutet es, wenn ein Laut als 'aspiriert' bezeichnet wird?

    <p>Mit einer starken Ausatmung erzeugt (A)</p> Signup and view all the answers

    Welcher Begriff beschreibt eine progressiv steigende Tonhöhe in einem Laut?

    <p>Rising (A)</p> Signup and view all the answers

    Welche Art von Laut ist mit einer vollständigen Blockade der Oralpassage verbunden?

    <p>Apikal (D)</p> Signup and view all the answers

    Was beschreibt eine reduzierte Tonhöhe oder Tonebenen in der Sprachfarbe?

    <p>Low (D)</p> Signup and view all the answers

    Which of the following is NOT a feature of the Apple Vision Pro?

    <p>OK Google Voice Search (A)</p> Signup and view all the answers

    Which company developed the Dragon Naturally Speaking software?

    <p>Nuance (A)</p> Signup and view all the answers

    The Viterbi algorithm can be used to address the issue of coarticulation in speech recognition.

    <p>True (A)</p> Signup and view all the answers

    Which of the following techniques can be used to mitigate the effects of acoustic noise in speech recognition?

    <p>All of the above (D)</p> Signup and view all the answers

    Match the following terms with their respective descriptions:

    <p>Phonetics = The study of speech sounds and their production Phoneme = The smallest unit of sound that can distinguish meaning in a specific language Minimal pair = Two words that differ in only one sound, such as 'bit' and 'bet' Complementary distribution = Two sounds that never occur in the same phonetic context, such as 'p' and 'b' in English</p> Signup and view all the answers

    Welche aktiven Artikulatoren werden verwendet, um den Plosiv /p/ zu erzeugen?

    <p>Die Unterlippe und die Oberlippe.</p> Signup and view all the answers

    Welche passiven Artikulatoren sind am meisten an der Bildung von Zungenspitzenlauten beteiligt, die in den meisten Sprachen vorkommen?

    <p>Die Oberzähne.</p> Signup and view all the answers

    Erläutern Sie den Unterschied zwischen dem 'harten Gaumen' und dem 'weichen Gaumen' im Bezug auf ihre Rolle in der Sprachproduktion.

    <p>Der harte Gaumen ist ein starrer Bereich, der für die Bildung von Lauten verwendet wird, bei denen die Zunge den Gaumen berührt. Der weiche Gaumen hingegen ist ein beweglicher Bereich, der sich heben und senken kann, um den Nasengang zu öffnen oder zu schließen, so dass die Luft entweder durch die Nase oder den Mund strömen kann.</p> Signup and view all the answers

    Welche Artikulatoren sind am häufigsten an der Bildung von Konsonanten beteiligt, die als 'alveolar' bezeichnet werden?

    <p>Die Zungenspitze und die Zahnhöcker.</p> Signup and view all the answers

    Erstellen Sie eine kurze Tabelle, die die wichtigsten aktiven und passiven Artikulatoren auflistet und jeweils einen Beispiellaut darstellt, der mit ihrer Interaktion gebildet wird.

    <table> <thead> <tr> <th>Aktiver Artikulator</th> <th>Passiver Artikulator</th> <th>Beispiellaut</th> </tr> </thead> <tbody> <tr> <td>Zungenspitze</td> <td>Oberzähne</td> <td>/t/</td> </tr> <tr> <td>Unterlippe</td> <td>Oberlippe</td> <td>/b/</td> </tr> <tr> <td>Zungenrücken</td> <td>harter Gaumen</td> <td>/k/</td> </tr> </tbody> </table> Signup and view all the answers

    Erklären Sie den Unterschied zwischen einem stimmhaften und einem stimmlosen Signal im Kontext der Sprache. Welche Komponente des Modells ist für diese Unterscheidung verantwortlich?

    <p>Ein stimmhaftes Signal entsteht durch Vibration der Stimmbänder, während ein stimmloses Signal ohne Vibration der Stimmbänder erzeugt wird. Die Stimmbänder sind für diese Unterscheidung verantwortlich.</p> Signup and view all the answers

    Was bedeutet "periodische Bewegung" im Zusammenhang mit der Sprachproduktion? Warum ist diese Bewegung relevant für die Entstehung von Sprachlauten?

    <p>Periodische Bewegung beschreibt die regelmäßige, rhythmische Bewegung der Stimmbänder, die durch den Luftstrom aus den Lungen angetrieben wird. Diese Bewegung erzeugt Schwingungen, die als Grundton der Stimme wahrgenommen werden und die Grundlage für die Produktion von stimmhaften Lauten bilden.</p> Signup and view all the answers

    Beschreiben Sie die Rolle des Vokaltrakts im Sprachproduktionsprozess. Wie beeinflusst er die Qualität des produzierten Tons?

    <p>Der Vokaltrakt ist der Weg, auf dem der von den Stimmbändern erzeugte Ton modifiziert wird. Seine Form und Größe beeinflussen die Resonanzfrequenzen und somit die Klangfarbe des Lautes. Durch Veränderungen der Form des Vokaltrakts können wir verschiedene Vokale und Konsonanten erzeugen.</p> Signup and view all the answers

    In welcher Beziehung stehen die Lungen und die Stimmbänder im Sprachproduktionsprozess? Erläutern Sie diese Beziehung.

    <p>Die Lungen dienen als Quelle des Luftstroms, der die Stimmbänder in Bewegung versetzt. Die Luft aus den Lungen strömt über die Stimmbänder und setzt sie in Schwingung. Die Bewegung der Stimmbänder erzeugt dann den Grundton der Stimme, der durch den Vokaltrakt modifiziert wird.</p> Signup and view all the answers

    Wie lässt sich die Beziehung zwischen der Frequenz und der Periode eines periodischen Signals in der Sprachproduktion anhand des Diagramms und der Graphen im Text erklären?

    <p>Die Periode eines Signals ist die Zeitdauer eines kompletten Zyklus, während die Frequenz die Anzahl der Zyklen pro Zeiteinheit ist. Das Diagramm zeigt, dass die Periode des Signals mit der Frequenz des Signals in einem inversen Verhältnis steht - je höher die Frequenz ist, desto kürzer ist die Periode.</p> Signup and view all the answers

    Warum ist es wichtig, dass das Modell der Sprachproduktion "physiologisch motiviert" ist? Was versteht man unter diesem Begriff?

    <p>Das Modell ist &quot;physiologisch motiviert&quot;, da es die tatsächlichen Prozesse der Sprachproduktion im menschlichen Körper widerspiegelt. Dies bedeutet, dass die Komponenten und Schritte im Modell auf realen anatomischen Strukturen und physiologischen Mechanismen basieren.</p> Signup and view all the answers

    Geben Sie zwei Beispiele für Konsonanten, die im Modell der Sprachproduktion als "stimmlose Signale" klassifiziert werden würden.

    <p>Zwei Beispiele für Konsonanten, die als &quot;stimmlose Signale&quot; klassifiziert werden würden, sind /p/ und /t/. Diese Laute werden produziert, ohne dass die Stimmbänder vibrieren.</p> Signup and view all the answers

    Was passiert im Vokaltrakt, wenn ein stimmhafter Laut erzeugt wird? Erläutern Sie, wie diese Veränderung zu den phonetischen Eigenschaften des Lautes führt.

    <p>Wenn ein stimmhafter Laut erzeugt wird, wird der vom Luftstrom in den Lungen angestossene Ton, der durch die Vibration der Stimmbänder entsteht, durch den Vokaltrakt modifiziert. Durch die Form und Größe des Vokaltrakts wird der Ton geformt und erhält seine charakteristische Klangfarbe.</p> Signup and view all the answers

    Welche Aussage über die Konsonantenklassifizierung in der Tabelle ist korrekt?

    <p>Die Tabelle zeigt die Konsonanten nach Artikulationsart und Ort der Artikulation, wobei ein Laut mehrere Kategorien gleichzeitig einnehmen kann. (B)</p> Signup and view all the answers

    Welcher Konsonant in der Tabelle ist ein Beispiel für einen uvularen Frikativ?

    <p>x (B)</p> Signup and view all the answers

    Welcher der folgenden Laute ist KEIN Plosiv?

    <p>m (A)</p> Signup and view all the answers

    Welche Aussage über die lateralen Laute und Halbvokale ist korrekt?

    <p>Laterale Laute und Halbvokale werden mit einer friktionslosen Artikulation gebildet, bei der der Luftstrom seitlich durch den Mund entweicht. (C)</p> Signup and view all the answers

    Welche der folgenden Vokale befindet sich im Vokalviereck am weitesten vorne im Mund?

    <p>i: (C)</p> Signup and view all the answers

    Welche Aussage über die Vokale 'i:' und 'e:' ist korrekt?

    <p>Beide Vokale werden mit der Zunge <em>ganz vorne</em> im Mund gebildet. (D)</p> Signup and view all the answers

    Welcher der folgenden Vokale wird mit der Zunge weit hinten im Mund gebildet und ist gerundet?

    <p>u: (A)</p> Signup and view all the answers

    Welche der folgenden Vokale wird mit der Zunge weit vorne im Mund gebildet und ist nicht gerundet?

    <p>e: (D)</p> Signup and view all the answers

    Welchen der folgenden Vokale zeichnet sich durch eine geöffnete Mundstellung aus?

    <p>a (C)</p> Signup and view all the answers

    Welche zwei Vokale im Vokalviereck sind der Mitte des Diagramms am nächsten?

    <p>e und u (B)</p> Signup and view all the answers

    Welches Merkmal von Vokalen wird im Vokalviereck durch die horizontale Achse dargestellt?

    <p>Vorder- oder Hinterzungenposition (A)</p> Signup and view all the answers

    Welcher der folgenden Vokale würde im Vokalviereck am weitesten von der Mitte entfernt im Bereich der 'vorn' und 'geschlossen' Vokale platziert werden?

    <p>i (B)</p> Signup and view all the answers

    Welche Aussage über die Verbindungen zwischen den Vokalen im rechten Teil des Vokalvierecks ist korrekt?

    <p>Die Verbindungen zeigen die artikulatorischen Übergänge zwischen einzelnen Vokalen. (A)</p> Signup and view all the answers

    Welche der folgenden Aussagen über die Vokale im Bereich der 'hinten' und 'offen' Vokale ist richtig?

    <p>Diese Vokale werden mit einer sehr breiten Mundöffnung artikuliert. (D)</p> Signup and view all the answers

    Flashcards

    Spracherkennung

    Die Technologie zur Erkennung und Verarbeitung von Sprache durch Computer.

    Anwendungen von Spracherkennung

    Einsatzmöglichkeiten wie Smartphone-Steuerung, Diktiersysteme oder Sprachübersetzung.

    Diktiersysteme

    Software, die gesprochene Sprache in Text umwandelt, wie Dragon Naturally Speaking.

    Fahrerassistenzsysteme

    Technologien in Autos, die Sprachbefehle für Navigation und Steuerung verwenden.

    Signup and view all the flashcards

    Sprachübersetzung

    Tools, die gesprochene Sprache in eine andere Sprache übersetzen, wie OpenAIs Whisper.

    Signup and view all the flashcards

    Lernsoftware

    Programme, die Sprache lernen mit Hilfe von Spracherkennung anbieten, wie Duolingo.

    Signup and view all the flashcards

    Multimedia-Daten

    Datenformate, die Audio und Video enthalten und durch Sprache durchsucht werden können.

    Signup and view all the flashcards

    Homebanking

    Ein virtueller Bankdienst, der Sprachbefehle für Transaktionen nutzt.

    Signup and view all the flashcards

    Vokalviereck

    Ein Diagramm zur Darstellung der deutschen Vokale und ihrer Position auf der Zunge.

    Signup and view all the flashcards

    Diphtonge

    Zwei Vokale, die zusammen in einer Silbe ausgesprochen werden und als ein Laut gelten.

    Signup and view all the flashcards

    Phonetik

    Die Wissenschaft, die sich mit den lautlichen Eigenschaften von Sprache befasst.

    Signup and view all the flashcards

    Pulmonische Konsonanten

    Konsonanten, die durch Luftstrom aus der Lunge erzeugt werden.

    Signup and view all the flashcards

    Stimmhafte vs. stimmlos

    Unterscheidung zwischen Lauten, die mit Vibration der Stimmbänder (stimmhaft) oder ohne (stimmlos) produziert werden.

    Signup and view all the flashcards

    Vokale

    Lautklassen, die den Luftstrom ungehindert durch den Mundraum leiten.

    Signup and view all the flashcards

    Alveolar

    Laute, die mit der Zunge gegen den Zahndamm gebildet werden, z.B. t, d.

    Signup and view all the flashcards

    Plosive

    Laute, die durch einen plötzlichen Luftstoß entstehen, z.B. p, b, t, d.

    Signup and view all the flashcards

    Nasale

    Laute, die durch die Nase erzeugt werden, z.B. m, n.

    Signup and view all the flashcards

    Frikative

    Laute, die durch Verengungen im Mundraum entstehen, z.B. f, s.

    Signup and view all the flashcards

    Laterale

    Laute mit seitlichem Luftstrom, z.B. l.

    Signup and view all the flashcards

    Halbvokale

    Laute, die eine Zwischenstellung zwischen Vokalen und Konsonanten einnehmen, z.B. j.

    Signup and view all the flashcards

    Zungen-Vertikallage

    Position der Zunge in vertikaler Richtung, z.B. i: oder u:.

    Signup and view all the flashcards

    Bilabial

    Laute, die mit beiden Lippen erzeugt werden, z.B. p, b.

    Signup and view all the flashcards

    Klicklaute

    Eine Art von nicht-pulmonischen Konsonanten, die durch einen schnappenden Klang entstehen.

    Signup and view all the flashcards

    Ejektive

    Konsonanten, die mit einem plötzlichen Druckanstieg produziert werden, ohne Luftversorgung aus der Lunge.

    Signup and view all the flashcards

    Implosive Konsonanten

    Konsonanten, die durch einen Luftdruck, der nach innen erzeugt wird, erzeugt werden.

    Signup and view all the flashcards

    Primärer Stress

    Der Hauptakzent eines Wortes, der am stärksten betont wird.

    Signup and view all the flashcards

    Diakritika

    Sonderzeichen, die zur Modifikation von Lautsymbolen dienen.

    Signup and view all the flashcards

    Sekundärer Stress

    Ein zusätzlicher Akzent, der schwächer als der primäre Stress ist.

    Signup and view all the flashcards

    Laute/Phone

    charakterisiert nach Entstehungsart und -ort Thema der Phonetik

    Signup and view all the flashcards

    Phonem

    Die kleinste bedeutungsunterscheidende Einheit einer spezifischen Sprache.

    Signup and view all the flashcards

    Minimalpaaranalyse

    Methode zur Bestimmung von Phonemen durch Analyse von Wörtern, die sich nur in einem Laut unterscheiden.

    Signup and view all the flashcards

    Separierende Vorgehensweise

    Eine Methode im europäischen Strukturalismus, die auf Minimalpaaranalyse basiert.

    Signup and view all the flashcards

    Komplementäre Distribution

    Wenn Laute in verschiedenen Kontexten nie zusammen auftreten und mind. eine Gemeinsamkeit haben, die sie von anderen Lauten unterscheidet werden somit zu einem Phonem kombiniert werden.

    Signup and view all the flashcards

    Amerikanischer Strukturalismus

    Ein Ansatz, der auf die Zusammenführung von Lauten in komplementärer Distribution abzielt.

    Signup and view all the flashcards

    Aspirated

    Laute, die mit einem starken Atemgeräusch verbunden sind, oft am Anfang von Silben.

    Signup and view all the flashcards

    Centralized

    Laute, bei denen die Artikulation zur Mitte des Mundes verschoben wird.

    Signup and view all the flashcards

    Palatalized

    Laute, die durch Kontakt der Zunge mit dem harten Gaumen entstehen.

    Signup and view all the flashcards

    Rhoticity

    Ein Merkmale von Lauten, bei denen das 'r' betont wird.

    Signup and view all the flashcards

    Syllabic

    Laute, die als Silbenkern fungieren und ein ganzes Wort bilden können.

    Signup and view all the flashcards

    Lungs

    The source of air for speech production.

    Signup and view all the flashcards

    Air

    Air from the lungs used for sound production.

    Signup and view all the flashcards

    Vocal cords

    Muscles that vibrate to create sound.

    Signup and view all the flashcards

    Periodic movement

    Back-and-forth motion of vocal cords for sound.

    Signup and view all the flashcards

    Fundamental tone

    The primary tone produced in the voice.

    Signup and view all the flashcards

    Periodic signal

    A regular and repeating signal from voiced sounds.

    Signup and view all the flashcards

    Vocal tract

    Pathway where sound is modified and shaped.

    Signup and view all the flashcards

    Airflow

    Movement of air from lungs towards vocal cords.

    Signup and view all the flashcards

    Vocal cord vibration

    Action of vocal cords that generates sound.

    Signup and view all the flashcards

    Signal generation

    Creation of sound signals through vocal cord movement.

    Signup and view all the flashcards

    Waveform

    Graphical representation of a sound's amplitude and time.

    Signup and view all the flashcards

    Frequency and period

    Inverse relationship where frequency determines sound pitch.

    Signup and view all the flashcards

    Articulation

    The physical production of particular speech sounds.

    Signup and view all the flashcards

    Sound quality

    Characteristics that distinguish different sounds.

    Signup and view all the flashcards

    Voiced speech

    Speech produced with vocal cord vibration.

    Signup and view all the flashcards

    Physiological model

    An approach to understanding speech based on physical functions.

    Signup and view all the flashcards

    Signal characteristics

    Features that define types of sound signals.

    Signup and view all the flashcards

    Dynamic control

    Adjustment of features like pitch and volume in speech.

    Signup and view all the flashcards

    Speech flow

    The smoothness and rhythm of spoken language.

    Signup and view all the flashcards

    Vocal function

    The roles played by different vocal components in speech.

    Signup and view all the flashcards

    Sound clarity

    The sharpness and distinctness of produced sounds.

    Signup and view all the flashcards

    Speech mechanics

    The physiological attributes involved in producing speech.

    Signup and view all the flashcards

    Echoes of speech

    Reflections or repetitions of sounds as they're produced.

    Signup and view all the flashcards

    Articulators

    Parts of the vocal tract that help form sounds.

    Signup and view all the flashcards

    Sound processing

    Manipulating sound waves to produce clear speech.

    Signup and view all the flashcards

    Velum

    The soft part of the roof of the mouth that aids in sound modulation.

    Signup and view all the flashcards

    Aktive Artikulatoren

    Bewegliche Teile des Sprachtrakts, die Sprachlaute formen.

    Signup and view all the flashcards

    Passive Artikulatoren

    Feste Teile des Sprachtrakts, die bei der Lautproduktion helfen.

    Signup and view all the flashcards

    Zungenspitze

    Die vorderste Spitze der Zunge, bedeutet wichtige Rolle bei Lauten.

    Signup and view all the flashcards

    Harter Gaumen

    Der feste Teil des Gaumens, wichtig für die Klangbildung.

    Signup and view all the flashcards

    Stimmbänder

    Muskelstränge, die vibrieren, um Laute zu erzeugen.

    Signup and view all the flashcards

    Periodische Bewegung

    Bezeichnet die Hin- und Herbewegung der Stimmbänder bei der Erzeugung von Lauten.

    Signup and view all the flashcards

    Fundamentaltöne

    Der Grundton ist der Hauptton der Stimme.

    Signup and view all the flashcards

    Vokaltrakt

    Der Vokaltrakt formt und verändert den Klang während der Sprachproduktion.

    Signup and view all the flashcards

    Luftstrom

    Die Bewegung der Luft von den Lungen zu den Stimmbändern.

    Signup and view all the flashcards

    Signalgebung

    Die Erzeugung von Klangsignalen durch die Bewegung der Stimmbänder.

    Signup and view all the flashcards

    Konsonantenklassifikation

    Die Einteilung von Konsonanten nach Artikulationsart und -ort.

    Signup and view all the flashcards

    Runde vs. Unrunde Vokale

    Vokale, die mit runden Lippen (gerundet) oder ohne (ungerundet) produziert werden.

    Signup and view all the flashcards

    Frontvokale

    Vokale, die mit einer Zungenposition im vorderen Mundraum ausgesprochen werden.

    Signup and view all the flashcards

    Rückvokale

    Vokale, die mit einer Zungenposition im hinteren Mundraum ausgesprochen werden.

    Signup and view all the flashcards

    Offen vs. Geschlossen

    Unterscheidung der Vokale basierend auf der Kieferöffnung und Zungenposition.

    Signup and view all the flashcards

    Nicht-pulmonische Konsonanten

    Konsonanten, die nicht durch den Luftdruck der Lunge erzeugt werden.

    Signup and view all the flashcards

    Signup and view all the flashcards

    Study Notes

    Organisatorisches

    • Motivation und Einführung
    • Spracherzeugung und Phonetik

    Grundlagen der automatischen Spracherkennung

    • Kapitel 1: Einführung

    Anwendungsgebiete der Spracherkennung

    • Praktikabel und lohnend
      • Smartphone-Steuerung/Websuche
      • Apples Siri (auch in Apple Vision Pro)
      • Google Assistant
      • Diktiersysteme (z.B. Dragon Naturally Speaking)
      • Fahrzeugelektronik
      • Fahrerassistenzsysteme
      • Navigation
      • Steuerung von Telefon/Multimediasystemen
      • Sprachübersetzung (z.B. Jibbigo)
        • OpenAls Whisper
        • CMUS Open-Source Whisper Alternative
      • Callcenter
      • Homebanking
      • Auskunftsysteme
      • Lernsoftware (z.B. Duolingo, Babbel)
      • Suche in Multimedia-Daten (z.B. zoom, Microsoft Teams)
      • Hausautomatisierung, Smart Speaker (z.B. Alexa/Amazon Echo, Google Home)
      • Python-Bibliothek SpeechRecognition
      • Spracherkennungs-Engines (z.B. Whisper, Microsoft, Google)
      • Chat-Mode von ChatGPT (als erstes Android-App)

    Warum ist Spracherkennung schwierig?

    • Intrasprechervariabilität: Variationen in der Aussprache eines Sprechers müssen berücksichtigt werden (z.B. unterschiedliche Betonung, Geschwindigkeit).
    • Intersprechervariabilität: Unterschiedliche Sprechstile zwischen verschiedenen Sprechern müssen identifiziert werden.
    • Verschleifungen: Große Datenmengen (Big Data) sind notwendig, um Spracherkennungssysteme zu trainieren und zu verbessern. Die Verwendung von probabilistischen Modellen wie dem Viterbi-Algorithmus und dynamischer Programmierung hilft, diese zu verbessern.
    • Akustische Störungen: Störungen wie Nachhall, Übertragungsfunktionen und Hintergrundgeräusche können die Genauigkeit der Spracherkennung beeinträchtigen. Techniken wie Filterung, Multi-Condition Training, inverse Filterung und Modelladaption sind erforderlich, um diese zu minimieren

    Themenüberblick

    • Signalanalyse/Merkmalsextraktion
      • Physiologie: Sprachwahrnehmung
      • Zeit-/Frequenzanalyse
      • Cepstralanalyse
      • Dimensionsreduktion
    • Spracherkennung
      • Physiologie: Spracherzeugung
      • Statistische und neuronale Klassifikation
      • Hidden-Markov-Modelle
      • Parameterschätzung/Modelltraining
      • Large-Vocabulary-Erkennung
      • Sprachmodelle

    Phonetik

    • Die artikulatorische Phonetik beschäftigt sich mit der menschlichen Spracherzeugung.

      • Einfaches Modell: Lunge, Stimmritze, Vokaltrakt (Signal)
    • Die Signalformung geschieht im Vokaltrakt mittels aktiver und passiver Artikulatoren.

      • aktive Artikulatoren: Unterlippe, Zungenrücken, Zungenspitze
      • passive Artikulatoren: Rest des Vokaltraktes, Hintere Alveolen, Zahndamm (Alveolen), Vordere Alveolen, Oberzähne, Oberlippe, Unterlippe, Unterzähne, Kiefer, Stimmbänder (Glottis), Nasenhöhle, harter Gaumen (Palatum), weicher Gaumen (Velum), Nasengang, Zäpfchen (Uvulum), hintere Zunge, mittlere Zunge, Zungenrücken, Zungenspitze.
    • Unterscheidung von Konsonanten und Vokalen

      • Konsonanten: Stimmlose Anregung, Abstrahlung über oder Engstellen im Vokaltrakt.
      • Vokale: Stimmhaft angeregt, über den Mund abgegeben, keine Engstellen.
    • Klassifizierung von Konsonanten (z.B. nach Artikulationsart und Artikulationsort)

      • Beispiel: Plosive, Nasale, Frikative
    • Vokalklassifizierung (z.B. nach Zungenhöhe, -stellung, Lippenrundung)

    • Vokalviereck (Visualisierung)

    Phone vs. Phoneme

    • Phone (Laute): Charakterisiert nach Entstehungsart und Ort, Thema der Phonetik.
    • Phoneme: Kleinste bedeutungsunterscheidende Einheit einer Sprache, Thema der Linguistik.

    Festlegung der Phoneme einer Sprache

    • Europäischer Strukturalismus: Minimalpaaranalyse
      • Definition Minimalpaar: Wörter unterscheiden sich nur durch einen Laut (z.B. Schiff/schief)
      • Verfahren: 1) Minimalpaare finden, 2) Laute identifizieren die die Minimalpaare unterscheiden, welche separate Phoneme bilden.
    • Amerikanischer Strukturalismus: Zusammenfügende Vorgehensweise
      • Verfahren: 1) Sprache mit potentiellen Phonem-Set starten, 2) Laute mit komplementärer Distribution und Gemeinsamkeit zu Phonemen zusammenfügen.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Related Documents

    Description

    Dieses Quiz bietet einen Überblick über die Grundlagen der automatischen Spracherkennung, einschließlich der Motivation, Einführung und der Anwendungsgebiete. Erfahren Sie mehr über verschiedene Technologien wie Siri, Google Assistant und ihre Anwendungen in der täglichen Nutzung.

    Use Quizgecko on...
    Browser
    Browser