Analyse Acoustique de la Parole (CM1)
Document Details
Uploaded by ProtectiveHydra
Faculté de Médecine Sorbonne Université
Mme Fourgeron
Tags
Related
Summary
Ce document est un cours sur l'analyse acoustique de la parole, y compris les aspects segmentaux et la phonétique clinique. Il décrit pourquoi cette analyse est utile pour le diagnostic et l'évaluation des troubles de la parole et explique les différentes méthodes utilisées, avec des références aux cours complémentaires.
Full Transcript
Mme Fourgeron CM 1 : 24/09 SDL Analyse acoustique de la parole (normal vs pathologique) Aspects segmentaux visibles sur le signal Phonétique clinique ou connaissance phonétique appli...
Mme Fourgeron CM 1 : 24/09 SDL Analyse acoustique de la parole (normal vs pathologique) Aspects segmentaux visibles sur le signal Phonétique clinique ou connaissance phonétique appliquée à la clinique : Pourquoi ? Le clinicien est face à une production de parole/voix potentiellement ‘atypique’ (’pathologique’, ’anormale’, ‘déviante’…) ‘atypique’? -- en quoi? comment? Pourquoi? => nécessité de pouvoir qualifier et quantifier les caractéristiques déviantes de la parole/voix Utile pour : Le diagnostique et l’évaluation des troubles de parole, leur sévérité, leurs conséquences potentielles sur la communication et la qualité de vie de possibles indices sur l’origine des troubles Le suivi : identification de marqueurs/indices pour suivre l’évolution d’un trouble et/ou pour l’évaluation d’un traitement médicamenteux ou d’une thérapie (+ marqueurs précoces) Comment ? Face au besoin de qualifier et quantifier les caractéristiques déviantes de la parole/voix : Apports de la phonétique clinique => Des connaissances sur la parole normale et les mécanismes de production/perception => Une formation à l’utilisation d’outils et à des méthodes rigoureuses et normées (et scientifiquement validées) Des méthodes variées (et complémentaires) Évaluation perceptive (‘gold standard’, cf CM SB & TD) Évaluation acoustique Évaluation articulatoire 1. L’analyse acoustique A. intérêts Elle permet une évaluation objective, quantifiable et reproductible. non-invasive Permet de quantifier ce que l’oreille ne peut pas entendre et/ou ce qui contribue à l’aspect déviant perçu 1 Mme Fourgeron CM 1 : 24/09 (ex: impression perceptive d’une lenteur du débit de parole, peut être liée à l’allongement des sons (lenteurs des articulateurs??) ou à l’augmentation des pauses (difficultés de planification du discours?) difficilement dissociable à l’oreille => intéressant de faire la distinction…) >> La complémentarité des approches B. Inconvénients Analyse coûteuse en temps et en expertise L’identification de mesures acoustiques pertinentes pour quantifier ce qu’on entend/voit et discriminantes par rapport à de la variation normale n’est pas simple… 2. Qu’est-ce qu’on entend par parole ‘atypique’ Les ‘déviances’/’altérations’ mesurables sur le signal acoustique peuvent être : liées à des déficits qui peuvent apparaître à différents niveaux (= troubles d’origines diverses) et donc toucher divers dimensions/aspects de la parole Production de la parole (rappel) : de la conception du message à sa forme sonore articulée : En sortie : Multiples actions à différents niveaux de l’appareil de production (respiratoire, phonatoire, …) qui doivent être exécutées avec précision, rapidité, flexibilité et pour un but acoustique/aérodynamique précis 2 Mme Fourgeron CM 1 : 24/09 Préparation conceptuelle Formulation : - Sélection lexicale (lèmme = sens et propriété syntaxique) - Encodage de la forme morphologique - Encodage des propriétés phonologique (nb phonèmes, syllabation,…) - Encodage des propriétés phonétiques (ex. cibles articulatoires) Articulation (de la cible à produire au mouvement des articulateurs pour le produire) encodage du programme moteur (paramétrisation des mouvements) exécution du programme (envoi des commandes aux muscles) Des aspects qui peuvent donc être liées à des déficits d’origines diverses et qui touchent des fonctions diverses : traitement cognitif (pré-moteur) neurologiques (ex. contrôle des mouvements et de la posture, transmission des informations aux muscles...) physiologiques (ex. atteinte d’un organe) : fonctionement supra-laryngé (vélopharyngé et oro-facial) fonctionement laryngé fonction respiratiratoire et coordination entre les différentes fonctions (ex. contrôle pneumo- phonatoire, coordination entre gestes laryngés et supralaryngés) 3 Mme Fourgeron CM 1 : 24/09 Et qui vont donc toucher des aspects/dimensions de la voix/parole très variés qu’il faudra prendre en compte dans l’analyse : Activité 1 - écoute : => Exemples de parole atypique, d’origines diverses => diversités des dimensions/aspects de la parole qui peuvent être altérées évaluation perceptive d’aspects/dimensions de la parole qui vous paraissent altérées Enregistrement 1 : Troubles liés à la planification/programmation de la parole (≠ exécution) : l ’apraxie de la parole - altération de la capacité à générer un programme moteur, à assembler des séquences de mouvements appropriés, et à les exécuter dans un ordre sériel adéquat 4 Mme Fourgeron CM 1 : 24/09 Enregistrement 2 : Troubles de l’exécution liés à des atteintes périphériques (vs. Neurologiques) : - Patholohie malformative - Après chirurgie d’exérèse Ex : glossectomie partielle Enregistrement 3 : trauma crânien Enregistrement 4 : Nieman PickC (composante cérébelleuse) Des troubles de l’exécution liés à des atteintes neurologiques : - la (les) dysarthrie(s) « […] trouble de la réalisation motrice de la parole, secondaire à des lésions du système nerveux central ou périphérique. […] » (P. Auzou 2007) Symptôme présent dans de nombreuses pathologies, ex: traumatismes crâniens, les accidents vasculaires cérébraux, la sclérose en plaques, les processus dégénératifs (maladie de Parkinson, SLA, maladie de Friedreich…) Sous des formes très variables selon le type d’atteinte Des troubles très variés dans la dysarthrie : Car différents aspects moteurs et sensoriels du mécanisme de parole peuvent être affectés, pouvant donner de la faiblesse de la lenteur de l’incoordination de la réduction de l’amplitude des mouvements de l’altération du tonus musculaire, de la rigidité, de la paralysie, des spasmes… Chacun ayant des conséquences sur les gestes de parole qui seront différents De + : grande variabilité inter- et intra individuelle due à idiosyncrasies, sévérité des atteintes, particularité des atteintes en fonction des locuteurs, stratégies de compensation, suivi orthophonique… Enregistrements 5a et 5b : Patient atteint de SLA : comparaison à un an d’écart Classification des dysarthries: 5 Mme Fourgeron CM 1 : 24/09 3. Quelles informations tier du signal acoustique/spectrogramme ? Acoustique = l’observable la conséquence/le résultat en bout de chaine d’un processus très complexe et multi-niveaux => d’où complexité dans l’interprétation sur l’origine des altérations observées. Mise en oeuvre de l’analyse acoustique : Quel type d’approche : deux types d’analyse peut être mises en oeuvre : quantitative vs. qualitative (descriptive) d’évènements acoustiques caractérisés comme déviants Dimensionnalité de l’analyse : index acoustique isolé vs. analyse multiparamétrique Fenêtre d’analyse : paramètres globaux sur des unités larges (ex. débit, étendue de f0 sur phrases, texte…) paramètres locaux sur des événements acoustiques particuliers (ex. dévoisement pendant tenue, formants au milieu d’une voyelle…) La granularité de l’analyse acoustique et des paramètres choisis vont dépendre : L’objectif (clinique, recherche) :est-ce l’observation d’un cas (comparaison à une norme)est-ce qu’on compare plusieurs locuteurs/groupes (statistic power) Ressources (temps, expertise et matériel d’analyse) L’ interprétation/sens recherché : Paramètres testant le fonctionnement d’un composant du système de production ex. fonctionnement laryngé => ex. jitter, hnr, écart type de f0 Paramètres testant le fonctionnement linguistique/intelligibilité Ex 1 : chez un pa/ent qui n’a plus de larynx (pas de PV = pas de vibra/ons). Il va mère en place des choses pour pouvoir maintenir les consonnes sourdes et sonores. On regardera donc la périodicité/barre de voisement pendant la tenue des consonnes. Ex 2 : différence entre question et affirmation => modulation de f0 6 Mme Fourgeron CM 1 : 24/09 Nb: nombreux paramètres apportent des informations à plusieurs niveaux : f0/périodicité du signal = contraste de voisement, fonctionnement laryngé, fonctions prosodiques I. Présentation de quelques paramètres acoustiques ‘relativement faciles’ à observer/quantifier A. Aspects lié à la voix Altération sur phonation, qualité vocale (système laryngé) :Mesures de f0 et d’intensité :moyenne, max-min-plage, stabilité (std dev) => fonction laryngée anormale, flexibilité et contrôle de la fonction laryngée dans le temps Mesures de perturbations: variabilité de la f0 et de l’intensité A court terme (cycle à cycle): jitter & shimmer => variation du patron vibratoire et instabilité des cycles À long terme (sur plusieurs cycle, sur une voyelle…): coef de variation de f0 et intensité => stabilité/variabilité à long terme (ex. tremor) Mesures de bruit : harmonic to noise ratio (dB) => turbulences apériodiques ds le signal (ratio de l’énergie total du signal sur l’énergie de la composante apériodique) B. Aspects segmentaux Ces aspects nous permettent de caractériser des altérations/imprécisions dans l’articulation des sons de la parole :De justesse/précisions des articulations (laryngées et supra-laryngées/orale et nasale)De coordination dans les gestes arOculatoire D’organisation temporelle entre les sons successifs dans la chaîne parlée. => 2 dimensions principales pour caractériser les événements de la parole : le temps et l’espace articulatoire Rappel : parler = planifier, paramétrer et exécuter une série de mouvements articulatoires dans le temps et l’espace (cibles) A. Gestion d’un mouvement articulatoire dans l’espace articulatoire pour atteindre la bonne cible et être précis B. Mais aussi dans le temps : initier le mouvement, durée du déplacement vers la 7 Mme Fourgeron CM 1 : 24/09 cible, stabilisation en position cible, déplacement vers autre cible, cessation du mouvement. => La gestion de l’orchestration temporelle des mouvements est indispensable : pour coordonner entre des articulateurs convoqués pour la production d’un son (ex : lèvres et corps de la langue pour /u/) et pour atteindre des cibles successives (ex : corps de la langue pour /i/ puis /a/) La coordination entre les différents gestes articulatoires est propre à chaque langue ex. anglais vs. français En anglais ‘palm’ [phãm] : (a) aspiration au relâchement du /p/ en anglais crée par la non synchronisation du relâchement de l’occlusion labiale et la fermeture glottale (la glotte est encore ouverte quand les lèvres s’ouvrent => bruit de friction glottale) (b) nasalisation de la voyelle /a/ en anglais due à une non synchronisation entre l’ouverture du port vélopahryngés pour /m/ par rapport à la fermeture des lèvres => nasalisation du /a/ ue a l’anticipation de l’ouverture des cavité nasales Que regarder pour quantifier des problèmes de voisement : => Un trouble à ce niveau est soit un dévoisement (partiel ou total) de sons voisés, soit un voisement (partiel ou total) de sons sourds. Présence/absence de périodicité du signal (ou barre de voisement) pendant la tenue de 8 Mme Fourgeron CM 1 : 24/09 la consonne (ou voyelle) Mesures disponibles sur Praat : voice report/voicing/porOon of unvoiced frame, voice breaks Indices secondaires du contraste de voisement : durée de la V précédant une voisée + longue que devant une sourde Cf travaux de L Baqué en aphasie à préservation ou non des indices secondaires de voisement pour des C /b,d,g/ produites sans périodicité. Cherche à diagnostiquer trouble phonétique (réalisation du voisement) vs. trouble phonologique (mauvaise sélection de consonne). Elle a révolutionné la littérature de l’aphasie avec ses dé Couvertes Que regarder pour quantifier des problèmes de réalisation phonétique des cibles : 1. Altération du «mode d’articulation» des consonnes : Ex mode : pour une occlusive incapacité à bloquer complètement et rapidement le flux d’air et/ou de relâcher la pression intra-orale rapidement à perte du caractère occlusif d’une occlusive : désocclusion/occlusion incomplète. Spirantisation = si devient spirante (= approximante) = une consonne produite par un rapprochement modérés des organes phonateurs qui ne va pas jusqu’à produire le bruit caractéristique de friction : semi-consonne et liquides (/l/ et /R/)Assibilation = si devient fricaOve Vocalisation = si devient une voyelle Caractéristiques spectrales pendant la tenue ou le relâchement de la consonne : Distribution/concentration de l’énergie dans certaines zones de fréquences Type de signal présent : silence (ou absence de silence), signal périodique ou apériodique 9 Mme Fourgeron CM 1 : 24/09 Les glossectomies suivantes sont des exemples. La 1ère patiente ne peut plus former l’occlusion du [d] et on voit qu'il n'y a pas de silence entre les deux [a]. Il y a du voisement mais pas de silence avec du bruit dans des fréquences où il ne devrait rien y avoir. Des [k] semblent à l’oreille assez corrects, mais en regardant le spectrogramme on voit qu’il y a du bruit. Ici, on a un [ʃ] schlintant avec du bruit en basse fréquence trop important, il ne devrait plus avoir de bruit. En dessous, le bruit du [ʃ] n’est pas concentré dans la zone où on l’attend, il n’est pas assez localisé : ce n’est pas la bonne concentra/on de fréquence. Fricatives : /ch/ schlintant + trop de bruit en basse fréquence. Activité 2 : Travail sur Praat : Quels indices acoustique sur les signaux/spectro vous permettrait de décrire les altérations de la prononciation suivantes ? 1er enregistrement : « âgé » : entre la fin du /a/ et le /e/, on a une période de silence avant le /g/ sans voisement : occlusion puis /g/ (un relâchement) 2ème enregistrement : « à réparer » : il manque une période de silence et un relâchement (burst) pour le /p/ mais il y a une périodicité tout du long pas de silence = 10 Mme Fourgeron CM 1 : 24/09 désocclusion 3ème enregistrement : « des chaussures » : /s/ : barre de voisement + bruit dans les basses fréquences (et non à partir de 4000Hz), c’est donc un /s/ instable. Les plis vocaux vibrent à la place d’une friction. Il y a un manque de contrôle dans l’articulation. 2. Altération de l’articulation des voyelles Les caractéristiques spectrales des voyelles (aussi appelées le timbre des voyelles ≠ timbre de la voix) en les comparant avec ceux d’une population contrôle où avec les caractéristiques connues des voyelles Mesure des formants Mesure de l’espace vocalique pour quantifier :Si l’altération d’une dimension particulière, Si la neutralisation ou la perte de contrastes phonologiques Ici l’espace vocalique « normal » d’un témoin. On voit F1 en ordonnées et F2 en abscisses. L’ellipse ovale correspond à la dispersion des différents exemplaires de chaque phonème. On voit qu’il y a de la variabilité notamment sur le /o/, les femmes ont un espace vocalique de + grande taille généralement. Grâce à l’espace vocalique, on peut regarder : Si les cibles sont stables (par exemple un phonème est-il toujours prononcé à peu près de la même façon ?) Si les contrastes entre les phonèmes sont conservés Quels formants semblent poser problème (plutôt F1 ou F2 ?) : cela peut donner des indications sur l’origine du problème articulatoire (par ex F2 est influencé par position de la langue et par l’arrondissement des lèvres). 11 Mme Fourgeron CM 1 : 24/09 Exemple d’étude sur les dysarthries (voir diapo) 3. Altérations liés a un problème d’orchestration temporelle des gestes articulatoires Ex.1 coordination entre gestes laryngés et supralaryngés En français: Etat de la glotte en début de mot? Initiation/cessation du voisement? Organisation temporelle dans séquence /di/, /ti/? VOT ‘voice onset time’ = délai d’établissement du voisement. [CV]=durée de l’intervalle entre relâchement supraglottique de la constriction consonantique et l’apparition du voisement (ou de la structure formantique) de la V suivante. VTT ‘voice termination time’ = délais de cessation du voisement[VC]=durée de l’intervalle entre disparition de la structure formantique de V (= disparition provoquée par l’occlusion supraglottique de la consonne) à l’arrêt du voisement dans la phase consonantique. Exemple 2 : problème au niveau du relâchement (burst) des occlusives Présence/absence de relâchement Qualité du relâchement (net, avec aspiration, friction, palatalisation…) au niveau spectral : bruit, périodicité, à quelle fréquence… Au niveau temporel : long, court 12 Mme Fourgeron CM 1 : 24/09 Ne pas confondre Affrication et Aspiration : L’aspiration : bruit ou souffle d’origine glottale qu'on peut entendre au moment du relâchement des consonnes occlusives (entre l’explosion et la voyelle) ou pendant la réalisation des constrictives /S Z/. Pour indiquer la réalisation aspirée, on utilise le symbole [ h ] placé en exposant à droite de la consonne. Il résulte d’un retard des plis vocaux (après l'émission de la consonne sourde) à se refermer pour émettre la voyelle. Il est noté à l'aide du signe diacritique [ʰ]. Il accompagne parfois une consonne voisée. Il se note alors [ʱ]. ex : [dʱ] Exemple 3 problème de nasalisation : (coordination et/ou altération de la fonction vélo-pharyngé) pré ou post-nasalisation, nasalisation pendant la tenue Altération de la fonction vélopharyngée : => ici présenté au niveau segmental mais pourrait aussi être considéré comme un aspect supra-segmental !difficile à mesurer/quantifier acoustiquement ! (articulatoire mieux) Shifts des fréquences de formants, réduction amplitude des formants, augmentation des largeurs de bandes, apparition d’antiformants et formants nasals Altérations liées au manque de stabilité dans l’articulation pendant la tenue de la 13 Mme Fourgeron CM 1 : 24/09 cible ou au passage/transition de cible à cible Observation de l’évolution des indices spectraux dans le temps Observation de l’évolution des formants dans le temps pendant la tenue = diphtongaison observation des transitions de voyelle à consonnes ou consonnes à voyelle : transitions trop lentes, trop rapide, inexistantes... 14