Cours 3 : Traitement Lexical et Modèles du Langage PDF
Document Details
Uploaded by EarnestDysprosium
Tags
Summary
Ce document présente les différentes étapes du traitement lexical, en particulier la lexicalisation, et les différents modèles de la production du langage, tels que les modèles sériels, en cascade et interactifs. L'analyse met en lumière le processus d'activation des informations morphologiques, phonologiques et sémantiques dans le cerveau. Des exemples et des preuves empiriques sont utilisés pour soutenir les différents modèles.
Full Transcript
[ UE301 EC1 / Cours 3 / 22-10] [2.5.1) Les principales étapes de traitement : la lexicalisation] Consensus sur les deux étapes d'encodages de la lexicalisation. Les deux étapes d'encodage morphophonologique et sémantique-syntaxique seraient dépendantes mais interconnectés. (Principe du mot sur l...
[ UE301 EC1 / Cours 3 / 22-10] [2.5.1) Les principales étapes de traitement : la lexicalisation] Consensus sur les deux étapes d'encodages de la lexicalisation. Les deux étapes d'encodage morphophonologique et sémantique-syntaxique seraient dépendantes mais interconnectés. (Principe du mot sur le bout de la langue qui ne peut pas sortir le son) [2.5.2) La notion de lexique mental ] Le lexique mental est une métaphore pour désigner un composant de traitement qui permet d'encoder et d'accéder aux connaissances lexicales qui vont être nécessaire à l'utilisation approprié d'une langue. Pour ce qui concerne nos deux modèles de représentations, le lexique mental va principalement être sollicité par les deux sous étapes d'encodage syntaxique-sémantique et d'encodage morphophonologique On a des sous unités dans les différents systèmes de représentations qui entrainent des activations. Dans le système sémantique : associations libres (mot qui nous rappelle d'autres mots selon les expériences et les connaissances / ex : animal peut rappeler le froid), des co-occurrence (connexion qui montrent que certains mots apparaissent souvent ensemble), partage de caractéristiques (mots qui ont des connexions sémantiques / appartienne à la même catégorie). Ce système sémantique prends en compte un certain nombre de caractéristiques. Système morphophonologique : Système qui organise ses mots en fonction de la similitude des mots et la structures (morphologie). Et également les connexions relient les mots qui diffèrent par un phonème ou un morphème L'ensemble des activations dans les deux systèmes, vont permettre de récupérer un mot soit le lexique mental. Ce réseau montre comment les mots sont interconnectés à plusieurs niveaux dans notre conscience. Montre comment le cerveau arrive à récupérer l'information. ![](media/image2.png)[2.6) Les différents modèles de la production du langage ] Modèle sériel : d'abord sémantique puis phonologique Modèle en cascade : un peu de sémantique, phonologie, sémantique... Les deux activés ensemble en même temps Modèle interactif : les deux en mêmes temps mais parfois un des deux dis qu'il importe plus [2.6.1) Historique des modèles ] Les études de la production de la parole ont connu un regain d'intérêt en 1960 avec la psycholinguistique (Interaction langage et système cognitif) On considère que deux anciennes traditions cohabitent avant 1960: - Approche par l'analyse des erreurs de locution - Approche par la chronométrie mentale [2.6.1.1) Analyse des erreurs de locution] En 1895, Meringer et Mayer ont publié un corpus substantiel d'erreurs de la parole allemandes Ils distinguent plusieurs types d'erreurs : - Erreur de sens (le mien pour le sien) - Erreurs de forme (le violeur s'est échappé pour le voleur s'est échappé) - Erreurs de substitution (paf pour piaf) - Erreurs d'échange (dussèche pour duchesse) - Erreurs d'anticipation (c'est mon tada le tennis pour c'est mon dada le tennis) - Erreurs de mélange (bonjoir pour boujour-bonsoir) Plusieurs autres corpus de langues apparaissent notamment celui en français par Rossi et Peter-Defare [2.6.1.2) La chronométrie mentale ] En 1885, J.M Cattell fait une distinction entre le nommage d'une liste de dessins d'objets et la lecture de mots : 2 fois plus de temps pour nommer une liste de 100 dessins que pour lire ces mêmes long. Nommage d'images \< lecture de mot Ces tâches réduisaient l'accès à des codes différents (dessin/orthographe). L'opinion dominante c'est qu'il existe une voie directe d'accès au mot, à son code phonologique. Alors que le dessin on doit d'abord passer par le concept qui provoquera une activation des codes sémantiques puis phonologiques. [2.6.2) Modèle sériel :] Pour les modèles sériels l'étape de lexicalisation s'effectue en 2 étapes qui se suivent : - Encodage des informations sémantiques et syntaxiques - Encodage des informations morphologiques et phonologiques Hiérarchie de modèles, d'abord un module puis l'autre. Description des étapes : - Préparation conceptuelle : « les routes sont belles » 1. Encodage sémantique : « les », « routes », « sont », « belles » 2. Encodage phonologique : /le/, [Modèle en cascade :] Pour les modèles en cascade, l'étape de lexicalisation s'effectue en 2 étapes qui se chevauchent : - Encodage des informations sémantiques et syntaxiques - Encodage des informations morphologiques et phonologiques Avec ce modèle, toutes les infos sont activées en même temps Description des étapes : - Préparation conceptuelle : « les routes sont belles » 3. Encodage sémantique : « les routes » 4. Encodage phonologique : /le rut/... [ 2.6.3) Preuves en faveur des modèles en cascade ] **Prédiction sérielle** : l'activation phonologiques est tardive. Elle ne se produit que pour un seul nom, car cette activation dépend directement de la sélection sémantique **Prédiction en cascade** : l'activation phonologique est précoce. L'activation se produit pour plusieurs noms à la fois. La sélection définitive du mot à prononcer peut s'effectuer assez tardivement. \*Sérielle : A la présentation d'une image, le processus de lexicalisation se fait dans un ordre strict. Le nom est sélectionné à la sous étape sémantique et produit un seul nom au niveau phonologique. Effet important pour les noms dominants qui sont activés en sémantique et phonologique mais réduis pour les noms secondaires. \*Cascade : activation du nom dominant et secondaire qui s'activent en même temps. Plusieurs candidats lexicaux activés en même temps. A un certain moment on considère, que le nom dominant continuera à être nommé mais le secondaire non. [Exemple :] ![](media/image4.png)Nommer tous les noms dominants (image ours, chaussure, porte) mais quelque fois il y a un mot juste après l'image et il faut nommer le mot. (car l'image à en réalité deux noms) Pour vérifier que le mot secondaire est dans le cerveau on doit choisir une méthode détournée : On a choisis des mots qui sont proches phonologiques mais qui n'ont pas du tout le même sens que l'image. Les résultats montrent les mêmes courbes : activation du mot dominant et secondaire se poursuit jusqu'à 400ms et ensuite le nom dominant prend le lead. **Résumé des résultats :** L'activation simultanée des noms dominants et secondaires, mesurée par la reconnaissance plus rapide des voisins phonologiques par rapport aux noms controles, confirme que plusieurs candidats lexicaux sont activés au niveau phonologique avant la sélection finale d'un mot. Le traitement phonologique peut s'activer durant la sélection sémantique. Cette étude apporte des preuves en faveur des modèles en cascade de la production de la parole. Maintenant validation du système en cascade mais aussi activation de toute part à l'intérieur des systèmes et entre les systèmes. [2.6.4) Vers une vision interactive ] Les modèles de production de la parole sont désormais tournés vers une vision plutôt interactive. Ce dernier changement a été amorcé car les modèles en cascade ne suffisaient plus pour expliquer deux phénomènes : - L'effet de biais lexical ; lorsqu'une erreur phonologique se produit, elle aboutit souvent à un mot existant dans la langue qu'à un non-mot. Par exemple, si un locuteur fait une inversion de phonèmes, il est plus probable que l'erreur produise un mot réel - Les erreurs mixtes : ce sont des erreurs où le mot produit par erreur est à la fois phonologiquement et sémantiquement similaire au mot cible. Exemple : \*Il confie les Français (au lieu de : il convie les Français) \*Il y a des tueurs d'élites sur les toits (au lieu de : il y a des tireurs d'élites (même catégorie sémantique avec les armes) [2.6.5) Les modèles interactifs de la lexicalisation ] Pour les modèles interactifs l'étape de lexicalisation s'effectue en deux étapes qui peuvent se chevaucher en cascade mais qui peuvent également s'influence mutuellement : - Encodage des informations sémantiques et syntaxiques - Encodage des informations morphologiques et phonologiques Ici les deux niveaux communiquent en permanence. Description des étapes : - Préparation conceptuelle : « les routes sont belles » 5. Encodage sémantique : « les » \[...\] « routes » « ... » 6. Encodage phonologique : /le/ \[...\] /rut/ /vut/ [2.6.6) Conclusion sur les modèles ] Modèle interactif est dominant de nos jours. Modèle sériel : processus strictement linéaire, chaque étape se finis avant que l'autre commence. Première étape : concept, deuxième étape : lexicalisation (avec 2 encodages) Modèle en cascade : processus commence de la même manière mais sous étapes peuvent se chevaucher. Pas la possibilité de revenir en arrière dans ce modèle. Coexistence de plusieurs représentations phonologiques tardivement. Modèle interactif : différents niveaux interagissent de manière continue et s'influence mutuellement. Expliquer deux phénomènes : erreurs mixtes et les effets de biais lexical.