TD CLAN SDL PDF
Document Details
![HighSpiritedSweetPea](https://quizgecko.com/images/avatars/avatar-17.webp)
Uploaded by HighSpiritedSweetPea
Université Sorbonne Nouvelle
Caroline MASSON
Tags
Summary
This document appears to be lecture notes or study material on language acquisition, possibly focusing on the use of CLAN software for analyzing child language. It includes examples of child language data and discussions of concepts like spontaneous language, testing methods, and transcription conventions.
Full Transcript
UE 1.1.4 MESURER LE LANGAGE SPONTANÉ INITIATION AU LOGICIEL CLAN Caroline MASSON, MCF, Université Sorbonne Nouvelle [email protected] Madeleine 2 ans 7 mois *CHI: mais maman moi z@fs a qu' à prendre en photo. %pho: me mamɑ̃ mwa z a k a pʁɑ̃d ɑ̃ fot...
UE 1.1.4 MESURER LE LANGAGE SPONTANÉ INITIATION AU LOGICIEL CLAN Caroline MASSON, MCF, Université Sorbonne Nouvelle [email protected] Madeleine 2 ans 7 mois *CHI: mais maman moi z@fs a qu' à prendre en photo. %pho: me mamɑ̃ mwa z a k a pʁɑ̃d ɑ̃ foto *MOT: tu veux prendre qui en photo ? *CHI: ah hum tu peux aller chercher mon appareil+photo. %pho: a œm ty pø ale ʃɛʁʃe mɔ̃n aparɛjfoto %act: CHI s'avance vers MOT *CHI: [>] mon appareil+photo. %pho: ty pø ale ʃɛʁʃɛ mɔ̃n aparɛjfoto %act: CHI s'avance vers OBS *MOT: ]. %pho: ə vɛ ale lə ʃɛʁʃɛ *OBS: allez on va le chercher. *CHI: mais maman moi z@fs a qu' à prendre en photo. %pho: me mamɑ̃ mwa z a k a pʁɑ̃d ɑ̃ foto *MOT: tu veux prendre qui en photo ? *CHI: ah hum tu peux aller chercher mon appareil+photo. %pho: a œm ty pø ale ʃɛʁʃe mɔ̃n aparɛjfoto %act: CHI s'avance vers MOT *CHI: [>] mon appareil+photo. %pho: ty pø ale ʃɛʁʃɛ mɔ̃n aparɛjfoto %act: CHI s'avance vers OBS *MOT: ]. %pho: ə vɛ ale lə ʃɛʁʃɛ *OBS: allez on va le chercher. *CHI: mais maman moi z@fs a qu' à prendre en photo. %pho: me mamɑ̃ mwa z a k a pʁɑ̃d ɑ̃ foto *MOT: tu veux prendre qui en photo ? *CHI: ah hum tu peux aller chercher mon appareil+photo. %pho: a œm ty pø ale ʃɛʁʃe mɔ̃n aparɛjfoto %act: CHI s'avance vers MOT *CHI: [>] mon appareil+photo. %pho: ty pø ale ʃɛʁʃɛ mɔ̃n aparɛjfoto %act: CHI s'avance vers OBS *MOT: ]. %pho: ə vɛ ale lə ʃɛʁʃɛ *OBS: allez on va le chercher. *CHI: mais maman moi z@fs a qu' à prendre en photo. %pho: me mamɑ̃ mwa z a k a pʁɑ̃d ɑ̃ foto *MOT: tu veux prendre qui en photo ? *CHI: ah hum tu peux aller chercher mon appareil+photo. %pho: a œm ty pø ale ʃɛʁʃe mɔ̃n aparɛjfoto %act: CHI s'avance vers MOT *CHI: [>] mon appareil+photo. %pho: ty pø ale ʃɛʁʃɛ mɔ̃n aparɛjfoto %act: CHI s'avance vers OBS *MOT: ]. %pho: ə vɛ ale lə ʃɛʁʃɛ *OBS: allez on va le chercher. *CHI: mais maman moi z@fs a qu' à prendre en photo. %pho: me mamɑ̃ mwa z a k a pʁɑ̃d ɑ̃ foto *MOT: tu veux prendre qui en photo ? *CHI: ah hum tu peux aller chercher mon appareil+photo. %pho: a œm ty pø ale ʃɛʁʃe mɔ̃n aparɛjfoto %act: CHI s'avance vers MOT *CHI: [>] mon appareil+photo. %pho: ty pø ale ʃɛʁʃɛ mɔ̃n aparɛjfoto %act: CHI s'avance vers OBS *MOT: ]. %pho: ə vɛ ale lə ʃɛʁʃɛ *OBS: allez on va le chercher. *CHI: mais maman moi z@fs a qu' à prendre en photo. %pho: me mamɑ̃ mwa z a k a pʁɑ̃d ɑ̃ foto *MOT: tu veux prendre qui en photo ? *CHI: ah hum tu peux aller chercher mon appareil+photo. %pho: a œm ty pø ale ʃɛʁʃe mɔ̃n aparɛjfoto %act: CHI s'avance vers MOT *CHI: [>] mon appareil+photo. %pho: ty pø ale ʃɛʁʃɛ mɔ̃n aparɛjfoto %act: CHI s'avance vers OBS *MOT: ]. %pho: ə vɛ ale lə ʃɛʁʃɛ *OBS: allez on va le chercher. Ahmed, 6 ans *CHI: euh petit homme +… %pho: œ pœti ɔm *CHI: avec ͂ɛ@fs chien +… %pho: avɛk ɛ͂ sjɛ͂ *CHI: avec une grenouille +… %pho: avɛk yn gʁənuj *CHI: et avec un oiseau. %pho: e avɛk ɛ͂ wazo *ADU: et puis dehors il fait (.) don(c). *CHI: nuit +... %phoː nwi *ADU: il fait nuit et y+a la +/. *CHI: ++ lune. %pho: lyn *ADU: la lune brille hum ? *CHI: bri(lle). %pho: bʁi EVALUER LES COMPÉTENCES LANGAGIÈRES Evaluer les compétences langagières Epreuves Combinaison Recueil de données contrôlées épreuves/données en situation naturelles écologique CORPUS ORAUX Evolution des approches Adaptation des méthodes aux enjeux Corpus oraux en acquisition : pour quoi faire ? 1. Analyser les étapes de développement du langage de l’enfant 2. Etudier l’input 3. Questionner les processus d’acquisition en interaction Analyser les étapes du développement langagier Langage spontané vs. induit Situations de production non contrôlée vs. situations expérimentales Pas uniquement situations informelles Exemple: contexte orthophonique Productions semi-dirigées Et un contexte naturel (Semi)-spontané: situation où les productions verbales ne sont pas totalement induites et provoquées => liberté créative (de Weck, 2003) Intérêt des données de langage spontané Accéder aux compétences linguistiques des enfants (Le Normand & Clouard, 2014) S’intéresser à l’ensemble des niveaux linguistiques Pour l’étude des pathologies : Observer les stratégies d’évitement (Tuller et al, 2012) Apprécier l’évolution de compétences (da Silva, 2015) Dépasser le cadre acquis/non acquis Intérêt des données de langage spontané Produire du langage hors contexte = vision partielle des capacités du sujet Recueillir des enregistrements de langage en situation spontanée Echantillons concrets de langage (oral ou gestuel) Situations variées Pratiques langagières de chaque participant (enfant et adulte) Evaluation de la progression d’un enfant Evaluation du processus d’acquisition Intérêt des données de langage spontané Ecueils des tests de langage Pas de prise en compte des différences socioculturelles et des variantes langagières Décontextualisation des productions => évaluation des connaissances et non des usages Recherche de déficits et non de compétences (da Silva Genest & Masson, 2017 ; da Silva Genest et al, 2021 ; de Weck & Marro, 2010 ; Rondal, 2003) Méthodes complémentaires pour considérer l’ensemble des compétences d’un sujet Evaluer le développement lexical par des tests Activité de dénomination : Epreuves de dénomination Item « buffet » ou désignation (da Silva, 2014) Images extraites de Elo (Khomsi, 2008) Mêmes conduites : à Quelle est la pertinence des item non connu des enfants items sélectionnés pour évaluer et lexème donné systématiquement une compétence lexicale ? Evaluer le développement lexical par des tests Exemple extrait de Avanzi, 2019 https://francaisdenosregions.com/ 2019/10/03/parlez-vous-les- francais/ Etablir des mesures du développement langagier Méthodes/mesures appliquées sur langage spontané Au niveau phonologique Pourcentage de mots, de syllabes, de phonèmes, de consonnes et de voyelles correctes (Parisse & Maillart, 2007) Au niveau (morpho)syntaxique Longueur moyenne des énoncés Profils morphosyntaxiques (Parisse et al, 2012) Au niveau lexical Diversité lexicale Apport des corpus pour l’évaluation du langage Décrire et Recueillir Transcrire Analyser apprécier les faits linguistiques La linguistique de corpus (Lejeune, 2010 ; Leech, 1992) Données observables et vérifiables Création/utilisation d’outils spécifiques Base de réflexion sur les pratiques langagières et la dynamique des interactions (da Silva Genest & Masson, 2017) Transcrire Choix théoriques et interprétatifs du chercheur (Mondada, 2008) Objectifs à déterminer en amont (Sinclair, 1996) Transcription = première étape de l’analyse Connaissances précises sur les caractéristiques de l’oral (Blanche-Benveniste & Bilger, 1999) Diversité des pratiques des locuteurs Recommandations pour le chercheur et pour le professionnel qui collecte et travaille des données pour sa pratique Adaptations pour servir ses objectifs Utiliser des logiciels de transcription CLAN (MacWhinney & Snow, 1984) Transcription et analyses automatiques Données transcrites et alignées avec son/vidéo Données exportables vers d’autres logiciels PRAAT : prosodie PHON : phonologie ELAN : gestes et non-verbal CLAN ? Projet CHILDES : Child Language Data Exchange System Création : Brian MacWhinney & Catherine Snow (1984) Développement et maintenance: Brian MacWhinney Pour le français: Christophe Parisse Base de données internationale Interactions naturelles ou semi-guidées + de 130 corpora partagés dans 26 langues différentes Situations diversifiées (domicile, clinique, classe…) Partage de données au sein de la communauté scientifique CLAN ? CLAN Logiciel de lecture et d’analyse en accès libre Alignement texte/vidéo Transcriptions CLAN : format.cha Utile pour décrire et analyser: Le niveau syntaxique Le niveau sémantique Le niveau lexical Le niveau pragmatique INSTALLER CLAN Installer CLAN Compatible PC, Mac et Linux https://childes.talkbank.org Version en ligne (restreinte) sur le site de CHILDES https://childes.talkbank.org/access/ LIRE UNE TRANSCRIPTION Démarrer CLAN 1. Cliquer sur l’icône CLAN (jaune si Mac, vert si PC) 2. La fenêtre « Commands » s’ouvre => Fermer 3. Feuille vide s’ouvre (PC) ou File > New Les menus généraux Les menus spécifiques Téléchargement d’une vidéo et d’une transcription d’exemple MADELEINE-30-4_07_04 Vidéo (.mp4) Transcription (.cha) Présentation des transcriptions : les en-têtes Les en-têtes sont obligatoires pour que la transcription fonctionne Commencent par @ Présentation des transcriptions : le corps Découpée en lignes principales et dépendantes Lignes principales : Symbolisées par * suivies des 3 premières lettres du participant (voir en-têtes) *CHI, *MOT, *OBS, etc. Contiennent une balise (bullet) qui permet d’écouter/voir la vidéo Lignes dépendantes : Symbolisées par % suivies de 3 lettres minuscules %act, %sit, %com, etc. Indications complémentaires pour la ligne principale située juste au-dessus On peut avoir plusieurs lignes dépendantes pour une même ligne principale Présentation des transcriptions: le corps Une balise par énoncé en général mais … Chevauchements de parole => plusieurs énoncés pour une seule balise *CHI: j' ai gagné ! *MOT: +< t(u) as gagné. *CHI: euh le lapin [/] et +/. *MOT: le lapin +... *CHI: +< le lapin. *MOT: +, il s' appelle Coco Lapin. Enoncés longs Exemple *BRO: en noir et blanc ça va faire bien parce que ça fait longtemps qu' on n' a pas vu des photos en noir et blanc ! Lire une transcription Consignes importantes Le fichier vidéo, le fichier CLAN (.cha) et la ligne @Media doivent avoir le même nom Ex. COCO_01-01-2015.cha & COCO_01-01-2015.mov Pas de caractères spéciaux sauf - et _ (pas de ; ni d’accents) Sauvegarder la vidéo et la transcription dans le même dossier Eviter les sous-dossiers Lire une transcription Deux modes: 1. Ecouter la totalité d’une transcription Placez le curseur sur une ligne contenant une balise (bullet) Ouvrez Mode > Continuous playback Pour arrêter : barre espace ou clic n’importe où 2. Ecouter une seule ligne à la fois Placez le curseur sur une ligne contenant une balise Mode > Play bullet media Sur PC : F4 Sur Mac: fn + F4 Lire une transcription Le film se lance dans une fenêtre à côté Ne touchez pas à cette fenêtre!! Message d’erreur fréquent Le fichier vidéo n’a pas le même nom que la transcription La vidéo n’est pas dans le même dossier que la transcription La ligne Media n’a pas le même nom que la vidéo et/ou la transcription => Rectifiez les noms ou l’emplacement et recommencez ! Message d’erreur fréquent Vous avez placé votre curseur sur une ligne qui ne contient pas de balise => Déplacez votre curseur ! Conventions de transcription sous CLAN Un seul énoncé par ligne Chaque ligne principale commence par *NOM:[tab] Chaque ligne dépendante commence par %xxx:[tab] Ligne principale : orthographe Ligne dépendante %pho: phonétique UNIQUEMENT POUR L’ENFANT Majuscules uniquement sur les noms propres Chaque énoncé se termine par un marqueur de fin d’énoncé :. / ! / ? … Même quand le locuteur ne dit rien! Dans ce cas : *CHI: 0. Pas de ponctuation à l’intérieur de l’énoncé (pas de virgules) Conventions de transcription : marqueurs de début et fin d’énoncés +... Enoncé affirmatif en suspens *CHI: on va mettre ça (.) comme ça +… +..? Enoncé interrogatif en suspens *MOT: alors on dit les +..? +/. Interruption d’un énoncé *CHI: mais i(l)s ont des portes pour que +/? affirmatif les lapins +/. Interruption d’un énoncé *MOT: hein qu(oi) +/? interrogatif +, Énoncé complétant un *MOT: tiens regarde +... énoncé précédent produit par *MOT: +, dans le +/. le même locuteur ++ Énoncé complétant un *OBS: mais en quoi (.) en purée en énoncé précédent produit par pommes+de+terre bouillies en +... un autre locuteur *MOT: ++ en frites ? +< Chevauchements de parole *MOT: c’est sur quelle chaîne les (marquage sommaire) schtroumpfs ? *OBS: +< ou c'est une vidéo ? < > [>] Chevauchements de parole MOT: [>] ? < > [ sauf présente dans dictionnaire @s Mot d’une autre langue [/] Répétition de ce qui a été dit avant *CHI: le [/] le [/] le chat il est parti *CHI: [/] [/] le chat il est parti [//] Reprise avec correction syntaxique *CHI: il a vu un [//] le lapin [///] Reprise avec reformulation (correction sémantique) *MOT: le lapin [///] le lièvre (.) Pause à l’intérieur d’un énoncé Conventions de transcription: lignes dépendantes %pho Transcription phonétique (API ou SAMPA) Le même nombre d’éléments sur les deux lignes *CHI: les [/] les vaches [/] e(lle)s ont disparu ! %pho: le le vaS E zo~ E zo~ dispaRy *CHI: et ça c’est xx. %pho: e sa se X %act Actions/activités des participants Regard %sit Situation/actions non impliquées dans la conversation %com Commentaire métalinguistique *MOT: +< non. %com: répond à la place de CHI %add A qui l’énoncé est adressé si ambiguïté %gpx Geste (pointage, geste conventionnel…) %spa Acte de langage %int Interprétation : /1/ = presque sûr ; /2/ = plausible; /3/ = doute *CHI: maint(e)nant j(e) vais mett(re) les lapins dans leur cage ! %int: cage/2/ Evènements paralinguistiques Rires, toux, soupirs, sourires, mouvements de tête, cris, chuchotements, lecture, chanson, discours rapporté… [=! rit], [=! tousse], [=! sourit] [=! hoche la tête], [=! lit], [=! discours rapporté], [=! chante]… Plusieurs indications possibles Sur le mot précédent *CHI: non [=! pleure] ! Sur un groupe de mots *MOT: [=! lit] attends j’allume la lumière. Sans énoncé *CHI: 0 [=! tousse]. Enoncé puis événement paralinguistique (ou l’inverse) *MOT: d’accord 0 [=! rit] ! *MOT: 0 [=! rit] d’accord ! CALCULS AUTOMATIQUES Plusieurs commandes possibles avec CLAN Nb total d’énoncés MLU Nb total de mots Longueur moyenne des énoncés Liste d’items FREQ Fréquence de certains items Nb total de mots et de mots différents VOCD Diversité lexicale MAXWD Enoncé le plus long d’un corpus Combinaison de critères de recherche COMBO Fréquence La fenêtre « Commands » à utiliser pour chaque calcul Dossier de travail -> cliquer pour sélectionner l’emplacement des fichiers avant de commencer les calculs Grammaire CLAN paramétrée par le logiciel Liste des commandes Mémorisation des commandes Lancer la commande Commandes CLAN Les commandes suivantes peuvent aussi être tapées directement Choisir seulement, via l’onglet File in, le fichier de travail Une commande lancée est archivée Possibilité de retrouver les 10 dernières commandes avec la flèche ▼du clavier La commande MLU Sélection de la commande dans la liste La commande MLU : onglets sous Windows La commande MLU : procédure Sélection du fichier La commande MLU : procédure La commande MLU : procédure fichier sélectionné La commande MLU (sauf CLAN-C) La commande MLU (CLAN-C) Ecrire la commande +t*MOT = Tiers MOT -t%mor = analyse sur la ligne principale MAIS dépend du paramétrage è +t%mor La commande MLU : procédure Lancer la commande La commande MLU Rappel de la commande et des informations Nb d’énoncés produits par CHI MLU (longueur moyenne des énoncés) La commande FREQ Tri par ordre croissant Commande FREQ sur des lignes dépendantes La commande VOCD Nb de mots (tokens) Nb de mots différents (types) Ratio (TTR) La commande MAXWD L’énoncé le plus long +g2 = calcul en nombre de mots A taper manuellement après @ Application Téléchargez les transcriptions : MADELEINE 2_06_10 : https://sharedocs.huma- num.fr/wl/?id=TMKzNU3myNptU0FXlLmpWdDolUrnAeDe MADELEINE 3_00_28 : https://sharedocs.huma- num.fr/wl/?id=4krhiciTwS537maHid6B5PJzawT2SFuS MADELEINE 3_06_08 : https://sharedocs.huma- num.fr/wl/?id=XGyCzTn8jTYhXVlEmqYhPx4fSBt0r0if Lancez les commandes sur les corpus Mesurer l’évolution Ressources https://corli.huma-num.fr/?page_id=2 https://childes.talkbank.org/intro/leonard.doc Exporter des données de CLAN vers PRAAT http://corpusecrits.huma-num.fr/wp- content/uploads/2017/03/8.CLAN-exports.pptx.pdf Convertir des fichiers vers CLAN: TEICONVERT http://ct3.ortolang.fr/trjs/doku.php http://ct3.ortolang.fr/teiconvert/