Introduction aux Corpus Orals PDF

Summary

Ce document fournit une introduction aux corpus oraux, notamment leurs définitions, caractéristiques et analyse. Il explique l'importance de ces corpus en linguistique et en linguistique appliquée, et détaille les typologies de corpus oraux tels que les corpus spontanés et dirigés, mono et multi-locuteurs. Les méthodes de collecte de données et les techniques d'analyse, telles que l'observation participante et l'entretien, sont également abordées.

Full Transcript

# Introduction aux corpus oraux ## 1 - Définition et caractéristiques des corpus oraux - Un corpus oral désigne un ensemble structuré de données linguistiques recueillies sous forme de productions orales. - Contrairement aux corpus écrits, qui se basent sur des textes fixes et souvent révisés, les...

# Introduction aux corpus oraux ## 1 - Définition et caractéristiques des corpus oraux - Un corpus oral désigne un ensemble structuré de données linguistiques recueillies sous forme de productions orales. - Contrairement aux corpus écrits, qui se basent sur des textes fixes et souvent révisés, les corpus oraux capturent le langage dans sa forme la plus spontanée, naturelle et contextuelle. - Ils sont utilisés pour l'analyse des comportements linguistiques dans diverses situations de communication, permettant ainsi une étude approfondie de la langue parlée telle qu'elle est réellement utilisée. ## 1-1 - Définition des corpus oraux - Les corpus oraux sont des enregistrements de discours humains qui peuvent inclure des conversations, des discours formels, des dialogues, des interviews, ou encore des débats. - Ils sont souvent transcrits afin d'être analysés et peuvent comporter divers niveaux d'annotation pour identifier des aspects phonétiques, syntaxiques, pragmatiques ou prosodiques. - La constitution d'un corpus oral implique une capture fidèle des éléments sonores et non-verbaux qui entourent la parole, tels que les pauses, les hésitations, l'intonation ou les interactions gestuelles. ## 1-2 - Caractéristiques des corpus oraux - **Spontanéité:** Les corpus oraux capturent souvent des situations où les locuteurs parlent sans préparation formelle. - **Variabilité linguistique:** La langue orale est intrinsèquement plus variable que la langue écrite. - **Co-présence et multimodalité:** Contrairement à l'écrit, l'oralité implique généralement la co-présence physique des interlocuteurs, ce qui entraîne une interaction en temps réel. - **Fluide et contextuel:** Le langage oral est fluide, avec des constructions syntaxiques souvent moins formelles et plus fragmentées que celles de l'écrit. - **Influence des pauses et des phénomènes prosodiques:** Les corpus oraux tiennent compte des éléments prosodiques, comme l'accent tonique, les pauses ou encore l'intonation. ## 2 - Importance et utilité des corpus oraux en linguistique - Les corpus oraux sont devenus une ressource incontournable pour les linguistes qui souhaitent analyser la langue parlée dans ses usages réels. ### 2-1 - Importance des corpus oraux en linguistique #### 2-1-1 - Accès à la langue parlée réelle - Les corpus oraux permettent aux linguistes d'accéder à des données authentiques, non filtrées par les normes d'écriture ou les attentes institutionnelles. #### 2-1-2 - Étude des phénomènes de variation linguistique - Les corpus oraux jouent un rôle clé dans la recherche sur la variation linguistique, en particulier dans le domaine de la sociolinguistique. #### 2-1-3 - Analyse de la phonétique et de la prosodie - La phonétique et la prosodie sont mieux appréhendées à partir de corpus oraux. #### 2-1-4 - Analyse conversationnelle et pragmatique - L'analyse conversationnelle dépend largement des corpus oraux. #### 2-1-5 - Étude des phénomènes liés à l'acquisition du langage - Les corpus oraux sont également précieux pour les chercheurs en acquisition du langage. ### 2-2 - Utilité des corpus oraux en linguistique appliquée #### 2-2-1 - Enseignement des langues - Dans le domaine de la didactique des langues, les corpus oraux sont extrêmement utiles pour créer des matériaux pédagogiques authentiques. #### 2-2-2 - Création de systèmes de reconnaissance vocale - Les corpus oraux sont indispensables pour le développement des technologies de reconnaissance vocale. #### 2-2-3 - Analyse des discours publics - Dans le domaine de l'analyse du discours, les corpus oraux sont souvent utilisés pour étudier les discours politiques, médiatiques ou institutionnels. #### 2-2-4 - Études socioculturelles et anthropologiques - Les corpus oraux jouent un rôle fondamental dans les recherches en anthropologie linguistique et en sociologie du langage. ## 3 - Différences entre corpus écrits et corpus oraux - Les corpus écrits et les corpus oraux sont deux types de ressources linguistiques qui permettent d'étudier la langue sous différentes formes et dans des contextes distincts. ### 3-1 - Différence de médium: permanence vs immédiateté #### 3 - 1 - 1 - Permanence de l'écrit - Les corpus écrits sont généralement caractérisés par la permanence du texte. #### 3 - 1 - 2 - Immédiateté de l'oral - À l'inverse, les corpus oraux capturent une langue produite spontanément dans l'instant, souvent sans possibilité de révision ou de correction. ### 3-2 - Structure et complexité syntaxique #### 3-2-1 - Complexité et organisation des structures dans l'écrit - La langue écrite est généralement plus complexe sur le plan syntaxique que la langue orale. #### 3-2-2 - Simplicité et incomplétude dans l'oral - Les corpus oraux montrent souvent des phrases plus simples et incomplètes. ## 4 - Présence de phénomènes prosodiques et paralinguistiques #### 4-1 - Absence de prosodie dans l'écrit - Les corpus écrits manquent d'éléments prosodiques (intonation, accentuation, pauses) et paralinguistiques (gestes, expressions faciales, tonalités émotionnelles) qui jouent un rôle crucial dans l'interprétation du sens dans le discours oral. #### 4-2 - Importance de la prosodie et des éléments paralinguistiques dans l'oral - Dans les corpus oraux, la prosodie est une composante essentielle du sens. ## 5 - Spontanéité et variabilité #### 5-1.-Formalité et planification dans l'écrit - La langue écrite tend à être plus formelle et planifiée. #### 5-2 - Variabilité et spontanéité dans l'oral - En revanche, la langue orale est souvent plus informelle et variable. ## 6 - Types de données et méthode de collecte #### 6-1 - Collecte plus simple pour les corpus écrits - Les corpus écrits sont généralement plus simples à collecter. #### 6-2 - Collecte et transcription complexes pour les corpus oraux - En revanche, la collecte de corpus oraux est plus complexe et coûteuse. ## 7 - Utilisations et finalités distinctes #### 7-1- Applications des corpus écrits - Les corpus écrits sont couramment utilisés pour des analyses grammaticales, lexicales ou stylistiques. #### 7-2 - Applications des corpus oraux - Les corpus oraux, quant à eux, sont essentiels pour l'analyse des phénomènes propres à la communication orale, comme l'interaction conversationnelle, la variation phonétique, l'intonation et les stratégies pragmatiques. ## Typologies des corpus oraux ### I - Corpus spontanés vs corpus dirigés - Pour aborder la typologie des corpus oraux, une distinction essentielle est à faire entre les corpus spontanés et les corpus dirigés. #### 1. Corpus spontanés: - Les corpus spontanés regroupent les productions orales recueillies dans des situations naturelles, sans intervention directe ni consignes précises imposées aux locuteurs. - Cette spontanéité permet d'observer des phénomènes linguistiques qui pourraient être atténués ou absents dans des situations dirigées. #### 2. Corpus dirigés - Les corpus dirigés, quant à eux, sont obtenus dans des situations où le chercheur impose certaines consignes ou contraintes pour contrôler les conditions de production de la parole. - Ils sont fréquemment utilisés pour étudier des aspects précis de la langue, tels que des structures grammaticales ou des phénomènes phonétiques, qui nécessitent un certain degré de standardisation pour être comparables. ### II - Corpus mono-locuteur vs corpus multi-locuteurs - Les corpus oraux peuvent également être classés en fonction du nombre de locuteurs présents lors de l'enregistrement. #### 1. Corpus Mono-locuteur - Un corpus mono-locuteur consiste en des enregistrements réalisés avec un seul locuteur. - Ces corpus permettent d'examiner le langage d'un individu dans différents contextes, mais sans l'influence d'autres interlocuteurs. #### 2. Corpus Multi-locuteurs - Un corpus multi-locuteurs est constitué d'enregistrements impliquant plusieurs locuteurs qui interagissent les uns avec les autres. ## Collecte de corpus et analyse de données ### L'observation participante - L'enquêteur peut pratiquer l'observation « de l'intérieur » au sens strict, auquel cas (le chercheur est témoin). Par contre si la situation relève de l'interaction (le chercheur est coacteur). - Les situations ordinaires combinent selon des dosages divers l'une et l'autre composante. ### L'entretien comme « négociation invisible » - L'enquêté n'a pas les mêmes « intérêts » que l'enquêteur ni les mêmes représentations de ce qu'est l'enquête. Chacun, en un certain sens, essaye de « manipuler » l'autre. - L'informateur est loin d'être un pion déplacé par le chercheur ou une victime prise au piège de sa curiosité. Il ne se prive pas d'utiliser des stratégies actives visant à tirer profit de l'entretien (gain en prestige, reconnaissance sociale, rétribution financière, espoir d'appui ultérieur, légitimation de son point de vue particulier...) ou des stratégies défensives visant à minimiser les risques de la parole (donner peu d'information ou des informations erronées, se débarrasser au plus vite d'un gêneur, faire plaisir en répondant ce qu'on croit que l'enquêteur attend...). - Le problème du chercheur, et c'est un dilemme qui relève du double engagement, c'est qu'il doit à la fois garder le contrôle de l'enregistrement (car il s'agit pour lui de faire progresser son enquête) tout en laissant son interlocuteur s'exprimer comme il l'entend et à sa façon (car c'est une condition de la réussite de l'entretien). - Le chercheur est censé gérer l'entretien. Celui-ci est en quelque sorte tenu professionnellement d'accorder crédit aux propos de son interlocuteur (aussi étranges ou suspects qu'ils puissent apparaître dans l'univers de sens du chercheur). Ce n'est pas simplement une astuce d'enquêteur. - Telle est la condition d'accès à la logique et à l'univers de sens de ceux que le linguiste étudie, et c'est par cette prise au sérieux qu'il peut combattre ses propres préjugés et préconceptions. ### L'entretien et la durée - L'insertion de l'entretien dans une dimension diachronique constitue une autre forme de contraste avec la « perspective minière ». - Un entretien est au moins potentiellement le début d'une série d'entretiens et, au-delà, d'une relation (même si, souvent, celle-ci tourne court). - Dans ce cas l'entretien n'est pas un dossier fermé, bouclé, mais un dossier ouvert, qui peut toujours s'enrichir. - Plusieurs entretiens avec le même interlocuteur sont une façon de se rapprocher du mode de la conversation. ### Les entretiens: dirigés, semi-dirigés, libres - L'entretien dirigé ou "directif" consiste à interroger les sujets de manière un peu "rigide" à l'aide d'un questionnaire fermé où les réponses attendues ne peuvent se prêter à un grand développement. - L'entretien semi-dirigé ou semi-directif (appeléobservation indirecte par les sociologues) est plus souple puisque les questions peuvent donner libre cours à de larges développements. - L'ordre des questions et leur formulation même peuvent varier. - L'entretien libre est non directif. Il s'agit de laisser parler l'informateur après avoir lancé un thème, une idée, une question et de se laisser porter par la discussion. - Le rôle de l'enquêteur sera de rester très vigilant aux paroles de l'autre afin de relancer ou d'orienter le cours de la discussion dans le sens qu'il considérera comme nécessaire tout en évitant les marques de subjectivité trop fortes (préjugés, jugement des paroles, valorisation/dévalorisation de la personne...). ### Le paradoxe de l'observateur (Labov) - Labov a insisté sur le paradoxe de l'observateur qui vise à restituer des éléments au plus près de la réalité vécue alors que cette réalité doit être soumise à l'artificiel de l'observation systématique. - Il semble que cette notion de paradoxe de l'observateur a souvent été entendue au sens d'une prégnance relationnelle, porteuse en germe des déformations dues au blocage du regard systématique. - En quelque sorte, le chercheur et l'informateur seraient en relative difficulté pour se rencontrer car la densité des interactions leur donne un sens plurivoque qui ne peut pas être élucidé à l'instant de leur réalisation. - Il est donc nécessaire de passer par la transition d'un autre regard qui pose à son tour le problème du rapport entre observation et réalité. ### Les écueils de l'interview - Les limites de l'interview en tant que méthode pour recueillir de la langue naturelle ont été largement discutées. - En particulier, les interviews informelles, où l'enquêteur cherche à mettre l'interviewé à l'aise, sont souvent vues comme une solution de compromis. - Cette approche est appréciée pour sa simplicité d'exécution et la possibilité de comparer les données recueillies. - Toutefois, malgré ces avantages, la présence d'un enquêteur, souvent extérieur à l'interviewé, peut altérer le caractère naturel de la conversation. ## Collecte et constitution des corpus oraux ### Méthodologies de collecte de données orales - La collecte de données orales constitue une étape essentielle dans plusieurs disciplines, telles que la linguistique, la sociolinguistique, l'anthropologie ou encore les sciences de l'éducation. - Ces méthodologies permettent de documenter des pratiques langagières, d'analyser des phénomènes linguistiques en contexte ou d'explorer des interactions humaines authentiques. #### 1. Définition des objectifs et choix du cadre méthodologique - La première étape consiste à déterminer les objectifs spécifiques de la recherche: s'agit-il d'étudier des phénomènes phonétiques, syntaxiques, pragmatiques ou encore des pratiques discursives dans un contexte donné? #### 2. Techniques de collecte de données orales - Selon les objectifs, plusieurs techniques peuvent être employées : - **Entretiens dirigés et semi-dirigés** - **Enregistrements d'interactions spontanées** - **Narrations ou récits personnels** - **Enquêtes ethnographiques et observations participantes** #### 3. Préparation des outils de collecte - Matériel d'enregistrement : L'utilisation de dictaphones, de microphones directionnels ou d'applications mobiles garantit une qualité sonore optimale pour l'analyse. #### 4. Transcription et gestion des données - La transcription des données orales est une étape critique, souvent fastidieuse, qui exige des conventions précises (ex. système de transcription de Jefferson pour l'analyse conversationnelle). #### 5. Défis et limites - La collecte de données orales soulève plusieurs défis: - Effet d'observateur - Accessibilité - Analyse qualitative volumineuse #### 6. Exemples d'applications - **En linguistique:** Étude des accents régionaux ou des variations dialectales. - **En didactique:** Analyse des interactions enseignant-apprenant en classe. - **En anthropologie:** Compréhension des traditions orales et des pratiques culturelles. ### - Enregistrements audio et vidéo: considérations techniques dans un corpus oral en linguistique - L'utilisation d'enregistrements audio et vidéo constitue une étape capitale dans la constitution de corpus oraux en linguistique. - Ces enregistrements permettent de capturer des données linguistiques authentiques, nécessaires pour analyser les variations phonétiques, prosodiques, syntaxiques ou pragmatiques. #### 1. Qualité technique des enregistrements - La qualité des enregistrements dépend des équipements utilisés, des réglages techniques et des conditions d'enregistrement. #### 2. Conditions d'enregistrement - Les enregistrements doivent être réalisés dans un environnement calme pour éviter les interférences. #### 3. Aspects éthiques et juridiques - L'enregistrement de locuteurs soulève des questions éthiques. #### 4. Intégration multimodale - Les enregistrements vidéo offrent des dimensions supplémentaires à l'analyse linguistique en capturant des gestes, des expressions faciales et d'autres éléments paralinguistiques. #### 5. Traitement et analyse des données - Après l'enregistrement, les données doivent être traitées pour être exploitables. Cela inclut: - **Transcription** - **Balises temporelles** - **Logiciels spécialisés** ## Conditions éthiques dans un corpus oral en linguistique: Consentement et Anonymat - La constitution d'un corpus oral en linguistique repose non seulement sur des considérations techniques, mais aussi sur des exigences éthiques strictes. - Ces dernières garantissent que les droits des participants sont respectés et que les recherches menées sont conformes aux normes internationales en matière de recherche scientifique. #### 1. Consentement éclairé : Fondement de l'éthique de la recherche - Le consentement éclairé est un pilier des pratiques éthiques en recherche. - Il s'agit d'un processus où les participants donnent leur accord libre et informé pour participer à l'étude. #### 2. Anonymisation - Les données collectées doivent être anonymisées pour protéger l'identité des participants. #### 3. Utilisation et stockage - Les données doivent être conservées de manière sécurisée et utilisées uniquement à des fins de recherche. #### 3. Approches adaptées au Maroc - **Préférence pour l'audio:** Moins intrusif, particulièrement dans des contextes sensibles. - **Sensibilisation préalable:** Expliquer clairement les finalités de la recherche et ses bénéfices pour la communauté. - **Relation de confiance:** Prendre le temps de dialoguer avec les participants pour réduire les réticences. # Exercice ## Exemple comparatif pour illustrer la complexité du corpus écrit par rapport au corpus oral ### Exemple de Corpus Oral Imaginez une conversation entre deux amis au café : - Ami 1: "Salut! Ça va? T'as eu des nouvelles pour ton projet de stage ? - Ami 2: "Ouais, enfin ! J'ai eu un retour ce matin. C'est plutôt positif, mais ils veulent que je fasse encore quelques révisions." - Ami 1: "Ah super ! Ils t'ont demandé quoi ?" ### Exemple de Corpus Écrit Maintenant, comparons avec un extrait d'un texte de recherche académique : "L'apprentissage par immersion est une méthodologie éducative visant à développer des compétences linguistiques avancées dans une langue seconde par le biais d'une exposition intensive. Ce modèle d'enseignement, largement adopté en Europe et en Amérique du Nord, est caractérisé par un enseignement où la langue-cible est utilisée comme langue d'instruction principale. Selon les recherches de Hamers et Blanc (2000, p. 174), les élèves bénéficient d'une amélioration de leur compétence langagière grâce à cette approche intégrative." ## Corrigé de l'exercice ### Dans ce corpus oral, on observe des caractéristiques comme: - Des phrases courtes et incomplètes. - Un style informel, avec des contractions ("T'as", "Ouais"). - Une structure syntaxique relâchée, souvent non grammaticale. - Des marques d'interaction comme "Ah super!" ou "T'as eu des nouvelles ?". ### Analyse de l'Interactivité dans le Corpus Oral - Dans cet exemple de conversation entre amis, on observe un fort degré d'interactivité. - Les interlocuteurs se répondent rapidement, ajustent leurs propos en fonction des réactions de l'autre, et utilisent des interjections pour manifester de l'engagement ("Ah super!", "Ouais"). - Cette interaction dynamique favorise l'adaptation en temps réel, permettant aux locuteurs d'ajuster leur message de façon plus flexible. - Cette adaptabilité n'est pas possible dans le corpus écrit, où l'auteur doit anticiper les réactions et garantir la clarté dès le début. ### Dans ce corpus écrit, on remarque plusieurs différences marquantes : - Syntaxe complexe : les phrases sont longues, souvent avec des propositions subordonnées. - Vocabulaire spécifique et académique (ex.: "compétences linguistiques avancées", "exposition intensive", "approche intégrative"). - Références explicites aux sources (ex. : "Hamers et Blanc, 2000, p. 174"). - Structure formelle et absence d'interactions directes ou de marques d'oralité. - Exactitude syntaxique et grammaticale stricte pour répondre aux normes de l'écrit. ### La Cohérence et la Progression Thématique dans le Corpus Écrit - Dans l'exemple écrit académique, le texte est organisé autour d'une progression thématique clairement établie. - Chaque phrase introduit une nouvelle idée en lien direct avec les précédentes, créant ainsi une continuité qui guide le lecteur. - La complexité de cette structure est renforcée par l'usage d'éléments de liaison ("selon", "grâce à") et de références précises ("Hamers et Blanc, 2000, p. 174"), qui permettent de relier les idées de façon explicite. - Dans le corpus oral, cette cohésion est souvent implicite et moins formalisée, les locuteurs ayant recours à des mots de remplissage ou à des questions pour clarifier et ajuster le fil de la conversation. ### L'Usage de la Référence Explicite dans l'Écrit - Un autre aspect distinctif est l'insertion de références précises dans le corpus écrit, avec des citations académiques. - Ces références apportent de la crédibilité et de la précision au propos, une exigence souvent absente dans l'oral spontané où les informations sont rarement sourcées ou appuyées par des données externes. - Cela ajoute une complexité supplémentaire au corpus écrit, car il exige une maîtrise des conventions de citation et une recherche documentaire préalable. ### Implications pour la Compréhension et l'Interprétation Dans un exercice pédagogique, les étudiants pourraient être invités à identifier ces différents niveaux de complexité en analysant comment la structure du texte écrit contraint et guide la compréhension. Par exemple, ils pourraient comparer comment le lecteur d'un texte écrit doit interpréter des termes techniques ou académiques, alors que dans l'oral, la compréhension se construit avec des questions et des clarifications au fil de la conversation. - Cette comparaison met en lumière les différentes stratégies de compréhension nécessaires pour chaque type de corpus. ## Conclusion - Le corpus écrit, comme on le voit dans cet exemple, est généralement plus complexe que le corpus oral, car il nécessite une organisation syntaxique rigoureuse, un vocabulaire précis et l'absence des marques d'oralité qui sont typiques des conversations informelles. - Le style écrit doit être formel et structuré, et les phrases sont souvent construites avec soin pour transmettre une idée de manière claire et non ambiguë.

Use Quizgecko on...
Browser
Browser