Quiz de prétraitement des données textuelles en Python

LovableSnake avatar
LovableSnake
·
·
Download

Start Quiz

Study Flashcards

5 Questions

Quelle est la méthode utilisée pour supprimer les balises HTML du texte?

Utilisation de re.sub avec une expression régulière correspondant aux balises HTML

Quelle est la raison de l'utilisation de la méthode 'lower()' dans le code?

Pour convertir le texte en minuscules

Quelle bibliothèque est utilisée pour la tokenisation dans le code fourni?

nltk

Quelle méthode de la bibliothèque nltk est utilisée pour la tokenisation?

word_tokenize

Quelle expression régulière est utilisée pour conserver uniquement les mots dans le texte?

'[^A-Za-z0-9]+'

Quiz sur le prétraitement des données textuelles en Python, incluant la tokenization, la suppression des tags HTML et la conservation des mots pertinents. Apprenez à nettoyer les données textuelles pour l'analyse de sentiment ou le traitement du langage naturel.

Make Your Own Quizzes and Flashcards

Convert your notes into interactive study material.

Get started for free

More Quizzes Like This

Quiz
5 questions
Quiz de Pisco
5 questions

Quiz de Pisco

LuxuriantMeadow avatar
LuxuriantMeadow
Use Quizgecko on...
Browser
Browser