5 Questions
Quelle est la méthode utilisée pour supprimer les balises HTML du texte?
Utilisation de re.sub avec une expression régulière correspondant aux balises HTML
Quelle est la raison de l'utilisation de la méthode 'lower()' dans le code?
Pour convertir le texte en minuscules
Quelle bibliothèque est utilisée pour la tokenisation dans le code fourni?
nltk
Quelle méthode de la bibliothèque nltk est utilisée pour la tokenisation?
word_tokenize
Quelle expression régulière est utilisée pour conserver uniquement les mots dans le texte?
'[^A-Za-z0-9]+'
Quiz sur le prétraitement des données textuelles en Python, incluant la tokenization, la suppression des tags HTML et la conservation des mots pertinents. Apprenez à nettoyer les données textuelles pour l'analyse de sentiment ou le traitement du langage naturel.
Make Your Own Quizzes and Flashcards
Convert your notes into interactive study material.
Get started for free