5 Questions
Quel est le résultat de la tokenization de la phrase 'A touching movie. It is full of emotions and wonderful acting'?
['A', 'touching', 'movie', 'It', 'is', 'full', 'of', 'emotions', 'and', 'wonderful', 'acting']
Que fait la ligne de code 'cleaned_review = re.sub('[^A-Za-z0-9]+', ' ', cleaned_review)'?
Elle supprime les caractères spéciaux de 'cleaned_review'
Quelle bibliothèque est utilisée pour la tokenization dans le code donné?
nltk
Quelle est la fonction de la ligne de code 'cleaned_review = cleaned_review.lower()'?
Elle convertit 'cleaned_review' en minuscules
Quelle est la fonction de la ligne de code 'tokens = nltk.word_tokenize(cleaned_review)'?
Elle convertit 'cleaned_review' en une liste de mots
Quiz sur le prétraitement des données textuelles en Python, incluant la tokenization, la suppression des tags HTML et la conservation des mots pertinents. Apprenez à nettoyer les données textuelles pour l'analyse de sentiment ou le traitement du langage naturel.
Make Your Own Quizzes and Flashcards
Convert your notes into interactive study material.
Get started for free