Quiz de prétraitement des données textuelles en Python

LovableSnake avatar
LovableSnake
·
·
Download

Start Quiz

Study Flashcards

5 Questions

Quel est le résultat de la tokenization de la phrase 'A touching movie. It is full of emotions and wonderful acting'?

['A', 'touching', 'movie', 'It', 'is', 'full', 'of', 'emotions', 'and', 'wonderful', 'acting']

Que fait la ligne de code 'cleaned_review = re.sub('[^A-Za-z0-9]+', ' ', cleaned_review)'?

Elle supprime les caractères spéciaux de 'cleaned_review'

Quelle bibliothèque est utilisée pour la tokenization dans le code donné?

nltk

Quelle est la fonction de la ligne de code 'cleaned_review = cleaned_review.lower()'?

Elle convertit 'cleaned_review' en minuscules

Quelle est la fonction de la ligne de code 'tokens = nltk.word_tokenize(cleaned_review)'?

Elle convertit 'cleaned_review' en une liste de mots

Quiz sur le prétraitement des données textuelles en Python, incluant la tokenization, la suppression des tags HTML et la conservation des mots pertinents. Apprenez à nettoyer les données textuelles pour l'analyse de sentiment ou le traitement du langage naturel.

Make Your Own Quizzes and Flashcards

Convert your notes into interactive study material.

Get started for free

More Quizzes Like This

Text Preprocessing Techniques Quiz
155 questions
Tokenization and Text Preprocessing Quiz
5 questions
Use Quizgecko on...
Browser
Browser