Quiz de prétraitement des données textuelles en Python
5 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Quelle est la méthode utilisée pour supprimer les balises HTML du texte?

  • Utilisation de re.sub avec une expression régulière correspondant aux caractères non alphanumériques
  • Utilisation de re.sub avec une expression régulière correspondant aux majuscules
  • Utilisation de la tokenisation avec nltk
  • Utilisation de re.sub avec une expression régulière correspondant aux balises HTML (correct)
  • Quelle est la raison de l'utilisation de la méthode 'lower()' dans le code?

  • Pour diviser le texte en tokens
  • Pour convertir le texte en minuscules (correct)
  • Pour supprimer les espaces vides
  • Pour supprimer les caractères spéciaux
  • Quelle bibliothèque est utilisée pour la tokenisation dans le code fourni?

  • numpy
  • re
  • nltk (correct)
  • pandas
  • Quelle méthode de la bibliothèque nltk est utilisée pour la tokenisation?

    <p>word_tokenize</p> Signup and view all the answers

    Quelle expression régulière est utilisée pour conserver uniquement les mots dans le texte?

    <p>'[^A-Za-z0-9]+'</p> Signup and view all the answers

    More Like This

    Use Quizgecko on...
    Browser
    Browser