Atelier de Visualisation des Données avec OpenRefine
13 Questions
1 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Qu'est-ce que OpenRefine?

  • Un langage de programmation pour le nettoyage des données
  • Un logiciel pour la visualisation des données
  • Un outil pour l'exploration des données (correct)
  • Un environnement de développement pour la science des données
  • Comment peut-on comprendre les en-têtes de colonne (variables) dans OpenRefine?

  • En triant les valeurs par ordre croissant ou décroissant
  • En explorant les bords des données à l'aide des touches CTRL (CMD sur Mac) + flèche
  • En appliquant un filtre (correct)
  • En utilisant une fonction de recherche dans OpenRefine
  • Quelle situation rend les données désordonnées dans OpenRefine?

  • Différents formats de dates (correct)
  • Présence d'espaces blancs au début et à la fin des mots
  • Valeurs manquantes pour 2 variables ou plus dans la même colonne
  • Erreurs d'orthographe
  • Qu'est-ce qui rend les données désordonnées dans OpenRefine?

    <p>Différents formats de dates</p> Signup and view all the answers

    Quel type d'erreurs rendent les données désordonnées dans OpenRefine?

    <p>Erreurs de frappe</p> Signup and view all the answers

    Comment peut-on explorer les bords des données dans OpenRefine?

    <p>En utilisant CTRL (CMD sur Mac) + la touche de déplacement</p> Signup and view all the answers

    Quel type de données peut rendre les données désordonnées dans OpenRefine?

    <p>Nombres formatés comme du texte</p> Signup and view all the answers

    Quelle action peut aider à comprendre les valeurs que prennent les variables dans OpenRefine?

    <p>Appliquer un filtre</p> Signup and view all the answers

    Qu'est-ce qui est décrit dans le guide Excel 'L’essentiel et une mise a niveau' d'Anis Jedidi?

    <p>Gestion des listes et Filtres</p> Signup and view all the answers

    Que représente la 'Barre d’outils Standard' dans Excel?

    <p>Barre d'outils 'Mise en forme'</p> Signup and view all the answers

    Comment peut-on obtenir 'Mohamed' sur deux lignes dans Excel?

    <p>Clic avec le bouton droit et sélectionner 'Renvoyer à la ligne automatiquement'</p> Signup and view all the answers

    Quelle fonctionnalité permet de créer un Tableau Croisé Dynamique (TCD) dans Excel?

    <p>Données externes</p> Signup and view all the answers

    Que permet de réaliser la fonctionnalité 'Simulations' dans Excel?

    <p>Formules et fonctions</p> Signup and view all the answers

    Study Notes

    📚 Mastère de Recherche en Sciences des Données (2019-2020) at ISIMS, led by Anis Jedidi, covered data cleaning using Open Refine in the Data Visualization workshop.

    🔑 Key points:

    • Open Refine: http://openrefine.org/
    • Data exploration: understanding the number of columns and rows, examining column headers and their values, discovering data types, and checking for errors.
    • Common data issues: spelling errors, white spaces, various date formats, number formatting, and missing values.

    🤝 What is Open Refine: Open Refine is a powerful tool for data cleaning, transformation, and extension. It's particularly helpful when dealing with messy data, as it offers features that make it easier to manipulate and prepare data for analysis.

    🛠️ Installation and Execution:

    1. Download OpenRefine: https://openrefine.org/download.html
    2. Extract the downloaded folder and launch the application by running the "refine-server" file.
    3. Explore your data and understand its structure.

    🔎 Data Exploration:

    • Identify the number of columns and rows.
    • Inspect column headers and their values.
    • Determine data types (numbers, text, dates, etc.).
    • Find maximum and minimum values using sorting.

    💔 Common Data Mess:

    • Spelling errors: 'NY' vs 'N.Y.' and 'N.Y.'
    • White spaces: leading and trailing spaces
    • Differently-formatted dates: '01/10/2013', '10.2013', 'October 2013', '01.10.2013 12:00:34'
    • Number formatting: '£100' as a number or text
    • Missing values: incomplete columns with missing data

    💡 Additional Context:

    • The text also mentions an Excel course by Anis Jedidi, covering formulas and functions, lists and tables, filtering and searching, dynamic table crossings, external data, and more.
    • A table is provided to help create an Excel table with given data.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Description

    Découvrez l'atelier de visualisation des données avec OpenRefine. Apprenez à télécharger, installer et exécuter l'application OpenRefine pour explorer vos données et vous initier au nettoyage des données.

    More Like This

    Use Quizgecko on...
    Browser
    Browser