Atelier de Visualisation des Données avec OpenRefine
13 Questions
1 Views

Atelier de Visualisation des Données avec OpenRefine

Created by
@SpeedyJadeite9210

Questions and Answers

Qu'est-ce que OpenRefine?

Un outil pour l'exploration des données

Comment peut-on comprendre les en-têtes de colonne (variables) dans OpenRefine?

En appliquant un filtre

Quelle situation rend les données désordonnées dans OpenRefine?

Différents formats de dates

Qu'est-ce qui rend les données désordonnées dans OpenRefine?

<p>Différents formats de dates</p> Signup and view all the answers

Quel type d'erreurs rendent les données désordonnées dans OpenRefine?

<p>Erreurs de frappe</p> Signup and view all the answers

Comment peut-on explorer les bords des données dans OpenRefine?

<p>En utilisant CTRL (CMD sur Mac) + la touche de déplacement</p> Signup and view all the answers

Quel type de données peut rendre les données désordonnées dans OpenRefine?

<p>Nombres formatés comme du texte</p> Signup and view all the answers

Quelle action peut aider à comprendre les valeurs que prennent les variables dans OpenRefine?

<p>Appliquer un filtre</p> Signup and view all the answers

Qu'est-ce qui est décrit dans le guide Excel 'L’essentiel et une mise a niveau' d'Anis Jedidi?

<p>Gestion des listes et Filtres</p> Signup and view all the answers

Que représente la 'Barre d’outils Standard' dans Excel?

<p>Barre d'outils 'Mise en forme'</p> Signup and view all the answers

Comment peut-on obtenir 'Mohamed' sur deux lignes dans Excel?

<p>Clic avec le bouton droit et sélectionner 'Renvoyer à la ligne automatiquement'</p> Signup and view all the answers

Quelle fonctionnalité permet de créer un Tableau Croisé Dynamique (TCD) dans Excel?

<p>Données externes</p> Signup and view all the answers

Que permet de réaliser la fonctionnalité 'Simulations' dans Excel?

<p>Formules et fonctions</p> Signup and view all the answers

Study Notes

📚 Mastère de Recherche en Sciences des Données (2019-2020) at ISIMS, led by Anis Jedidi, covered data cleaning using Open Refine in the Data Visualization workshop.

🔑 Key points:

  • Open Refine: http://openrefine.org/
  • Data exploration: understanding the number of columns and rows, examining column headers and their values, discovering data types, and checking for errors.
  • Common data issues: spelling errors, white spaces, various date formats, number formatting, and missing values.

🤝 What is Open Refine: Open Refine is a powerful tool for data cleaning, transformation, and extension. It's particularly helpful when dealing with messy data, as it offers features that make it easier to manipulate and prepare data for analysis.

🛠️ Installation and Execution:

  1. Download OpenRefine: https://openrefine.org/download.html
  2. Extract the downloaded folder and launch the application by running the "refine-server" file.
  3. Explore your data and understand its structure.

🔎 Data Exploration:

  • Identify the number of columns and rows.
  • Inspect column headers and their values.
  • Determine data types (numbers, text, dates, etc.).
  • Find maximum and minimum values using sorting.

💔 Common Data Mess:

  • Spelling errors: 'NY' vs 'N.Y.' and 'N.Y.'
  • White spaces: leading and trailing spaces
  • Differently-formatted dates: '01/10/2013', '10.2013', 'October 2013', '01.10.2013 12:00:34'
  • Number formatting: '£100' as a number or text
  • Missing values: incomplete columns with missing data

💡 Additional Context:

  • The text also mentions an Excel course by Anis Jedidi, covering formulas and functions, lists and tables, filtering and searching, dynamic table crossings, external data, and more.
  • A table is provided to help create an Excel table with given data.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Description

Découvrez l'atelier de visualisation des données avec OpenRefine. Apprenez à télécharger, installer et exécuter l'application OpenRefine pour explorer vos données et vous initier au nettoyage des données.

Use Quizgecko on...
Browser
Browser