Pandas Module Quiz
32 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Quels sont les principaux types de tableaux que l'on peut manipuler avec Pandas?

Series, DataFrames, Panels et multiIndex.

Comment importer la librairie Pandas dans un script Python?

En utilisant la commande import pandas as pd.

Quelles sont les trois méthodes pour créer une série dans Pandas?

À partir d'une liste, d'un dictionnaire ou d'un tableau Numpy.

Quel type de données peut contenir un tableau Pandas?

<p>Numériques, strings, boolean, etc.</p> Signup and view all the answers

Quel est le rôle d'un DataFrame dans Pandas?

<p>Il permet de manipuler facilement des tableaux de données à deux dimensions.</p> Signup and view all the answers

Comment peut-on créer une série avec cinq zéros dans Pandas?

<p>En utilisant <code>pandas.Series(0, index=range(5))</code>.</p> Signup and view all the answers

Quels éléments sont essentiels dans un DataFrame?

<p>L'indice de la ligne, le nom de la colonne et la valeur de la donnée.</p> Signup and view all the answers

Quelle est la commande utilisée pour écrire un DataFrame vers un fichier tabulé?

<p>Cela peut être fait avec la méthode <code>to_csv()</code> par exemple.</p> Signup and view all the answers

Quelle méthode utiliseriez-vous pour déterminer le type des éléments d'une série dans Pandas?

<p>Il faut utiliser <code>serie.dtype</code>.</p> Signup and view all the answers

Comment accède-t-on à un élément d'une série par son numéro?

<p>On utilise <code>serie[numéro]</code> pour accéder à l'élément.</p> Signup and view all the answers

Quelle est la différence entre pd.DataFrame et pd.DataFrame.from_dict?

<p><code>pd.DataFrame</code> crée un dataframe à partir de colonnes, tandis que <code>pd.DataFrame.from_dict</code> peut créer un dataframe à partir des clés comme index.</p> Signup and view all the answers

Comment obtenir le nombre de dimensions d'une série?

<p>On utilise la propriété <code>serie.ndim</code>.</p> Signup and view all the answers

Quel est le rôle de serie.shape dans un tableau?

<p><code>serie.shape</code> retourne le nombre de lignes et de colonnes du tableau.</p> Signup and view all the answers

Quelles valeurs sont utilisées par défaut pour l'index d'un dataframe si aucun n'est spécifié?

<p>L'index sera initialisé par défaut avec une suite continue d'entiers commençant par 0.</p> Signup and view all the answers

Comment nommer l'index d'un dataframe?

<p>On peut nommer l'index avec <code>df.index.name = 'nom'</code>.</p> Signup and view all the answers

Quel attribut permet de connaître le nombre total d'éléments d'une série?

<p>L'attribut <code>serie.size</code> permet de connaître ce nombre.</p> Signup and view all the answers

Quel est le résultat de df.shape sur un DataFrame avec 3 colonnes et 5 lignes?

<p>(5, 3)</p> Signup and view all the answers

Comment ajouter une colonne nommée 'C' à un DataFrame existant 'df'?

<p>df['C'] = valeur</p> Signup and view all the answers

Que signifie df.ndim et quel type de valeur retourne-t-il?

<p>Il retourne le nombre de dimensions du DataFrame, généralement 2.</p> Signup and view all the answers

Comment initialiser un DataFrame avec 2 lignes et 0 colonnes?

<p>df = pandas.DataFrame(index=[0, 1])</p> Signup and view all the answers

Quel type d'éléments renvoie df.size sur un DataFrame de 4 lignes et 3 colonnes?

<p>12</p> Signup and view all the answers

Quelle méthode utilise-t-on pour obtenir la somme de tous les éléments d'une colonne 'A' d'un DataFrame?

<p>df['A'].sum()</p> Signup and view all the answers

En quoi consiste l'accès par index dans un DataFrame?

<p>C'est l'accès aux lignes ou colonnes en utilisant les étiquettes assignées.</p> Signup and view all the answers

Quelle expression Python permet d'imprimer les noms des colonnes d'un DataFrame?

<p>for x in df: print(x)</p> Signup and view all the answers

Quelle fonction utilise-t-on pour retourner le produit de valeurs dans une DataFrame?

<p>df.prod(axis=None, skipna=None, ...)</p> Signup and view all the answers

Comment calcule-t-on l'écart-type d'une série de valeurs dans une DataFrame?

<p>df.std(axis=None, skipna=None, ...)</p> Signup and view all the answers

Quelle fonction permet de compter le nombre de cellules non-NA dans une DataFrame?

<p>df.count(axis=None, ...)</p> Signup and view all the answers

Quel est le rôle de la fonction df.describe() dans l'analyse de données?

<p>df.describe() fournit un sommaire statistique des données numériques.</p> Signup and view all the answers

Comment afficher les 10 premières lignes d'une DataFrame?

<p>df.head(10)</p> Signup and view all the answers

Quel est l'argument par défaut de la fonction pd.read_csv pour le séparateur?

<p>sep=','</p> Signup and view all the answers

Comment lire un fichier Excel dans une DataFrame en utilisant pandas?

<p>df = pd.read_excel('nomfich', sheetname='...')</p> Signup and view all the answers

Quelle méthode est utilisée pour écrire une DataFrame dans un fichier CSV?

<p>df.to_csv(path_or_buf=None, sep=',', ...)</p> Signup and view all the answers

Study Notes

Module Pandas

  • Pandas est une librairie Python pour manipuler facilement des données.
  • Elle permet de manipuler des tableaux de données avec des étiquettes de variables (colonnes) et des lignes.
  • Ces tableaux sont appelés Series (une dimension), DataFrames (deux dimensions), Panels (trois dimensions) et multiIndex (plus de trois dimensions).
  • On peut lire et écrire des DataFrames dans des fichiers tabulés.
  • Les tableaux Pandas peuvent contenir des données de différents types (numériques, chaînes de caractères, booléens).
  • Des graphiques peuvent être créés à partir de DataFrames grâce à matplotlib.
  • Pour utiliser Pandas, on écrit : import pandas as pd

Les Séries Pandas

  • Une série est un vecteur de valeurs d'une variable.
  • On peut créer une série:
    • À partir d'une liste.
    • À partir d'un dictionnaire.
    • À partir d'un tableau Numpy.
  • On peut spécifier des indices aux séries.

Caractéristiques d'une série

  • type(serie) : Retourne le type de la structure.
  • serie.dtype : Retourne le type des éléments.
  • serie.ndim : Retourne le nombre de dimensions.
  • serie.size : Retourne le nombre d'éléments.
  • serie.shape : Retourne le nombre de lignes et de colonnes.

Accéder aux éléments d'une série

  • Accès par numéro (origine à 0).
  • Accès par index.
  • L'accès par index renvoie None si l'index n'existe pas.
  • L'accès par numéro lève une exception si l'index n'existe pas.
  • df[début:fin:pas] ou df.iloc[début:fin:pas] pour sélectionner les éléments d'une plage.

Les DataFrames Pandas

  • Un DataFrame se comporte comme un dictionnaire dont les clés sont les noms des colonnes et les valeurs sont des séries.
  • Le nom des lignes est appelé index.
  • L'index peut être une chaîne de caractères ou un entier.
  • Par défaut, l'index est une suite continue d'entiers à partir de 0.
  • On peut créer un DataFrame:
    • À partir d'une liste.
    • À partir d'un dictionnaire.
    • À partir de séries.

Caractéristiques d'un DataFrame

  • type(df) : Retourne le type de la structure.
  • df.ndim : Retourne le nombre de dimensions du tableau.
  • df.size : Retourne le nombre d'éléments du tableau.
  • df.shape : Retourne le nombre de lignes et de colonnes du tableau.

Accéder aux éléments d'un DataFrame

  • Accès par numéro (origine à 0).
  • Accès par index.

Modifier un DataFrame

  • Modifier les valeurs d'un DataFrame.
  • Insérer une colonne dans un DataFrame.
  • Ajouter / supprimer une ligne.
  • Supprimer une colonne.
  • loc pour accéder à des lignes et colonnes par nom
  • iloc pour accéder à des lignes et colonnes par position

Tri d'un DataFrame

  • Tri selon les étiquettes (index).
  • Tri selon les valeurs d'une colonne.
  • sort_values pour trier par valeurs

Opérations sur les DataFrames

  • Opérations arithmétiques (+, -, *, /, //, %, **).
  • Opérations de comparaison (==, !=, <, <=, >, >=).
  • Opérations logiques (NON, ET, OU, OU exclusif).
  • df.eq(), df.ne(), df.lt(), df.le(), df.gt(), df.ge().
  • Les opérations s'appliquent élément par élément.

Parcourir un DataFrame

  • Itérer sur les colonnes.
  • Itérer sur les lignes.

Fonctions sur les DataFrames

  • df.mean(), df.sum(), df.prod(), df.min(), df.var(), df.std(), df.median(), df.count(), df.describe(), df.head(), df.tail(), df.head(n), df.tail(n).

Accès aux fichiers

  • Lecture/écriture de fichiers CSV, Excel et SQL.
  • pd.read_csv(), pd.read_excel(), pd.read_sql(), df.to_csv(), df.to_excel(), df.to_sql().

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Cours Pandas PDF

Description

Testez vos connaissances sur la librairie Pandas en Python. Ce quiz couvre les Series, DataFrames, et l'importation des données. Évaluez votre compréhension des fonctionnalités clés et de la manipulation de données.

More Like This

Python DataFrame Manipulation Quiz
24 questions

Python DataFrame Manipulation Quiz

EnergySavingFlugelhorn1286 avatar
EnergySavingFlugelhorn1286
Pandas DataFrames and Data Manipulation
32 questions
ملفات CSV وPandas في Python
7 questions
Use Quizgecko on...
Browser
Browser