Pandas Module Quiz

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

Quels sont les principaux types de tableaux que l'on peut manipuler avec Pandas?

Series, DataFrames, Panels et multiIndex.

Comment importer la librairie Pandas dans un script Python?

En utilisant la commande import pandas as pd.

Quelles sont les trois méthodes pour créer une série dans Pandas?

À partir d'une liste, d'un dictionnaire ou d'un tableau Numpy.

Quel type de données peut contenir un tableau Pandas?

<p>Numériques, strings, boolean, etc.</p> Signup and view all the answers

Quel est le rôle d'un DataFrame dans Pandas?

<p>Il permet de manipuler facilement des tableaux de données à deux dimensions.</p> Signup and view all the answers

Comment peut-on créer une série avec cinq zéros dans Pandas?

<p>En utilisant <code>pandas.Series(0, index=range(5))</code>.</p> Signup and view all the answers

Quels éléments sont essentiels dans un DataFrame?

<p>L'indice de la ligne, le nom de la colonne et la valeur de la donnée.</p> Signup and view all the answers

Quelle est la commande utilisée pour écrire un DataFrame vers un fichier tabulé?

<p>Cela peut être fait avec la méthode <code>to_csv()</code> par exemple.</p> Signup and view all the answers

Quelle méthode utiliseriez-vous pour déterminer le type des éléments d'une série dans Pandas?

<p>Il faut utiliser <code>serie.dtype</code>.</p> Signup and view all the answers

Comment accède-t-on à un élément d'une série par son numéro?

<p>On utilise <code>serie[numéro]</code> pour accéder à l'élément.</p> Signup and view all the answers

Quelle est la différence entre pd.DataFrame et pd.DataFrame.from_dict?

<p><code>pd.DataFrame</code> crée un dataframe à partir de colonnes, tandis que <code>pd.DataFrame.from_dict</code> peut créer un dataframe à partir des clés comme index.</p> Signup and view all the answers

Comment obtenir le nombre de dimensions d'une série?

<p>On utilise la propriété <code>serie.ndim</code>.</p> Signup and view all the answers

Quel est le rôle de serie.shape dans un tableau?

<p><code>serie.shape</code> retourne le nombre de lignes et de colonnes du tableau.</p> Signup and view all the answers

Quelles valeurs sont utilisées par défaut pour l'index d'un dataframe si aucun n'est spécifié?

<p>L'index sera initialisé par défaut avec une suite continue d'entiers commençant par 0.</p> Signup and view all the answers

Comment nommer l'index d'un dataframe?

<p>On peut nommer l'index avec <code>df.index.name = 'nom'</code>.</p> Signup and view all the answers

Quel attribut permet de connaître le nombre total d'éléments d'une série?

<p>L'attribut <code>serie.size</code> permet de connaître ce nombre.</p> Signup and view all the answers

Quel est le résultat de df.shape sur un DataFrame avec 3 colonnes et 5 lignes?

<p>(5, 3)</p> Signup and view all the answers

Comment ajouter une colonne nommée 'C' à un DataFrame existant 'df'?

<p>df['C'] = valeur</p> Signup and view all the answers

Que signifie df.ndim et quel type de valeur retourne-t-il?

<p>Il retourne le nombre de dimensions du DataFrame, généralement 2.</p> Signup and view all the answers

Comment initialiser un DataFrame avec 2 lignes et 0 colonnes?

<p>df = pandas.DataFrame(index=[0, 1])</p> Signup and view all the answers

Quel type d'éléments renvoie df.size sur un DataFrame de 4 lignes et 3 colonnes?

<p>12</p> Signup and view all the answers

Quelle méthode utilise-t-on pour obtenir la somme de tous les éléments d'une colonne 'A' d'un DataFrame?

<p>df['A'].sum()</p> Signup and view all the answers

En quoi consiste l'accès par index dans un DataFrame?

<p>C'est l'accès aux lignes ou colonnes en utilisant les étiquettes assignées.</p> Signup and view all the answers

Quelle expression Python permet d'imprimer les noms des colonnes d'un DataFrame?

<p>for x in df: print(x)</p> Signup and view all the answers

Quelle fonction utilise-t-on pour retourner le produit de valeurs dans une DataFrame?

<p>df.prod(axis=None, skipna=None, ...)</p> Signup and view all the answers

Comment calcule-t-on l'écart-type d'une série de valeurs dans une DataFrame?

<p>df.std(axis=None, skipna=None, ...)</p> Signup and view all the answers

Quelle fonction permet de compter le nombre de cellules non-NA dans une DataFrame?

<p>df.count(axis=None, ...)</p> Signup and view all the answers

Quel est le rôle de la fonction df.describe() dans l'analyse de données?

<p>df.describe() fournit un sommaire statistique des données numériques.</p> Signup and view all the answers

Comment afficher les 10 premières lignes d'une DataFrame?

<p>df.head(10)</p> Signup and view all the answers

Quel est l'argument par défaut de la fonction pd.read_csv pour le séparateur?

<p>sep=','</p> Signup and view all the answers

Comment lire un fichier Excel dans une DataFrame en utilisant pandas?

<p>df = pd.read_excel('nomfich', sheetname='...')</p> Signup and view all the answers

Quelle méthode est utilisée pour écrire une DataFrame dans un fichier CSV?

<p>df.to_csv(path_or_buf=None, sep=',', ...)</p> Signup and view all the answers

Flashcards

Pandas

Une librairie Python permettant de manipuler et d'analyser des données, notamment des tableaux avec des étiquettes de colonnes et de lignes.

DataFrames

Des tableaux de données avec des étiquettes de colonnes et de lignes, utilisés par Pandas.

Series

Des données selon une seule dimension, représentées comme un vecteur de valeurs.

DataFrames

Des données selon deux dimensions, organisées en lignes et colonnes.

Signup and view all the flashcards

Création d'une série

Création d'une série à partir d'une liste, d'un dictionnaire ou d'un tableau Numpy.

Signup and view all the flashcards

pandas.Series(0, index = range(5))

Permet de créer une série avec des valeurs identiques répétées un nombre de fois défini.

Signup and view all the flashcards

pandas.Series(0, range(5))

Permet de créer une série avec des valeurs identiques répétées un nombre de fois défini.

Signup and view all the flashcards

Type (serie)

Renvoie le type de la structure de données (ex: 'Series' pour une Série Pandas).

Signup and view all the flashcards

serie.dtype

Renvoie le type de données des éléments du tableau (ex: 'float64' pour des nombres à virgule flottante).

Signup and view all the flashcards

serie.ndim

Indique le nombre de dimensions du tableau. Pour une Série, il s'agit toujours de 1 car il s'agit d'une structure unidimensionnelle.

Signup and view all the flashcards

serie.size

Renvoie le nombre total d'éléments dans le tableau.

Signup and view all the flashcards

serie.shape

Pour une Série, renvoie un tuple (nombre de lignes, nombre de colonnes). Le nombre de colonnes est toujours 1 car il s'agit d'une structure unidimensionnelle.

Signup and view all the flashcards

DataFrame Pandas

Un DataFrame est une structure de données tabulaire bidimensionnelle (comme une feuille de calcul) qui stocke des données organisées en lignes et en colonnes. Chaque colonne est une Série Pandas.

Signup and view all the flashcards

Création d'un DataFrame à partir d'une liste

A partir d'une liste, on peut créer un DataFrame en spécifiant les noms de colonnes et les données pour chaque colonne.

Signup and view all the flashcards

Création d'un DataFrame à partir d'un dictionnaire

On peut créer un DataFrame à partir d'un dictionnaire dont les clés sont les noms de colonnes et les valeurs sont des listes de données correspondantes.

Signup and view all the flashcards

Type(df)

Retourne le type de la structure de données.

Signup and view all the flashcards

df.ndim

Retourne le nombre de dimensions du tableau.

Signup and view all the flashcards

df.size

Retourne le nombre d'éléments du tableau.

Signup and view all the flashcards

df.shape

Retourne le nombre de lignes et de colonnes du tableau.

Signup and view all the flashcards

Accès par numéro

Permet d'accéder aux valeurs du DataFrame en utilisant les numéros de ligne et de colonne, en commençant à 0.

Signup and view all the flashcards

Accès par index

Permet d'accéder aux valeurs du DataFrame en utilisant les noms des lignes et des colonnes.

Signup and view all the flashcards

Boucle sur un dataframe

Quand on boucle sur un dataframe, on boucle sur les noms des colonnes.

Signup and view all the flashcards

Boucle sur les lignes d'un dataframe

Permet de boucler sur les lignes d'un dataframe, chaque ligne se comportant comme un namedtuple.

Signup and view all the flashcards

df.prod(axis=None, skipna=None, ...)

Calcule le produit des valeurs pour l'axe spécifié. Par exemple, pour une colonne, cela renverra le produit de toutes les valeurs de cette colonne.

Signup and view all the flashcards

df.min(axis=None, skipna=None, ...)

Renvoie la valeur minimale des valeurs pour l'axe spécifié. Par exemple, pour une colonne, cela renverra la plus petite valeur de cette colonne.

Signup and view all the flashcards

df.var(axis=None, skipna=None, ...)

Calcule la variance des valeurs pour l'axe spécifié. La variance mesure la dispersion des données par rapport à la moyenne.

Signup and view all the flashcards

df.std(axis=None, skipna=None, ...)

Renvoie l'écart type des valeurs pour l'axe spécifié. L'écart type mesure la dispersion moyenne des données par rapport à la moyenne.

Signup and view all the flashcards

df.median(axis=None, skipna=None, ...)

Calcule la médiane des valeurs pour l'axe spécifié. La médiane est la valeur au milieu d'un ensemble de données ordonné.

Signup and view all the flashcards

df.count(axis=None, ...)

Compte le nombre de cellules non-NA (Non-Null) pour chaque colonne ou ligne du DataFrame.

Signup and view all the flashcards

df.describe()

Affiche un résumé statistique des données numériques du DataFrame, incluant la moyenne, l'écart type, les valeurs minimales et maximales, etc.

Signup and view all the flashcards

df.head(n)

Affiche les n premières lignes d'un DataFrame.

Signup and view all the flashcards

df.tail(n)

Affiche les n dernières lignes d'un DataFrame.

Signup and view all the flashcards

Study Notes

Module Pandas

  • Pandas est une librairie Python pour manipuler facilement des données.
  • Elle permet de manipuler des tableaux de données avec des étiquettes de variables (colonnes) et des lignes.
  • Ces tableaux sont appelés Series (une dimension), DataFrames (deux dimensions), Panels (trois dimensions) et multiIndex (plus de trois dimensions).
  • On peut lire et écrire des DataFrames dans des fichiers tabulés.
  • Les tableaux Pandas peuvent contenir des données de différents types (numériques, chaînes de caractères, booléens).
  • Des graphiques peuvent être créés à partir de DataFrames grâce à matplotlib.
  • Pour utiliser Pandas, on écrit : import pandas as pd

Les Séries Pandas

  • Une série est un vecteur de valeurs d'une variable.
  • On peut créer une série:
    • À partir d'une liste.
    • À partir d'un dictionnaire.
    • À partir d'un tableau Numpy.
  • On peut spécifier des indices aux séries.

Caractéristiques d'une série

  • type(serie) : Retourne le type de la structure.
  • serie.dtype : Retourne le type des éléments.
  • serie.ndim : Retourne le nombre de dimensions.
  • serie.size : Retourne le nombre d'éléments.
  • serie.shape : Retourne le nombre de lignes et de colonnes.

Accéder aux éléments d'une série

  • Accès par numéro (origine à 0).
  • Accès par index.
  • L'accès par index renvoie None si l'index n'existe pas.
  • L'accès par numéro lève une exception si l'index n'existe pas.
  • df[début:fin:pas] ou df.iloc[début:fin:pas] pour sélectionner les éléments d'une plage.

Les DataFrames Pandas

  • Un DataFrame se comporte comme un dictionnaire dont les clés sont les noms des colonnes et les valeurs sont des séries.
  • Le nom des lignes est appelé index.
  • L'index peut être une chaîne de caractères ou un entier.
  • Par défaut, l'index est une suite continue d'entiers à partir de 0.
  • On peut créer un DataFrame:
    • À partir d'une liste.
    • À partir d'un dictionnaire.
    • À partir de séries.

Caractéristiques d'un DataFrame

  • type(df) : Retourne le type de la structure.
  • df.ndim : Retourne le nombre de dimensions du tableau.
  • df.size : Retourne le nombre d'éléments du tableau.
  • df.shape : Retourne le nombre de lignes et de colonnes du tableau.

Accéder aux éléments d'un DataFrame

  • Accès par numéro (origine à 0).
  • Accès par index.

Modifier un DataFrame

  • Modifier les valeurs d'un DataFrame.
  • Insérer une colonne dans un DataFrame.
  • Ajouter / supprimer une ligne.
  • Supprimer une colonne.
  • loc pour accéder à des lignes et colonnes par nom
  • iloc pour accéder à des lignes et colonnes par position

Tri d'un DataFrame

  • Tri selon les étiquettes (index).
  • Tri selon les valeurs d'une colonne.
  • sort_values pour trier par valeurs

Opérations sur les DataFrames

  • Opérations arithmétiques (+, -, *, /, //, %, **).
  • Opérations de comparaison (==, !=, <, <=, >, >=).
  • Opérations logiques (NON, ET, OU, OU exclusif).
  • df.eq(), df.ne(), df.lt(), df.le(), df.gt(), df.ge().
  • Les opérations s'appliquent élément par élément.

Parcourir un DataFrame

  • Itérer sur les colonnes.
  • Itérer sur les lignes.

Fonctions sur les DataFrames

  • df.mean(), df.sum(), df.prod(), df.min(), df.var(), df.std(), df.median(), df.count(), df.describe(), df.head(), df.tail(), df.head(n), df.tail(n).

Accès aux fichiers

  • Lecture/écriture de fichiers CSV, Excel et SQL.
  • pd.read_csv(), pd.read_excel(), pd.read_sql(), df.to_csv(), df.to_excel(), df.to_sql().

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Cours Pandas PDF

More Like This

Murach's Python for Data Analysis C8 Quiz
36 questions
Python DataFrame Manipulation Quiz
24 questions

Python DataFrame Manipulation Quiz

EnergySavingFlugelhorn1286 avatar
EnergySavingFlugelhorn1286
ملفات CSV وPandas في Python
7 questions
Use Quizgecko on...
Browser
Browser