Podcast
Questions and Answers
Quels sont les principaux types de tableaux que l'on peut manipuler avec Pandas?
Quels sont les principaux types de tableaux que l'on peut manipuler avec Pandas?
Series, DataFrames, Panels et multiIndex.
Comment importer la librairie Pandas dans un script Python?
Comment importer la librairie Pandas dans un script Python?
En utilisant la commande import pandas as pd
.
Quelles sont les trois méthodes pour créer une série dans Pandas?
Quelles sont les trois méthodes pour créer une série dans Pandas?
À partir d'une liste, d'un dictionnaire ou d'un tableau Numpy.
Quel type de données peut contenir un tableau Pandas?
Quel type de données peut contenir un tableau Pandas?
Quel est le rôle d'un DataFrame dans Pandas?
Quel est le rôle d'un DataFrame dans Pandas?
Comment peut-on créer une série avec cinq zéros dans Pandas?
Comment peut-on créer une série avec cinq zéros dans Pandas?
Quels éléments sont essentiels dans un DataFrame?
Quels éléments sont essentiels dans un DataFrame?
Quelle est la commande utilisée pour écrire un DataFrame vers un fichier tabulé?
Quelle est la commande utilisée pour écrire un DataFrame vers un fichier tabulé?
Quelle méthode utiliseriez-vous pour déterminer le type des éléments d'une série dans Pandas?
Quelle méthode utiliseriez-vous pour déterminer le type des éléments d'une série dans Pandas?
Comment accède-t-on à un élément d'une série par son numéro?
Comment accède-t-on à un élément d'une série par son numéro?
Quelle est la différence entre pd.DataFrame
et pd.DataFrame.from_dict
?
Quelle est la différence entre pd.DataFrame
et pd.DataFrame.from_dict
?
Comment obtenir le nombre de dimensions d'une série?
Comment obtenir le nombre de dimensions d'une série?
Quel est le rôle de serie.shape
dans un tableau?
Quel est le rôle de serie.shape
dans un tableau?
Quelles valeurs sont utilisées par défaut pour l'index d'un dataframe si aucun n'est spécifié?
Quelles valeurs sont utilisées par défaut pour l'index d'un dataframe si aucun n'est spécifié?
Comment nommer l'index d'un dataframe?
Comment nommer l'index d'un dataframe?
Quel attribut permet de connaître le nombre total d'éléments d'une série?
Quel attribut permet de connaître le nombre total d'éléments d'une série?
Quel est le résultat de df.shape
sur un DataFrame avec 3 colonnes et 5 lignes?
Quel est le résultat de df.shape
sur un DataFrame avec 3 colonnes et 5 lignes?
Comment ajouter une colonne nommée 'C' à un DataFrame existant 'df'?
Comment ajouter une colonne nommée 'C' à un DataFrame existant 'df'?
Que signifie df.ndim
et quel type de valeur retourne-t-il?
Que signifie df.ndim
et quel type de valeur retourne-t-il?
Comment initialiser un DataFrame avec 2 lignes et 0 colonnes?
Comment initialiser un DataFrame avec 2 lignes et 0 colonnes?
Quel type d'éléments renvoie df.size
sur un DataFrame de 4 lignes et 3 colonnes?
Quel type d'éléments renvoie df.size
sur un DataFrame de 4 lignes et 3 colonnes?
Quelle méthode utilise-t-on pour obtenir la somme de tous les éléments d'une colonne 'A' d'un DataFrame?
Quelle méthode utilise-t-on pour obtenir la somme de tous les éléments d'une colonne 'A' d'un DataFrame?
En quoi consiste l'accès par index dans un DataFrame?
En quoi consiste l'accès par index dans un DataFrame?
Quelle expression Python permet d'imprimer les noms des colonnes d'un DataFrame?
Quelle expression Python permet d'imprimer les noms des colonnes d'un DataFrame?
Quelle fonction utilise-t-on pour retourner le produit de valeurs dans une DataFrame?
Quelle fonction utilise-t-on pour retourner le produit de valeurs dans une DataFrame?
Comment calcule-t-on l'écart-type d'une série de valeurs dans une DataFrame?
Comment calcule-t-on l'écart-type d'une série de valeurs dans une DataFrame?
Quelle fonction permet de compter le nombre de cellules non-NA dans une DataFrame?
Quelle fonction permet de compter le nombre de cellules non-NA dans une DataFrame?
Quel est le rôle de la fonction df.describe() dans l'analyse de données?
Quel est le rôle de la fonction df.describe() dans l'analyse de données?
Comment afficher les 10 premières lignes d'une DataFrame?
Comment afficher les 10 premières lignes d'une DataFrame?
Quel est l'argument par défaut de la fonction pd.read_csv pour le séparateur?
Quel est l'argument par défaut de la fonction pd.read_csv pour le séparateur?
Comment lire un fichier Excel dans une DataFrame en utilisant pandas?
Comment lire un fichier Excel dans une DataFrame en utilisant pandas?
Quelle méthode est utilisée pour écrire une DataFrame dans un fichier CSV?
Quelle méthode est utilisée pour écrire une DataFrame dans un fichier CSV?
Flashcards
Pandas
Pandas
Une librairie Python permettant de manipuler et d'analyser des données, notamment des tableaux avec des étiquettes de colonnes et de lignes.
DataFrames
DataFrames
Des tableaux de données avec des étiquettes de colonnes et de lignes, utilisés par Pandas.
Series
Series
Des données selon une seule dimension, représentées comme un vecteur de valeurs.
DataFrames
DataFrames
Signup and view all the flashcards
Création d'une série
Création d'une série
Signup and view all the flashcards
pandas.Series(0, index = range(5))
pandas.Series(0, index = range(5))
Signup and view all the flashcards
pandas.Series(0, range(5))
pandas.Series(0, range(5))
Signup and view all the flashcards
Type (serie)
Type (serie)
Signup and view all the flashcards
serie.dtype
serie.dtype
Signup and view all the flashcards
serie.ndim
serie.ndim
Signup and view all the flashcards
serie.size
serie.size
Signup and view all the flashcards
serie.shape
serie.shape
Signup and view all the flashcards
DataFrame Pandas
DataFrame Pandas
Signup and view all the flashcards
Création d'un DataFrame à partir d'une liste
Création d'un DataFrame à partir d'une liste
Signup and view all the flashcards
Création d'un DataFrame à partir d'un dictionnaire
Création d'un DataFrame à partir d'un dictionnaire
Signup and view all the flashcards
Type(df)
Type(df)
Signup and view all the flashcards
df.ndim
df.ndim
Signup and view all the flashcards
df.size
df.size
Signup and view all the flashcards
df.shape
df.shape
Signup and view all the flashcards
Accès par numéro
Accès par numéro
Signup and view all the flashcards
Accès par index
Accès par index
Signup and view all the flashcards
Boucle sur un dataframe
Boucle sur un dataframe
Signup and view all the flashcards
Boucle sur les lignes d'un dataframe
Boucle sur les lignes d'un dataframe
Signup and view all the flashcards
df.prod(axis=None, skipna=None, ...)
df.prod(axis=None, skipna=None, ...)
Signup and view all the flashcards
df.min(axis=None, skipna=None, ...)
df.min(axis=None, skipna=None, ...)
Signup and view all the flashcards
df.var(axis=None, skipna=None, ...)
df.var(axis=None, skipna=None, ...)
Signup and view all the flashcards
df.std(axis=None, skipna=None, ...)
df.std(axis=None, skipna=None, ...)
Signup and view all the flashcards
df.median(axis=None, skipna=None, ...)
df.median(axis=None, skipna=None, ...)
Signup and view all the flashcards
df.count(axis=None, ...)
df.count(axis=None, ...)
Signup and view all the flashcards
df.describe()
df.describe()
Signup and view all the flashcards
df.head(n)
df.head(n)
Signup and view all the flashcards
df.tail(n)
df.tail(n)
Signup and view all the flashcards
Study Notes
Module Pandas
- Pandas est une librairie Python pour manipuler facilement des données.
- Elle permet de manipuler des tableaux de données avec des étiquettes de variables (colonnes) et des lignes.
- Ces tableaux sont appelés Series (une dimension), DataFrames (deux dimensions), Panels (trois dimensions) et multiIndex (plus de trois dimensions).
- On peut lire et écrire des DataFrames dans des fichiers tabulés.
- Les tableaux Pandas peuvent contenir des données de différents types (numériques, chaînes de caractères, booléens).
- Des graphiques peuvent être créés à partir de DataFrames grâce à matplotlib.
- Pour utiliser Pandas, on écrit :
import pandas as pd
Les Séries Pandas
- Une série est un vecteur de valeurs d'une variable.
- On peut créer une série:
- À partir d'une liste.
- À partir d'un dictionnaire.
- À partir d'un tableau Numpy.
- On peut spécifier des indices aux séries.
Caractéristiques d'une série
type(serie)
: Retourne le type de la structure.serie.dtype
: Retourne le type des éléments.serie.ndim
: Retourne le nombre de dimensions.serie.size
: Retourne le nombre d'éléments.serie.shape
: Retourne le nombre de lignes et de colonnes.
Accéder aux éléments d'une série
- Accès par numéro (origine à 0).
- Accès par index.
- L'accès par index renvoie
None
si l'index n'existe pas. - L'accès par numéro lève une exception si l'index n'existe pas.
df[début:fin:pas]
oudf.iloc[début:fin:pas]
pour sélectionner les éléments d'une plage.
Les DataFrames Pandas
- Un DataFrame se comporte comme un dictionnaire dont les clés sont les noms des colonnes et les valeurs sont des séries.
- Le nom des lignes est appelé index.
- L'index peut être une chaîne de caractères ou un entier.
- Par défaut, l'index est une suite continue d'entiers à partir de 0.
- On peut créer un DataFrame:
- À partir d'une liste.
- À partir d'un dictionnaire.
- À partir de séries.
Caractéristiques d'un DataFrame
type(df)
: Retourne le type de la structure.df.ndim
: Retourne le nombre de dimensions du tableau.df.size
: Retourne le nombre d'éléments du tableau.df.shape
: Retourne le nombre de lignes et de colonnes du tableau.
Accéder aux éléments d'un DataFrame
- Accès par numéro (origine à 0).
- Accès par index.
Modifier un DataFrame
- Modifier les valeurs d'un DataFrame.
- Insérer une colonne dans un DataFrame.
- Ajouter / supprimer une ligne.
- Supprimer une colonne.
loc
pour accéder à des lignes et colonnes par nomiloc
pour accéder à des lignes et colonnes par position
Tri d'un DataFrame
- Tri selon les étiquettes (index).
- Tri selon les valeurs d'une colonne.
sort_values
pour trier par valeurs
Opérations sur les DataFrames
- Opérations arithmétiques (+, -, *, /, //, %, **).
- Opérations de comparaison (==, !=, <, <=, >, >=).
- Opérations logiques (NON, ET, OU, OU exclusif).
df.eq()
,df.ne()
,df.lt()
,df.le()
,df.gt()
,df.ge()
.- Les opérations s'appliquent élément par élément.
Parcourir un DataFrame
- Itérer sur les colonnes.
- Itérer sur les lignes.
Fonctions sur les DataFrames
df.mean()
,df.sum()
,df.prod()
,df.min()
,df.var()
,df.std()
,df.median()
,df.count()
,df.describe()
,df.head()
,df.tail()
,df.head(n)
,df.tail(n)
.
Accès aux fichiers
- Lecture/écriture de fichiers CSV, Excel et SQL.
pd.read_csv()
,pd.read_excel()
,pd.read_sql()
,df.to_csv()
,df.to_excel()
,df.to_sql()
.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.