Podcast
Questions and Answers
Quels sont les principaux types de tableaux que l'on peut manipuler avec Pandas?
Quels sont les principaux types de tableaux que l'on peut manipuler avec Pandas?
Series, DataFrames, Panels et multiIndex.
Comment importer la librairie Pandas dans un script Python?
Comment importer la librairie Pandas dans un script Python?
En utilisant la commande import pandas as pd
.
Quelles sont les trois méthodes pour créer une série dans Pandas?
Quelles sont les trois méthodes pour créer une série dans Pandas?
À partir d'une liste, d'un dictionnaire ou d'un tableau Numpy.
Quel type de données peut contenir un tableau Pandas?
Quel type de données peut contenir un tableau Pandas?
Signup and view all the answers
Quel est le rôle d'un DataFrame dans Pandas?
Quel est le rôle d'un DataFrame dans Pandas?
Signup and view all the answers
Comment peut-on créer une série avec cinq zéros dans Pandas?
Comment peut-on créer une série avec cinq zéros dans Pandas?
Signup and view all the answers
Quels éléments sont essentiels dans un DataFrame?
Quels éléments sont essentiels dans un DataFrame?
Signup and view all the answers
Quelle est la commande utilisée pour écrire un DataFrame vers un fichier tabulé?
Quelle est la commande utilisée pour écrire un DataFrame vers un fichier tabulé?
Signup and view all the answers
Quelle méthode utiliseriez-vous pour déterminer le type des éléments d'une série dans Pandas?
Quelle méthode utiliseriez-vous pour déterminer le type des éléments d'une série dans Pandas?
Signup and view all the answers
Comment accède-t-on à un élément d'une série par son numéro?
Comment accède-t-on à un élément d'une série par son numéro?
Signup and view all the answers
Quelle est la différence entre pd.DataFrame
et pd.DataFrame.from_dict
?
Quelle est la différence entre pd.DataFrame
et pd.DataFrame.from_dict
?
Signup and view all the answers
Comment obtenir le nombre de dimensions d'une série?
Comment obtenir le nombre de dimensions d'une série?
Signup and view all the answers
Quel est le rôle de serie.shape
dans un tableau?
Quel est le rôle de serie.shape
dans un tableau?
Signup and view all the answers
Quelles valeurs sont utilisées par défaut pour l'index d'un dataframe si aucun n'est spécifié?
Quelles valeurs sont utilisées par défaut pour l'index d'un dataframe si aucun n'est spécifié?
Signup and view all the answers
Comment nommer l'index d'un dataframe?
Comment nommer l'index d'un dataframe?
Signup and view all the answers
Quel attribut permet de connaître le nombre total d'éléments d'une série?
Quel attribut permet de connaître le nombre total d'éléments d'une série?
Signup and view all the answers
Quel est le résultat de df.shape
sur un DataFrame avec 3 colonnes et 5 lignes?
Quel est le résultat de df.shape
sur un DataFrame avec 3 colonnes et 5 lignes?
Signup and view all the answers
Comment ajouter une colonne nommée 'C' à un DataFrame existant 'df'?
Comment ajouter une colonne nommée 'C' à un DataFrame existant 'df'?
Signup and view all the answers
Que signifie df.ndim
et quel type de valeur retourne-t-il?
Que signifie df.ndim
et quel type de valeur retourne-t-il?
Signup and view all the answers
Comment initialiser un DataFrame avec 2 lignes et 0 colonnes?
Comment initialiser un DataFrame avec 2 lignes et 0 colonnes?
Signup and view all the answers
Quel type d'éléments renvoie df.size
sur un DataFrame de 4 lignes et 3 colonnes?
Quel type d'éléments renvoie df.size
sur un DataFrame de 4 lignes et 3 colonnes?
Signup and view all the answers
Quelle méthode utilise-t-on pour obtenir la somme de tous les éléments d'une colonne 'A' d'un DataFrame?
Quelle méthode utilise-t-on pour obtenir la somme de tous les éléments d'une colonne 'A' d'un DataFrame?
Signup and view all the answers
En quoi consiste l'accès par index dans un DataFrame?
En quoi consiste l'accès par index dans un DataFrame?
Signup and view all the answers
Quelle expression Python permet d'imprimer les noms des colonnes d'un DataFrame?
Quelle expression Python permet d'imprimer les noms des colonnes d'un DataFrame?
Signup and view all the answers
Quelle fonction utilise-t-on pour retourner le produit de valeurs dans une DataFrame?
Quelle fonction utilise-t-on pour retourner le produit de valeurs dans une DataFrame?
Signup and view all the answers
Comment calcule-t-on l'écart-type d'une série de valeurs dans une DataFrame?
Comment calcule-t-on l'écart-type d'une série de valeurs dans une DataFrame?
Signup and view all the answers
Quelle fonction permet de compter le nombre de cellules non-NA dans une DataFrame?
Quelle fonction permet de compter le nombre de cellules non-NA dans une DataFrame?
Signup and view all the answers
Quel est le rôle de la fonction df.describe() dans l'analyse de données?
Quel est le rôle de la fonction df.describe() dans l'analyse de données?
Signup and view all the answers
Comment afficher les 10 premières lignes d'une DataFrame?
Comment afficher les 10 premières lignes d'une DataFrame?
Signup and view all the answers
Quel est l'argument par défaut de la fonction pd.read_csv pour le séparateur?
Quel est l'argument par défaut de la fonction pd.read_csv pour le séparateur?
Signup and view all the answers
Comment lire un fichier Excel dans une DataFrame en utilisant pandas?
Comment lire un fichier Excel dans une DataFrame en utilisant pandas?
Signup and view all the answers
Quelle méthode est utilisée pour écrire une DataFrame dans un fichier CSV?
Quelle méthode est utilisée pour écrire une DataFrame dans un fichier CSV?
Signup and view all the answers
Study Notes
Module Pandas
- Pandas est une librairie Python pour manipuler facilement des données.
- Elle permet de manipuler des tableaux de données avec des étiquettes de variables (colonnes) et des lignes.
- Ces tableaux sont appelés Series (une dimension), DataFrames (deux dimensions), Panels (trois dimensions) et multiIndex (plus de trois dimensions).
- On peut lire et écrire des DataFrames dans des fichiers tabulés.
- Les tableaux Pandas peuvent contenir des données de différents types (numériques, chaînes de caractères, booléens).
- Des graphiques peuvent être créés à partir de DataFrames grâce à matplotlib.
- Pour utiliser Pandas, on écrit :
import pandas as pd
Les Séries Pandas
- Une série est un vecteur de valeurs d'une variable.
- On peut créer une série:
- À partir d'une liste.
- À partir d'un dictionnaire.
- À partir d'un tableau Numpy.
- On peut spécifier des indices aux séries.
Caractéristiques d'une série
-
type(serie)
: Retourne le type de la structure. -
serie.dtype
: Retourne le type des éléments. -
serie.ndim
: Retourne le nombre de dimensions. -
serie.size
: Retourne le nombre d'éléments. -
serie.shape
: Retourne le nombre de lignes et de colonnes.
Accéder aux éléments d'une série
- Accès par numéro (origine à 0).
- Accès par index.
- L'accès par index renvoie
None
si l'index n'existe pas. - L'accès par numéro lève une exception si l'index n'existe pas.
-
df[début:fin:pas]
oudf.iloc[début:fin:pas]
pour sélectionner les éléments d'une plage.
Les DataFrames Pandas
- Un DataFrame se comporte comme un dictionnaire dont les clés sont les noms des colonnes et les valeurs sont des séries.
- Le nom des lignes est appelé index.
- L'index peut être une chaîne de caractères ou un entier.
- Par défaut, l'index est une suite continue d'entiers à partir de 0.
- On peut créer un DataFrame:
- À partir d'une liste.
- À partir d'un dictionnaire.
- À partir de séries.
Caractéristiques d'un DataFrame
-
type(df)
: Retourne le type de la structure. -
df.ndim
: Retourne le nombre de dimensions du tableau. -
df.size
: Retourne le nombre d'éléments du tableau. -
df.shape
: Retourne le nombre de lignes et de colonnes du tableau.
Accéder aux éléments d'un DataFrame
- Accès par numéro (origine à 0).
- Accès par index.
Modifier un DataFrame
- Modifier les valeurs d'un DataFrame.
- Insérer une colonne dans un DataFrame.
- Ajouter / supprimer une ligne.
- Supprimer une colonne.
-
loc
pour accéder à des lignes et colonnes par nom -
iloc
pour accéder à des lignes et colonnes par position
Tri d'un DataFrame
- Tri selon les étiquettes (index).
- Tri selon les valeurs d'une colonne.
-
sort_values
pour trier par valeurs
Opérations sur les DataFrames
- Opérations arithmétiques (+, -, *, /, //, %, **).
- Opérations de comparaison (==, !=, <, <=, >, >=).
- Opérations logiques (NON, ET, OU, OU exclusif).
-
df.eq()
,df.ne()
,df.lt()
,df.le()
,df.gt()
,df.ge()
. - Les opérations s'appliquent élément par élément.
Parcourir un DataFrame
- Itérer sur les colonnes.
- Itérer sur les lignes.
Fonctions sur les DataFrames
-
df.mean()
,df.sum()
,df.prod()
,df.min()
,df.var()
,df.std()
,df.median()
,df.count()
,df.describe()
,df.head()
,df.tail()
,df.head(n)
,df.tail(n)
.
Accès aux fichiers
- Lecture/écriture de fichiers CSV, Excel et SQL.
-
pd.read_csv()
,pd.read_excel()
,pd.read_sql()
,df.to_csv()
,df.to_excel()
,df.to_sql()
.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Testez vos connaissances sur la librairie Pandas en Python. Ce quiz couvre les Series, DataFrames, et l'importation des données. Évaluez votre compréhension des fonctionnalités clés et de la manipulation de données.