10 Questions
Que fait la méthode 'isnull().sum()' utilisée dans ce code?
Compte le nombre de valeurs manquantes dans chaque colonne du DataFrame
Quel est le but de la ligne de code 'df['CA'] = df['Gross'].fillna('0').str.replace('$', '').str.replace('M', '').astype(float) * 1000000'?
Calculer le chiffre d'affaires en millions de dollars pour chaque film
Quelle fonction est utilisée pour créer une nouvelle variable 'ID' dans le DataFrame?
factorize()
Quelle est l'utilité de la condition 'df['TYPE1'] = np.where(df['RunTime'].fillna(0) > 60, 'Film', np.where(df['RunTime'].notnull(), 'Série', 'Inconnu'))'?
Classer les films en deux catégories : Films et Séries, selon leur durée
Quelle est l'utilité de la condition 'df['TYPE2'] = np.where(df['YEAR'].str.contains('–').fillna(False), 'Série', np.where(df['YEAR'].notnull(), 'Film', 'Inconnu'))'?
Classer les contenus en deux catégories : Films et Séries, selon l'année de sortie
Que fait la fonction 'pd.factorize(df['MOVIES']) + 1' dans ce contexte?
Crée un nouvel identifiant unique pour chaque film
'df['CA']= df['CA'].map("{:.2f}".format)' a pour objectif principal de:
Formater correctement le chiffre d'affaires pour afficher 2 décimales
'df.replace('nan', np.nan, inplace=True)' a pour but principal de :
Remplacer les chaînes 'nan' par des valeurs NaN dans tout le DataFrame
'df['ID'].map(df['ID'].value_counts()).fillna(0) > 1' classe les films en fonction de :
Le nombre d'occurrences de chaque identifiant dans la colonne 'ID'
'df.duplicated().sum()' renvoie :
1
Learn how to import movie data from CSV files using Pandas in Python. Explore techniques such as specifying delimiters, skipping initial spaces, and handling different file structures. Analyze the imported data using methods like 'info()' to understand the dataset's structure.
Make Your Own Quizzes and Flashcards
Convert your notes into interactive study material.
Get started for free