CM1 - Introduction au Machine Learning

Podcast

Play an AI-generated podcast conversation about this lesson

Download our mobile app to listen on the go

Get App

Questions and Answers

Quelle est la principale fonction d'un modèle discriminatif dans le contexte de la classification supervisée ?

Modéliser directement les frontières entre les différentes classes de données. (correct)
Apprendre les structures internes de chaque classe de données.
Estimer la probabilité qu'une instance appartienne à une classe spécifique.
Générer de nouvelles instances de données similaires aux données d'entraînement.

Dans l'apprentissage automatique, quel est l'impact principal de la 'malédiction de la dimensionnalité' sur les performances des modèles ?

Elle augmente la complexité du modèle, nécessitant plus de données pour une généralisation efficace. (correct)
Elle nécessite moins de données pour entraîner efficacement les modèles.
Elle réduit le risque de sur-apprentissage en simplifiant l'espace des caractéristiques.
Elle améliore la capacité du modèle `a identifier des motifs complexes dans les données.

Quelle est la principale utilité de la méthode Expectation-Maximization (EM) en apprentissage automatique ?

Réduire la dimensionnalité des données en sélectionnant les caractéristiques les plus pertinentes.
Éviter le sur-apprentissage en pénalisant les modèles trop complexes.
Traiter les ensembles de données contenant des valeurs manquantes. (correct)
Améliorer la vitesse de convergence des algorithmes d'optimisation.

Dans un réseau de neurones, quel est le rôle principal des couches cachées (Hidden Layers) ?

Extraire des caractéristiques complexes des données en appliquant des calculs (pondérations et biais). (C)

Signup and view all the answers

Comment la fonction d'activation ReLU (Rectified Linear Unit) contribue-t-elle à améliorer les performances des réseaux de neurones profonds ?

Elle simplifie les calculs et atténue certains problèmes liés à la sigmoïde, comme le vanishing gradient. (D)

Signup and view all the answers

Dans le contexte de l'apprentissage par rétropropagation, pourquoi est-il important de diviser les données en lots (batches) ?

Pour paralléliser les calculs et optimiser l'utilisation de la mémoire. (C)

Signup and view all the answers

Quel est l'effet principal d'un taux d'apprentissage (learning rate) trop élevé lors de l'entraînement d'un réseau de neurones ?

Le modèle risque de ne jamais converger, oscillant autour du minimum. (B)

Signup and view all the answers

Quelle est la fonction principale de l'optimiseur Stochastic Gradient Descent (SGD) dans le contexte des réseaux de neurones ?

Ajuster les poids du réseau pour minimiser la fonction de perte. (B)

Signup and view all the answers

Pourquoi la normalisation par batch (Batch Normalization) est-elle une technique importante dans l'entraînement des réseaux de neurones profonds ?

Elle facilite la convergence et réduit l'hétérogénéité des gradients. (D)

Signup and view all the answers

Dans le contexte des séries temporelles, quel est le rôle du rééchantillonnage (subsampling/oversampling) ?

Homogénéiser les données en ajustant la fréquence d'échantillonnage. (A)

Signup and view all the answers

Quelle est la principale limitation des réseaux de neurones classiques (MLP) lorsqu'ils sont appliqués à des séries temporelles ?

Ils nécessitent des données de tailles fixes en entrée et sortie. (C)

Signup and view all the answers

Comment les réseaux de neurones récurrents (RNN) surmontent-ils la limitation de mémoire des MLP lors du traitement de séquences ?

En utilisant des connexions récurrentes pour conserver une mémoire des étapes précédentes. (D)

Signup and view all the answers

Quelle est la principale fonction des portes logiques (gates) dans les cellules LSTM (Long Short-Term Memory) ?

Réguler quelles informations conserver ou oublier. (D)

Signup and view all the answers

Quels sont les principaux avantages des CNN 1D par rapport aux RNN pour l'analyse des séries temporelles ?

Les CNN 1D sont plus efficaces pour détecter les motifs locaux. (D)

Signup and view all the answers

Dans le contexte des CNN, quelle est la fonction d'une carte de caractéristiques (feature map) ?

Mettre en évidence les informations pertinentes extraites par les filtres (kernels). (B)

Signup and view all the answers

Pourquoi l'invariance de translation est-elle une propriété importante des CNN dans le traitement d'images ?

Elle permet de détecter des motifs peu importe leur localisation dans une image. (A)

Signup and view all the answers

Quelle est la principale différence entre Max Pooling et Average Pooling dans un CNN ?

Max Pooling sélectionne la valeur maximale dans la région, tandis qu'Average Pooling calcule la valeur moyenne. (B)

Signup and view all the answers

Comment les Skip Connections (Connexions Résiduelles) contribuent-elles à améliorer l'entraînement des réseaux de neurones très profonds ?

En contournant les problèmes de gradients nuls. (C)

Signup and view all the answers

Dans le contexte des CNN, qu'est-ce qu'un exemple adversarial (adversarial example) ?

Une entrée spécialement conçue pour tromper le réseau. (A)

Signup and view all the answers

Quel est l'objectif principal de l'apprentissage par transfert (transfer learning) dans le contexte des réseaux de neurones ?

Réutiliser des modèles pré-entraînés pour réduire les temps d'entraînement. (B)

Signup and view all the answers

Dans l'apprentissage supervisé, quel est le rôle principal d'un ensemble de données étiquetées ?

Fournir des exemples d'entrée avec les sorties correctes correspondantes pour l'entraînement du modèle. (A)

Signup and view all the answers

Quelle est la caractéristique principale de l'apprentissage auto-supervisé qui le distingue de l'apprentissage supervisé traditionnel ?

Il génère lui-même les étiquettes à partir des données d'entrée. (A)

Signup and view all the answers

Dans un réseau de neurones, quel est le rôle de la fonction de perte (loss function) ?

Quantifier l'écart entre les prédictions du modèle et les valeurs réelles. (C)

Signup and view all the answers

Quelle est la différence fondamentale entre l'erreur quadratique moyenne (MSE) et l'entropie croisée en tant que fonctions de perte ?

MSE est utilisée pour la régression, tandis que l'entropie croisée est utilisée pour la classification. (C)

Signup and view all the answers

Dans le contexte de l'apprentissage automatique, pourquoi les modèles complexes sont-ils souvent considérés comme des 'boîtes noires' ?

Il est difficile de comprendre comment ils prennent des décisions. (B)

Signup and view all the answers

Quel est l'objectif principal de l'approche d'apprentissage autonome (autonomous learning) en intelligence artificielle ?

Développer des systèmes capables d'apprendre et de s'adapter sans intervention humaine. (C)

Signup and view all the answers

Dans le contexte des graphes, qu'est-ce qu'un nœud (ou sommet) ?

Une entité ou un objet. (B)

Signup and view all the answers

Quel est l'objectif principal des réseaux de neurones graphiques (GNN) ?

Traiter des données sous forme de graphes. (B)

Signup and view all the answers

Quelle est l'étape d'agrégation dans les réseaux de neurones graphiques (GNN)?

Chaque nœud collecte des informations de ses voisins. (A)

Signup and view all the answers

Comment les Graph Attention Networks (GAT) améliorent-ils les réseaux de neurones graphiques (GNN) traditionnels ?

En utilisant un mécanisme d'attention pour pondérer l'importance des voisins. (C)

Signup and view all the answers

Dans le contexte des transformateurs (transformers), quel est le rôle de l'encodeur ?

Transformer les données d'entrée en une représentation interne. (C)

Signup and view all the answers

Qu'est-ce que le mécanisme d'attention permet aux transformateurs de réaliser ?

Se concentrer sur des parties spécifiques des données d'entrée. (C)

Signup and view all the answers

Quelle est la principale caractéristique du Graphormer qui le distingue des transformateurs traditionnels ?

Il intègre des informations structurelles des graphes. (B)

Signup and view all the answers

Quelle technique d'apprentissage automatique pourrait être utilisée pour identifier des groupes de clients similaires en fonction de leurs comportements d'achat, sans connaître à l'avance les catégories ?

Clustering (apprentissage non supervisé) (C)

Signup and view all the answers

Quelle étape est cruciale avant d'appliquer des modèles de séries temporelles pour améliorer la qualité de l'analyse ?

Le prétraitement des séries temporelles . (A)

Signup and view all the answers

Quelle méthode aide à traiter les séries temporelles en palliant les lacunes des réseaux de neurones classiques (MLP) ?

CNN 1D (D)

Signup and view all the answers

Quelles sont les étapes clés du fonctionnement des Réseaux de Neurones Graphiques (GNN) ?

Agrégation, combinaison (C)

Signup and view all the answers

Flashcards

Reconnaissance ou classification

Identifier et associer des données à des concepts.

Régression

Estimer des valeurs intermédiaires.