L’apprentissage automatique (Machine Learning) - Séance 2 - PDF
Document Details
Uploaded by ConfidentTourmaline
Université Hassan II de Casablanca
2024
Widad BENGHACHOUA
Tags
Summary
This document is part of a course on machine learning, providing notes and an overview of different learning types. The course touches on topics such as supervised, unsupervised, and reinforcement learning methodologies. It also includes a practical application focusing on predicting test scores.
Full Transcript
Université Hassan II de Casablanca Ecole Supérieure de Technologie de Casablanca DEPARTEMENT GÉNIE ELECTRIQUE Licence génie électrique, automatique et intelligence artificielle Présentation du module Intelligence Artificielle: L’apprentissage automatique (Mac...
Université Hassan II de Casablanca Ecole Supérieure de Technologie de Casablanca DEPARTEMENT GÉNIE ELECTRIQUE Licence génie électrique, automatique et intelligence artificielle Présentation du module Intelligence Artificielle: L’apprentissage automatique (Machine Learning) Séance 2 Présentée par: Widad BENGHACHOUA Année universitaire: 2024/2025 Plan 01 Définition et types d’apprentissage automatique L’apprentissage 02 supervisé Des exemples pratiques I 1 Apprentissage automatique L'apprentissage automatique est un sous-domaine de l'intelligence artificielle (IA) qui se concentre sur le développement d'algorithmes et de modèles statistiques permettant aux ordinateurs d'effectuer des tâches spécifiques sans instructions explicites. Au lieu d'être programmés pour effectuer une tâche, les systèmes d'apprentissage automatique apprennent à partir de données, en identifiant des modèles et en prenant des décisions sur la base de ces informations. 6 Les concepts clés d'apprentissage automatique Au cœur de l'apprentissage automatique se trouvent plusieurs concepts essentiels : Données : Les données, qui peuvent provenir de diverses sources telles que des bases de données, des capteurs ou des interactions avec l'utilisateur, constituent la base de l'apprentissage automatique. La qualité et la quantité des données ont un impact significatif sur les performances des modèles d'apprentissage automatique. Algorithmes: Les algorithmes d'apprentissage automatique sont les procédures mathématiques utilisées pour analyser et apprendre à partir des données. Entrainement et test (training and test): L'ensemble de données est généralement divisé en sous- ensembles d’entrainement et de test. Le processus d’entrainement ou de formation d'un modèle d'apprentissage automatique consiste à lui fournir des données afin qu'il puisse apprendre des modèles, Le processus de test permet d'évaluer les performances du modèle sur des données inédites. Modèle: Un modèle est le résultat du processus d'apprentissage automatique, représentant 6 les modèles ou règles appris à partir des données. Il est utilisé pour faire des prédictions ou prendre des décisions sur la base de nouvelles données d'entrée. Les types d'apprentissage automatique L’idée centrale du machine Learning est d’apprendre à partir de données. Pour cela, il existe trois grandes méthodes d’apprentissage : Apprentissage supervisé: est la branche la plus populaire du machine learning. Il consiste à superviser l’apprentissage de la machine, de la même manière qu’un professeur supervise l’apprentissage de ses élèves en leur montrant des exemples de questions / réponses qu’ils doivent apprendre. L’algorithme est formé sur des données étiquetées, ce qui signifie que les données d'entrée sont associées à la sortie correcte. 6 Les types d'apprentissage automatique Apprentissage non supervisé : consiste à former des algorithmes sur des données sans étiquetées où il laisse la machine apprendre par elle-même certaines structures présentes dans les données, sans la contraindre à apprendre une simple relation d’entrée / sortie. Par exemple, nous pouvons lui présenter les groupes d’animaux vus précédemment, sans préciser s’il s’agit de chats ou de chiens, et lui demander simplement de les regrouper selon leur ressemblance. En examinant simplement les attributs X (tels que la taille, le poids, l’apparence, etc) la machine remarquera d’elle-même que certains animaux se ressemblent par leurs caractéristiques. 6 Les types d'apprentissage automatique Apprentissage par renforcement: Cette méthode, très différente des deux autres, consiste à laisser la machine générer ses propres données issues de son expérience et à apprendre à partir de celles-ci. L’idée est de créer un agent, libre d’entreprendre des actions au sein d’un environnement, et de récompenser cet agent lorsque les actions qu’il choisit de prendre le mènent au résultat souhaité. Par exemple, l’agent pourrait être un petit personnage et l’environnement, un labyrinthe dont il doit trouver la sortie. Pour cela, il est libre de se déplacer dans toutes les directions qu’il souhaite. 6 L’apprentissage supervisé L’apprentissage supervisé comprend principalement deux types de problèmes : la classification et la régression. Objectif : Prédire une valeur continue. Exemples d’utilisation : Prédire le prix d’une maison en fonction de sa superficie, localisation, etc. La régression Prédire le chiffre d’affaires d’une entreprise pour l’année prochaine Modèles courants : - Régression linéaire simple - Régression linéaire multiple 3 Objectif : Prédire une catégorie ou une classe(variable qualitative). Exemples d’utilisation : Identifier le spam dans les e-mails (spam ou non-spam). la classification Diagnostiquer des maladies en fonction de symptômes (maladie A, maladie B, etc.). Modèles courants : : - Régression logistique 3 Algorithme 1: La régression linéaire Simple Exemple explicatif Prédire le prix d'une maison (Y) en fonction de sa surface (X). La surface Le prix 92 25900 95 23700 98 27200 93 23400 100 25200 6 110 27000 Exemple explicatif Prédire le prix d'une maison (Y) en fonction de sa surface (X). trouver la droite 6 Définition La régression linéaire est une technique statistique utilisée pour prédire la relation entre deux variables. On cherche à estimer une relation linéaire par une ligne droite qui passe au plus près des points de données observés. La régression linéaire permet de comprendre et de quantifier comment une variable influence une autre. 6 Objectifs Prédiction : Utiliser une variable connue pour en prédire une autre. Relation : Identifier la relation entre une variable dépendante (la variable que l’on cherche à prédire) et une variable indépendante (celle qu’on utilise pour prédire) Variable dépendante (Y) : La variable que l’on cherche à prédire ou expliquer. Variable indépendante (X) : La variable que l’on utilise pour faire la prédiction. Relation linéaire : Une relation proportionnelle entre X et Y, représentée par une droite. 6 Principe le principe de la régression linéaire simple est de trouver la droite (c’est-à-dire déterminer son équation) qui passe au plus près de l’ensemble des points formés par les couples (xi ; yi). 6 Évaluation Nous cherchons à minimiser les erreurs entre les résultats du modèle et les points de données. le résidu R(i): calculer la différence entre la valeur attendue et la prédiction du modèle pour chaque point (i) = valeur réelle – valeur prédite 6 130 − 150 = -20 Évaluation Avant de faire la somme de tous ces résidus, il est important de s’assurer qu’ils ne puissent pas s’annuler les uns avec les autres. Ps: erreur en image 180 − 160 = 20 Nous élèvons chaque résidu au carré , ce qui permet de n’obtenir que des résidus positifs et nous faisons la somme des carrés des résidus (SSE) Erreur quadratique moyenne (MSE Mean Squad Error ) : en divisant la somme 6 des carrés des résidus (SSE) par le nombre d’observations Anaconda Anaconda est un outil dont la distribution est libre et open source. Il est destiné à la programmation dans un environnement Python et R. Anaconda est largement utilisé en intelligence artificielle. Application Pratique prédire le score d'un test en fonction de nombre d’ d'heures étudiées L’installation des bibliothèques :Ouvrir Anaconda Navigator > cliquer sur CMD.exe prompt > tapez les lignes suivantes: pip install numpy pip install matplotlib pip install scikit-learn 6