Intelligence Artificielle IA - Cours PDF 2024-2025

FASCICULE DE COURS INTELLIGENCE ARTIFICIELLE Semestre 1 PRÉSENTÉ PAR Dr. Chaymae MILOUDI [email protected] 2024-2025 ⚫ |OBJECTIFS DU COURS O...

FASCICULE DE COURS INTELLIGENCE ARTIFICIELLE Semestre 1 PRÉSENTÉ PAR Dr. Chaymae MILOUDI [email protected] 2024-2025 ⚫ |OBJECTIFS DU COURS Objectifs du cours Ce cours vise à ❑ Introduire le domaine de l’Intelligence Artificielle ❑ Présenter les concepts de base de Machine Learning ❑ Maîtriser quelques algorithmes d’apprentissage non supervisé et supervisé ❑ Maîtriser les APIs Python nécessaires pour traiter, analyser et visualiser les données 2024-2025 ⚫ Dr. Chaymae Miloudi 3 Organisation du cours △ Répartition approximative du charge horaire Cours Travaux dirigés Travaux pratiques ±50% ±20% ±30% Evaluation Formule 1 25% Exposé 25% TP 50% Examen Formule 2 45% DS 55% Examen 2024-2025 ⚫ Dr. Chaymae Miloudi 4 Plan du cours Plan du cours (Volet Théorique) ⯆ Introduction générale 1- Initiation au Machine Learning 2- Apprentissage non-supervisé  A- Classification Ascendante Hiérarchique B- K-Moyennes (K-Means) 3- Apprentissage supervisé A- K-plus proches voisins B- Decision tree 4- Réseaux de neurones & Deep Learning 2024-2025 ⚫ Dr. Chaymae Miloudi 6 Plan du cours (Volet Pratique) PARTIE I Calcul scientifique avec PARTIE II Exploration des données avec PARTIE III Visualisation graphique avec & PARTIE IV Apprentissage non supervisé avec PARTIE V Apprentissage supervisé avec 2024-2025 ⚫ Dr. Chaymae Miloudi 7 Introduction générale Intelligence Artificielle (IA) ? =Artificial Intelligence (AI) en anglais Informatique Science du Le concept de l’IA a été proposé en cerveau 1956 par John McCarthy Sciences IA= ensemble des techniques mises en Philosophie IA cognitives œuvre pour réaliser des machines Logique Psychologie intelligentes Linguistique IA devient un cours interdisciplinaire qui implique différents domaines 2024-2025 ⚫ Dr. Chaymae Miloudi 9 Intelligence Artificielle (IA) ? Le besoin de l’IA est apparus pour trois raisons L'explosion de la quantité de données produites et collectées par les humains. L'amélioration et l'accessibilité plus grande des algorithme de traitement des données. L'augmentation exponentielle des capacités de calcul des ordinateurs. 2024-2025 ⚫ Dr. Chaymae Miloudi 10 Approches de l’IA Symbolisme Connexionnisme Actionnisme Les données sont représentés Les données sont représentés Interaction avec par des symboles par un ensemble de nombres, l’environnement de vecteurs ou de matrices Logique mathématique Action + environment Études du cerveau humain 2024-2025 ⚫ Dr. Chaymae Miloudi 11 IA, Apprentissage automatique vs. Apprentissage profond Intelligence Quatre éléments : Données, Algorithmes, Artificielle (IA) Performances, et Scénarios Apprentissage automatique Apprentissage profond 1950 1960 1970 1980 1990 2000 2010 2024-2025 ⚫ Dr. Chaymae Miloudi 12 Histoire de l’IA 1950-1970 1ER ÂGE D’OR 1950 Test de Turing 1956 Naissance du Terme "Intelligence Artificielle" Réseaux de neurones : Perceptron Premier agent conversationnel (chat-bot) : Eliza Logique modale (Il est possible que, il est nécessaire que) Logique floue Recherche de solution par heuristique (A*) 2024-2025 ⚫ Dr. Chaymae Miloudi 12 Histoire de l’IA 1980-1990 2ÈME ÂGE D’OR Perceptron multicouches Systèmes experts : si 𝒙 alors 𝒚 Réseaux bayésiens Cartes auto-organisatrices 1990-2010 Poursuite des travaux sur les réseaux de neurones Algorithmes génétiques / Support Vector Machine (SVM) Systèmes multi-agents 2024-2025 ⚫ Dr. Chaymae Miloudi 13 Histoire de l’IA Depuis 2010 3ÈME ÂGE D’OR Emergence de Machine Learning : Utilisations des bases de données de milliers d’exemples ML en santé Depuis 2016 Emergence de deep Learning ( réseaux de neurones profonds) Victoire du AlphaGo devant le champion du monde Go Big Data : les 4 V (Volume, Vitesse, Variété, Véracité) 2024-2025 ⚫ Dr. Chaymae Miloudi 14 Domaines d’applications Vision par Traitement Traitement du ordinateur de la parole langage naturel 2024-2025 ⚫ Dr. Chaymae Miloudi 15 Domaines d’applications 2024-2025 ⚫ Dr. Chaymae Miloudi 15 Domaines d’applications 2024-2025 ⚫ Dr. Chaymae Miloudi 15 Utilisation de l’IA! Analyse des actions Authentification Recherche des images Reconnaissance Faciale Chatbot Navigation vocale Éducation intelligente Détection de mensonge Traduction automatique Détection des Reconnaissance des Text generation cellules cancéreuses entités nommés 2024-2025 ⚫ Dr. Chaymae Miloudi 16 Quiz 1. L’intelligence artificielle (une seule réponse) □ Fait partie de Machine Learning □ Se focalise pratiquement sur des approches symboliques □ Tente de reproduire une partie de l’intelligence humaine à travers une application ou un système □ Aucune de ces réponses 2. En quelle année l’Intelligence Artificielle est-elle introduite pour la première fois ? (une seule réponse) □ 1946 □ 1960 □ 1916 □1956 3. Quels sont les éléments de l’IA ? (choix multiples) □ Algorithmes □ Performances □ Données □ Scénarios 2024-2025 ⚫ Dr. Chaymae Miloudi 17 CHAPITRE 1 INITIATION AU MACHINE LEARNING Apprentissage automatique Domaine s’intéressant à la conception et le développement d’un ensemble d’algorithmes qui permettent à une machine d’apprendre à résoudre un problème spécifique à partir de données. Fournir les données (Expérience), lui spécifier qu’est ce qu’il faut faire (Tâche), et mesurer la Performance pour savoir si la machine apprend bien Données Algorithme Savoir d’apprentissage Expérience Tâche Performance Prix des maisons Prédire le prix Prix précis Transactions des clients Grouper les clients Groupement cohérent 2024-2025 ⚫ Dr. Chaymae Miloudi 19 Apprentissage automatique vs Algorithme! Données Algorithmes basés sur d’apprentissage des règles Apprentissage faux automatique Condition vrai Code 1 Code 2 Nouvelles Prédiction Modèle données ☺ Les règles sont automatiquement apprises par des machines ☺ Les règles de prise de décision sont complexes ou difficiles à décrire 2024-2025 ⚫ Dr. Chaymae Miloudi 20 Concepts de bases : Dataset! Base de données Ensemble d’apprentissage Ensemble de Test (Dataset) (Training set) (Test set) 2024-2025 ⚫ Dr. Chaymae Miloudi 21 Forme Typique de dataset Descripteurs = Attributs = variables =caractéristiques = Information observation Attribut 1 Attribut 2 Attribut 3 … Classe 1 100 1 AA ⋮ 2 120 0 AB ⋮ Ensemble d’apprentissage 3 60 0 AC ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ Ensemble 5 95 1 AC ⋮ de test ⋮ ⋮ ⋮ ⋮ ⋮ Types de descripteurs : Discret, Binaire ou Continu 2024-2025 ⚫ Dr. Chaymae Miloudi 22 Phases: Training and Testing! 2024-2025 ⚫ Dr. Chaymae Miloudi 22 |PROCESSUS DE ML Processus de ML Collecte de 1- Préparation 2-Apprentissage 3- Validation Déploiement & données de donnés automatique du modèle Intégration du modèle Feedback et itération 2024-2025 ⚫ Dr. Chaymae Miloudi 24 1- Préparation des données A. Détection des descripteurs : Construire l’espace des données qui va être exploré B. Prétraitement Data preprocessing Transformation des données Nettoyage de données (Feature engineering) Normaliser les données pour garantir les Remplacer les valeurs manquantes mêmes plages de valeurs Supprimer les valeurs aberrantes Combiner les descripteurs (Feature expansion) Détecter les anomalies (outliers detection) Discrétisation des données Réduction des données Convertir les attributs continus en Sélectionner les descripteurs attributs sous forme de catégorie Transformer les descripteurs dans un autre espace 2024-2025 ⚫ Dr. Chaymae Miloudi 25 Exemple de dataset! Valeur aberrante # Id Nom Date. N Sexe A1 A2 A3 A4 1 111 John 31/12/1990 M 0 0 Ireland Dublin Valeur manquante 2 222 Mery 15/10/1978 F 1 15 Iceland 3 333 Alice 19/04/2000 F 0 0 Spain Madrid 4 444 Mark 01/11/1997 M 0 0 France Paris Elément 5 555 Alex 15/03/2000 A 1 23 Germany Berlin dupliqué invalide 6 555 Peter 1983-12-01 M 1 10 Italy Rome 7 777 Calvin 05/05/1995 M 0 0 Italy Rome 8 888 Roxane 03/08/1948 F 0 0 Portugal Lisbon 9 999 Anne 05/09/1992 F 0 5 Switzerland Geneva 10 101010 Paul 14/11/1992 M 1 26 Ytali Rome Faute Format invalide d’orthographe 2024-2025 ⚫ Dr. Chaymae Miloudi 26 2- Apprentissage automatique Processus de construction d’un modèle à partir d’un espace de descripteurs Le modèle obtenu est une représentation des relations entre les données dans une base de données, peut être sous forme de graphique, fonction, ou règles Un modèle est ensuite utilisé dans le but de visualisation, description, classification, structuration, explication ou prédiction 2024-2025 ⚫ Dr. Chaymae Miloudi 27 3- Validation du modèle Les modèles extraits ne peuvent être utilisés directement en toute fiabilité Il faut les évaluer, les soumettre à l’épreuve de la réalité et apprécier leur justesse Estimer le taux d’erreur du modèle Améliorer le modèle selon les résultats obtenus Demander l’avis d’un expert pour valider le modèle Déploiement & Intégration du modèle 2024-2025 ⚫ Dr. Chaymae Miloudi 28 Récapitulation* 1 2 3 Input→ Traitement→ Output Feedback Échantillonnage des données+ Apprentissage automatique Validation du modèle préparation des données 6 5 4 Modèle d’ajustement Utilisation du modèle Test du modèle 1. Séparer les données en apprentissage& validation et/ou test + Détection des descripteurs 2. Construction du modèle 3. Accès au modèle à l’aide des données de validation 4. Vérification de la performance du modèle de validation à l’aide des données de test 5. Déploiement du modèle d’apprentissage pour prévoir les nouvelles données 6. Amélioration des performances de l’algorithme 2024-2025 ⚫ Dr. Chaymae Miloudi 29 Quiz 1. L’espace de descripteurs est une représentation matricielle (choix multiples) □ De connaissances □ D’informations □ Où les colonnes sont les descripteurs et les lignes sont les échantillons □ Où les colonnes sont les échantillons et les lignes sont les descripteurs 2. La préparation de données (choix multiples) □ Consiste à déterminer l’espace de descripteurs à utiliser pour l’apprentissage □ Nécessite une étape de prétraitement de données □ Consiste à donner un sens aux données □ Consiste à déployer un modèle d’apprentissage 3. La transformation de données consiste à (une seule réponse) □ Convertir les attributs continus en attributs sous forme de catégorie □ Supprimer les valeurs aberrantes □ Normaliser les données pour garantir les mêmes plages de valeurs □ Sélectionner les descripteurs les plus discriminantes 2024-2025 ⚫ Dr. Chaymae Miloudi 30 |TYPES D’APPRENTISSAGE AUTOMATIQUE Types d’apprentissage automatique Apprentissage Apprentissage Apprentissage Apprentissage par supervisé non-supervisé semi-supervisé renforcement 2024-2025 ⚫ Dr. Chaymae Miloudi 32 Apprentissage supervisé (1/4) Produire automatiquement des règles à partir d’une base de données d’apprentissage étiquetées Prédire la classe de nouvelles données observées Classe (Label)=Target Descripteurs Observation A1 A2 A3 Type 1 1 0.001 12.134 Chat 2 0 0.023 12.001 Chien Ensemble d’apprentissage 3 1 0.456 9.0073 Chat 4 0 0.114 4.0017 Chat 5 0 0.555 19.771 Chien 6 1 0.551 6.9912 Chat Ensemble 7 0 0.020 14.478 ? de test 8 1 0.003 8.1238 ? 2024-2025 ⚫ Dr. Chaymae Miloudi 33 Apprentissage supervisé (2/4) ⚫ Attribut Classe A1 A2 … Ak … Ap Classe → Décrit la valeur d’une donnée V11 V12 → Présente le résultat de la prédiction → Classe= Attribut spécifique → Très couteux à avoir Type de la classe : peut être de type Discret, Binaire ou Continu k=[1..p] avec p est le nombre de descripteurs = dimension de l’espace de descripteurs 2024-2025 ⚫ Dr. Chaymae Miloudi 34 Apprentissage supervisé (3/4) Classification : Prédire des valeurs discrets ⚫ Sera-t-il froid ou chaud demain? Froid (A)/ chaud (B) Régression : Prédire des valeurs continues ⚫ Quelle est la température demain? 2024-2025 ⚫ Dr. Chaymae Miloudi 35 Apprentissage supervisé (4/4) Quelques techniques CLASSIFICATION RÉGRESSION Régression Logistique Support Vector Machine (SVM) Régression Linéaire Réseau de neurones Arbres de décision Random Forest Gradient Boosting Decision Tree (GBDT) K-Nearst Neighbors (KNN) Naïve Bayes 2024-2025 ⚫ Dr. Chaymae Miloudi 36 Apprentissage non-supervisé (1/3) Apprentissage basé sur le calcul de similarité : les données similaires soient dans le même group Les classes sont inconnues→ pas de cible (pas d’étiquette) Observation A1 A2 … Classe 1 1 12.3 … 2 0 14 … 3 0 12 … Absent 4 0 11 … 5 1 10.2 … 6 1 22.1 … ⋮ ⋮ ⋮ ⋮ 2024-2025 ⚫ Dr. Chaymae Miloudi 37 Apprentissage non-supervisé (2/3) Utilisations  Segmentation & Regroupement (Clustering)  Réduction de dimensionnalité (Dimensionality reduction)  Détection d’anomalies (Outlier Detection) 2024-2025 ⚫ Dr. Chaymae Miloudi 38 Apprentissage non-supervisé (3/3) Quelques techniques DIMENSIONALITY OUTLIER CLUSTERING REDUCTION DETECTION Classification Ascendante Hiérarchique K-Moyenne (K-means) Principal component analysis Isomap One class SVM Isolation Forest 2024-2025 ⚫ Dr. Chaymae Miloudi 39 Apprentissage semi-supervisé (1/2) Utilise les données étiquetées pour compéter des données non-étiquetées Utilise ses propres prédictions pour s’améliorer à chaque itération Techniques les plus connues : Auto-apprentissage (self-training) Co-apprentissage (Co-training) 2024-2025 ⚫ Dr. Chaymae Miloudi 40 Apprentissage semi-supervisé (2/2) Auto-apprentissage A1 A2 Type A1 A2 Type 1 Val1 Val3 C1 1 Val1 Val3 C1 2 Val1 Val4 C2 2 Val1 Val4 C2 3 Val2 Val4 C2 Classifieur1 3 Val2 Val4 C2 Classifieur1 4 Val1 Val5 C2 4 Val1 Val5 C2 … 5 Val2 Val5 ? 5 Val2 Val5 C1 C1 6 Val2 Val3 ? 6 Val2 Val3 ? C2 7 Val2 Val4 ? 7 Val2 Val4 ? a. Entrainer un classifieur avec les données étiquetées b. Étiqueter une observation incomplète en utilisant le classifieur généré dans a c. Ajouter l’observation étiquetée aux données d’apprentissage d. Ré-entrainé le classifieur sur les nouveaux données d’apprentissage e. Répéter les étapes a, b et c jusqu’à satisfaire un critère d’arrêt (classifieur performant) 2024-2025 ⚫ Dr. Chaymae Miloudi 41 Apprentissage par renforcement (1/2) L’apprentissage est guidé par l’environnement sous la forme de récompenses ou de pénalités données en fonction de l’erreur commise lors de l’apprentissage Le modèle perçoit l’environnement (action a t), prend des mesures, et fait des ajustements et des choix en fonction de l’état 𝐬𝐭, et de la récompense ou de la pénalité 𝐫𝐭 Modèle Itératif & Récompense ou Action interactif État 𝐬𝐭 at pénalité 𝐫𝐭 rt+1 st+1 Environment 2024-2025 ⚫ Dr. Chaymae Miloudi 42 Apprentissage par renforcement (2/2) ⚫ Exemple Mango Erreur! Feedback Apple Apple noté Entrée Réponse Feedback Apprentissage Réponse Action : pomme ou non ? → La machine apprend à partir des feedbacks → Pénalité → Répéter l’action 2024-2025 ⚫ Dr. Chaymae Miloudi 43 Quiz 1.L’apprentissage supervisé (choix multiples) □ Est appliqué pour constituer des groupes d’objets homogènes et différenciés □ Consiste à utiliser des données brutes pour prédire des connaissances □ Est appliqué principalement pour la prédiction □ Nécessite des échantillons étiquetés par un ou plusieurs classes 2.L’apprentissage semi-supervisé (une seule réponse) □ Minimise l’erreur sur la base de test □ Consiste à prédire une variable continue □ Consiste à apprendre les actions, à partir d’expériences □ Utilise les données étiquetées pour compéter les données non-étiquetées 3. Quelle est la technique qui n’appartient pas à l’apprentissage supervisé ? (une seule réponse) □ Réseaux de neurones □ Arbre de décision □ Random Forest □ K-means 2024-2025 ⚫ Dr. Chaymae Miloudi 44

Intelligence Artificielle IA - Cours PDF 2024-2025

Document Details

Tags

Related

Summary

Full Transcript