Podcast
Questions and Answers
Comment l'apprentissage supervisé diffère-t-il de l'apprentissage non supervisé dans le contexte de l'acquisition de connaissances?
Comment l'apprentissage supervisé diffère-t-il de l'apprentissage non supervisé dans le contexte de l'acquisition de connaissances?
L'apprentissage supervisé implique un professeur ou un guide qui fournit des commentaires et des corrections, tandis que l'apprentissage non supervisé se fait par association et exploration autonomes.
Outre la simple mémorisation, quels sont les deux aspects essentiels de ce que signifie "savoir apprendre" d'après le texte?
Outre la simple mémorisation, quels sont les deux aspects essentiels de ce que signifie "savoir apprendre" d'après le texte?
Élaborer un système de connaissances à partir des données et pouvoir intégrer de nouvelles connaissances dans ce système.
Comment le "savoir raisonner" contribue-t-il à la production de nouvelles connaissances et de décisions?
Comment le "savoir raisonner" contribue-t-il à la production de nouvelles connaissances et de décisions?
Le savoir raisonner permet de déduire des conclusions et d'anticiper des résultats à partir du système de connaissances existant et des données disponibles.
En dehors de la mémoire, nommez deux autres attributs qui sont présentés comme des composantes potentielles de l'intelligence.
En dehors de la mémoire, nommez deux autres attributs qui sont présentés comme des composantes potentielles de l'intelligence.
Dans le contexte de l'ensemble de données sur le cancer du sein, pourquoi l'attribut "Épaisseur de la masse" (Clump Thickness) est-il important pour la classification des tumeurs?
Dans le contexte de l'ensemble de données sur le cancer du sein, pourquoi l'attribut "Épaisseur de la masse" (Clump Thickness) est-il important pour la classification des tumeurs?
Citez deux attributs de l'ensemble de données sur l'arythmie qui pourraient être utilisés pour prédire le risque de problèmes cardiaques chez un patient.
Citez deux attributs de l'ensemble de données sur l'arythmie qui pourraient être utilisés pour prédire le risque de problèmes cardiaques chez un patient.
Si vous deviez utiliser les données de l’ensemble de données sur le cancer du sein pour former un réseau neuronal, quelle serait la variable cible et pourquoi?
Si vous deviez utiliser les données de l’ensemble de données sur le cancer du sein pour former un réseau neuronal, quelle serait la variable cible et pourquoi?
Dans l'ensemble de données d'arythmie, plusieurs attributs sont de type 'linéaire'. Donnez un exemple d'attribut linéaire et expliquez pourquoi ce type d'attribut est utile dans l'analyse des données.
Dans l'ensemble de données d'arythmie, plusieurs attributs sont de type 'linéaire'. Donnez un exemple d'attribut linéaire et expliquez pourquoi ce type d'attribut est utile dans l'analyse des données.
Comment les systèmes experts diffèrent-ils des réseaux de neurones en matière de prise de décision basée sur les données?
Comment les systèmes experts diffèrent-ils des réseaux de neurones en matière de prise de décision basée sur les données?
En quoi l'évolution de l'intelligence artificielle a-t-elle influencé l'intégration de différentes modalités sensorielles, telles que la vision et la voix, dans les systèmes robotiques?
En quoi l'évolution de l'intelligence artificielle a-t-elle influencé l'intégration de différentes modalités sensorielles, telles que la vision et la voix, dans les systèmes robotiques?
Quelle est la place des réseaux de neurones dans le traitement du langage naturel, et comment contribuent-ils à la compréhension du langage par rapport aux approches plus traditionnelles?
Quelle est la place des réseaux de neurones dans le traitement du langage naturel, et comment contribuent-ils à la compréhension du langage par rapport aux approches plus traditionnelles?
Décrivez comment l'utilisation de Python
et de la bibliothèque scikit-learn
(sklearn
) facilite la mise en œuvre et l'expérimentation avec des modèles de machine learning lors des séances de travaux dirigés (TD).
Décrivez comment l'utilisation de Python
et de la bibliothèque scikit-learn
(sklearn
) facilite la mise en œuvre et l'expérimentation avec des modèles de machine learning lors des séances de travaux dirigés (TD).
Comment les quiz réguliers (15 mn) sur la plateforme Moodle, associés aux travaux pratiques, contribuent-ils à l'évaluation continue et à la consolidation des connaissances des étudiants en machine learning ?
Comment les quiz réguliers (15 mn) sur la plateforme Moodle, associés aux travaux pratiques, contribuent-ils à l'évaluation continue et à la consolidation des connaissances des étudiants en machine learning ?
Expliquez comment l'interaction entre les domaines de la vision artificielle, du traitement du langage naturel et de la robotique, illustrée dans le schéma de l'intelligence artificielle, permet de créer des systèmes plus intelligents et polyvalents.
Expliquez comment l'interaction entre les domaines de la vision artificielle, du traitement du langage naturel et de la robotique, illustrée dans le schéma de l'intelligence artificielle, permet de créer des systèmes plus intelligents et polyvalents.
Quelle est la différence fondamentale entre l'approche basée sur des systèmes experts et celle utilisant des réseaux de neurones pour la classification de données en intelligence artificielle ?
Quelle est la différence fondamentale entre l'approche basée sur des systèmes experts et celle utilisant des réseaux de neurones pour la classification de données en intelligence artificielle ?
En considérant le rôle de l'intelligence artificielle dans la prise de DECISION
, citez un exemple concret où l'utilisation des réseaux de neurones permettrait d'améliorer significativement la Classification
ou la Détection
dans un domaine spécifique.
En considérant le rôle de l'intelligence artificielle dans la prise de DECISION
, citez un exemple concret où l'utilisation des réseaux de neurones permettrait d'améliorer significativement la Classification
ou la Détection
dans un domaine spécifique.
Dans le contexte de l'apprentissage supervisé, comment la 'Signification' complète-t-elle l''Observation' pour former un exemple d'apprentissage, et quel est le but de cette combinaison?
Dans le contexte de l'apprentissage supervisé, comment la 'Signification' complète-t-elle l''Observation' pour former un exemple d'apprentissage, et quel est le but de cette combinaison?
Expliquez comment la dimension de l'espace de décision (K) est liée au type de problème d'apprentissage supervisé, en donnant un exemple spécifique pour la classification.
Expliquez comment la dimension de l'espace de décision (K) est liée au type de problème d'apprentissage supervisé, en donnant un exemple spécifique pour la classification.
Quelle est la différence fondamentale entre une variable qualitative nominale et une variable qualitative ordinale, et donnez un exemple de chacune qui pourrait être pertinente pour l'ensemble de données 'Auto MPG'.
Quelle est la différence fondamentale entre une variable qualitative nominale et une variable qualitative ordinale, et donnez un exemple de chacune qui pourrait être pertinente pour l'ensemble de données 'Auto MPG'.
Dans le contexte de la matrice de données (DxN), expliquez ce que représentent D et N, et décrivez comment cette matrice est utilisée dans l'apprentissage d'un réseau de neurones.
Dans le contexte de la matrice de données (DxN), expliquez ce que représentent D et N, et décrivez comment cette matrice est utilisée dans l'apprentissage d'un réseau de neurones.
Comment la fonction de classification 'h : X → Y' est-elle utilisée pour prédire la sortie 'ydj' étant donné une observation 'Xj'?
Comment la fonction de classification 'h : X → Y' est-elle utilisée pour prédire la sortie 'ydj' étant donné une observation 'Xj'?
Dans l'ensemble de données 'Auto MPG', quelles sont les caractéristiques considérées comme 'continues' et comment leur nature affecte-t-elle le choix des algorithmes d'apprentissage machine?
Dans l'ensemble de données 'Auto MPG', quelles sont les caractéristiques considérées comme 'continues' et comment leur nature affecte-t-elle le choix des algorithmes d'apprentissage machine?
Expliquez, en termes de formalisation mathématique, comment une variable quantitative (ydi ∈ ℝ) est utilisée dans un problème de régression. Quel est le but de la régression dans ce contexte?
Expliquez, en termes de formalisation mathématique, comment une variable quantitative (ydi ∈ ℝ) est utilisée dans un problème de régression. Quel est le but de la régression dans ce contexte?
Dans le contexte de l'analyse du trafic routier pour discriminer les camions des autres véhicules, identifiez quelques 'caractéristiques' ou 'variables explicatives' qui pourraient être utilisées pour entraîner un réseau de neurones.
Dans le contexte de l'analyse du trafic routier pour discriminer les camions des autres véhicules, identifiez quelques 'caractéristiques' ou 'variables explicatives' qui pourraient être utilisées pour entraîner un réseau de neurones.
Dans le contexte de l'algorithme k-PPV, comment la décision est-elle prise lorsque k = 1 et comment cela diffère-t-il lorsque k > 1?
Dans le contexte de l'algorithme k-PPV, comment la décision est-elle prise lorsque k = 1 et comment cela diffère-t-il lorsque k > 1?
Décrivez comment la distance est utilisée dans l'algorithme k-PPV pour déterminer les voisins les plus proches.
Décrivez comment la distance est utilisée dans l'algorithme k-PPV pour déterminer les voisins les plus proches.
Quelle est la différence majeure entre l'utilisation de k = 3 et k = 7 dans un algorithme k-PPV en termes de décision de classification, selon les informations fournies?
Quelle est la différence majeure entre l'utilisation de k = 3 et k = 7 dans un algorithme k-PPV en termes de décision de classification, selon les informations fournies?
Comment l'augmentation de la valeur de 'disp' (dispersion) affecte-t-elle la distribution des exemples dans les graphiques présentés et quel est l'impact potentiel sur la classification?
Comment l'augmentation de la valeur de 'disp' (dispersion) affecte-t-elle la distribution des exemples dans les graphiques présentés et quel est l'impact potentiel sur la classification?
Expliquez le concept d'unanimité dans le contexte de l'algorithme k-PPV et comment il peut conduire au 'rejet'.
Expliquez le concept d'unanimité dans le contexte de l'algorithme k-PPV et comment il peut conduire au 'rejet'.
Dans un scénario où les classes ne sont pas uniformément distribuées, comment la prise en compte de la distance dans l'algorithme k-PPV peut-elle améliorer la précision de la classification?
Dans un scénario où les classes ne sont pas uniformément distribuées, comment la prise en compte de la distance dans l'algorithme k-PPV peut-elle améliorer la précision de la classification?
Si vous deviez choisir une valeur de 'k' pour un ensemble de données où les frontières de décision sont très irrégulières, serait-il préférable d'utiliser une petite ou une grande valeur de 'k' et pourquoi?
Si vous deviez choisir une valeur de 'k' pour un ensemble de données où les frontières de décision sont très irrégulières, serait-il préférable d'utiliser une petite ou une grande valeur de 'k' et pourquoi?
Dans l'algorithme k-PPV, comment la 'complexité de calcul' évolue-t-elle avec l'augmentation du nombre d'exemples dans l'ensemble d'apprentissage et quel est l'impact sur les performances du modèle?
Dans l'algorithme k-PPV, comment la 'complexité de calcul' évolue-t-elle avec l'augmentation du nombre d'exemples dans l'ensemble d'apprentissage et quel est l'impact sur les performances du modèle?
Comment le choix d'une faible valeur de k affecte-t-il la sensibilité au bruit dans un classificateur k-PPV ?
Comment le choix d'une faible valeur de k affecte-t-il la sensibilité au bruit dans un classificateur k-PPV ?
Quels sont les deux inconvénients majeurs de l'algorithme k-PPV en termes de ressources de calcul et de mémoire ?
Quels sont les deux inconvénients majeurs de l'algorithme k-PPV en termes de ressources de calcul et de mémoire ?
En quoi l'algorithme k-PPV est-il considéré comme 'lazy learning' et quel avantage cela procure-t-il ?
En quoi l'algorithme k-PPV est-il considéré comme 'lazy learning' et quel avantage cela procure-t-il ?
Comment l'algorithme k-PPV s'adapte-t-il à la régression, et quelle formule est utilisée pour calculer la valeur de sortie y?
Comment l'algorithme k-PPV s'adapte-t-il à la régression, et quelle formule est utilisée pour calculer la valeur de sortie y?
Quel est l'intérêt d'utiliser l'algorithme k-PPV comme algorithme 'baseline' dans le contexte de l'évaluation de la complexité d'un problème ?
Quel est l'intérêt d'utiliser l'algorithme k-PPV comme algorithme 'baseline' dans le contexte de l'évaluation de la complexité d'un problème ?
Décrivez comment la réduction de dimension peut être utilisée comme accélérateur pour l'algorithme k-PPV.
Décrivez comment la réduction de dimension peut être utilisée comme accélérateur pour l'algorithme k-PPV.
Outre la réduction de dimension, quelle autre technique de 'datamining' peut être utilisée pour accélérer l'algorithme k-PPV et comment cela fonctionne-t-il ?
Outre la réduction de dimension, quelle autre technique de 'datamining' peut être utilisée pour accélérer l'algorithme k-PPV et comment cela fonctionne-t-il ?
Pourquoi le réglage du paramètre k est-il considéré comme un inconvénient de l'algorithme k-PPV ?
Pourquoi le réglage du paramètre k est-il considéré comme un inconvénient de l'algorithme k-PPV ?
Quelle est la différence principale entre une base d'apprentissage et une base de test lors de l'évaluation des performances d'un réseau de neurones?
Quelle est la différence principale entre une base d'apprentissage et une base de test lors de l'évaluation des performances d'un réseau de neurones?
Expliquez comment le taux d'erreur (TE) est lié au taux de reconnaissance (TR) dans le contexte de l'évaluation d'un classifieur multiclasse.
Expliquez comment le taux d'erreur (TE) est lié au taux de reconnaissance (TR) dans le contexte de l'évaluation d'un classifieur multiclasse.
Décrivez l'utilité d'une matrice de confusion dans l'analyse des performances d'un classifieur multiclasse.
Décrivez l'utilité d'une matrice de confusion dans l'analyse des performances d'un classifieur multiclasse.
Si un classifieur a un taux de reconnaissance de 90%, quel est son taux d'erreur, et que signifie ce taux d'erreur en termes de performance du classifieur?
Si un classifieur a un taux de reconnaissance de 90%, quel est son taux d'erreur, et que signifie ce taux d'erreur en termes de performance du classifieur?
Dans le contexte des réseaux de neurones, pourquoi est-il important d'utiliser une base de test distincte de la base d'apprentissage?
Dans le contexte des réseaux de neurones, pourquoi est-il important d'utiliser une base de test distincte de la base d'apprentissage?
Comment l'étude des confusions, mentionnée dans le contexte multiclasse, aide-t-elle à améliorer un système de classification?
Comment l'étude des confusions, mentionnée dans le contexte multiclasse, aide-t-elle à améliorer un système de classification?
En utilisant l'algorithme du plus proche voisin (PPV) avec k=1, comment classeriez-vous un nouveau véhicule avec x1=15 et x2=12, en vous basant sur les points de données fournis (❶(8,10), ❷(13,15), ❸(17,9))?
En utilisant l'algorithme du plus proche voisin (PPV) avec k=1, comment classeriez-vous un nouveau véhicule avec x1=15 et x2=12, en vous basant sur les points de données fournis (❶(8,10), ❷(13,15), ❸(17,9))?
Quels sont les avantages et inconvénients potentiels de l'utilisation du 3-PPV (3 plus proches voisins) par rapport au 1-PPV pour la classification dans un problème donné?
Quels sont les avantages et inconvénients potentiels de l'utilisation du 3-PPV (3 plus proches voisins) par rapport au 1-PPV pour la classification dans un problème donné?
Flashcards
Intelligence Artificielle (IA)
Intelligence Artificielle (IA)
Domaine informatique visant à simuler l'intelligence humaine.
Machine Learning
Machine Learning
Un sous-domaine de l'IA axé sur l'apprentissage à partir de données.
Langage Naturel
Langage Naturel
Compréhension et génération du langage humain par les machines.
Vision Artificielle
Vision Artificielle
Signup and view all the flashcards
Robotique
Robotique
Signup and view all the flashcards
Voix (Reconnaissance)
Voix (Reconnaissance)
Signup and view all the flashcards
Systèmes Experts
Systèmes Experts
Signup and view all the flashcards
Classification
Classification
Signup and view all the flashcards
Savoir Apprendre
Savoir Apprendre
Signup and view all the flashcards
Savoir Raisonner
Savoir Raisonner
Signup and view all the flashcards
Posséder une histoire (mémoire)
Posséder une histoire (mémoire)
Signup and view all the flashcards
Posséder des sentiments
Posséder des sentiments
Signup and view all the flashcards
Posséder une conscience
Posséder une conscience
Signup and view all the flashcards
Breast cancer dataset
Breast cancer dataset
Signup and view all the flashcards
Sample code number
Sample code number
Signup and view all the flashcards
Arrythmia dataset
Arrythmia dataset
Signup and view all the flashcards
Qu'est-ce qu'un dataset multivarié ?
Qu'est-ce qu'un dataset multivarié ?
Signup and view all the flashcards
Qu'est-ce que Xj dans l'apprentissage supervisé ?
Qu'est-ce que Xj dans l'apprentissage supervisé ?
Signup and view all the flashcards
Qu'est-ce qu'une 'feature' (caractéristique) ?
Qu'est-ce qu'une 'feature' (caractéristique) ?
Signup and view all the flashcards
Qu'est-ce qu'une variable quantitative ?
Qu'est-ce qu'une variable quantitative ?
Signup and view all the flashcards
Qu'est-ce qu'une variable qualitative ?
Qu'est-ce qu'une variable qualitative ?
Signup and view all the flashcards
Qu'est-ce qu'une fonction de classification h(X) ?
Qu'est-ce qu'une fonction de classification h(X) ?
Signup and view all the flashcards
Qu'est-ce que 'ydj' ?
Qu'est-ce que 'ydj' ?
Signup and view all the flashcards
Qu'est-ce que la matrice de dimension (DxN) ?
Qu'est-ce que la matrice de dimension (DxN) ?
Signup and view all the flashcards
PPV(X) (Plus Proche Voisin)
PPV(X) (Plus Proche Voisin)
Signup and view all the flashcards
k=1 dans k-PPV
k=1 dans k-PPV
Signup and view all the flashcards
k ≠ 1 dans k-PPV
k ≠ 1 dans k-PPV
Signup and view all the flashcards
Décision par vote (k-PPV)
Décision par vote (k-PPV)
Signup and view all the flashcards
Unanimité ou rejet
Unanimité ou rejet
Signup and view all the flashcards
Importance de la distance
Importance de la distance
Signup and view all the flashcards
1-PPV (1-Plus Proche Voisin)
1-PPV (1-Plus Proche Voisin)
Signup and view all the flashcards
Dispersion
Dispersion
Signup and view all the flashcards
Base de généralisation
Base de généralisation
Signup and view all the flashcards
Performances opérationnelles
Performances opérationnelles
Signup and view all the flashcards
% TR : Taux de reconnaissance
% TR : Taux de reconnaissance
Signup and view all the flashcards
% TE : Taux d'erreur
% TE : Taux d'erreur
Signup and view all the flashcards
% Tr : Taux de rejet
% Tr : Taux de rejet
Signup and view all the flashcards
Matrice de confusion
Matrice de confusion
Signup and view all the flashcards
#(X\y=i&yd=j)
#(X\y=i&yd=j)
Signup and view all the flashcards
PPV (Plus Proches Voisins)
PPV (Plus Proches Voisins)
Signup and view all the flashcards
Dilemme biais-variance
Dilemme biais-variance
Signup and view all the flashcards
Faible valeur de k
Faible valeur de k
Signup and view all the flashcards
Grande valeur de k
Grande valeur de k
Signup and view all the flashcards
Avantages de k-PPV
Avantages de k-PPV
Signup and view all the flashcards
Inconvénients de k-PPV
Inconvénients de k-PPV
Signup and view all the flashcards
k-PPV comme baseline
k-PPV comme baseline
Signup and view all the flashcards
Accélérer k-PPV
Accélérer k-PPV
Signup and view all the flashcards
Fonction distance(ex1, ex2)
Fonction distance(ex1, ex2)
Signup and view all the flashcards
Study Notes
- Le module Machine Learning est dirigé par Lionel Prevost, responsable du Learning, Data & Robotics Lab à l'ESIEA, et joignable par mail à [email protected].
Organisation du module
- Le module comprend 24 heures en face à face, dont 12 heures de cours et 15 heures de travaux dirigés sur machine en utilisant Python/sklearn.
- L'évaluation des connaissances se fait par des quiz de 15 minutes sur Moodle à chaque TP et par un examen.
Introduction à l'intelligence artificielle
- L'intelligence artificielle englobe des domaines comme la robotique, la vision, le langage naturel, la voix, les réseaux de neurones, les systèmes experts et la compréhension.
- Le processus de l'intelligence artificielle implique la collecte de données, leur traitement, et la prise de décisions telles que la classification, la détection, la découverte et l'action.
Qu'est-ce qu'être intelligent ?
- Être intelligent implique la capacité d'apprendre, c'est-à-dire d'élaborer un système de connaissances à partir de données et d'intégrer de nouvelles données supervisées ou non.
- Être intelligent c'est aussi savoir raisonner (déduire, anticiper) à partir de l'expérience pour produire des décisions et de nouvelles connaissances.
- Cela requiert de posséder une mémoire (court/long terme), des sentiments (ressentir/exprimer une émotion) et une conscience.
Exemples de datasets
- Dataset sur le cancer du sein avec 699 instances et 10 attributs, où la classe indique si la tumeur est bénigne (2) ou maligne (4).
- Dataset sur l'arythmie cardiaque permettant de distinguer la présence ou l'absence d'arythmie et de la classifier en 16 groupes, avec 452 instances et 279 attributs.
- Dataset Auto MPG(miles per gallon) comprenant 398 instances et 8 attributs, incluant des informations sur la consommation, les cylindres, la cylindrée, la puissance, le poids, l'accélération, l'année du modèle, l'origine et le nom du véhicule.
Formalisation
- En apprentissage supervisé, un exemple est défini comme une observation associée à une signification.
- L'observation est un vecteur aléatoire Xᵢ composé de descripteurs ou "features" (x₁, x₂,... x_D), qui peuvent être qualitatifs (nominaux/ordinaux) ou quantitatifs (continus/discrètes).
- "D" représente la dimension de l'espace de représentation.
- La signification(y_dj) peut être une variable quantitative, menant à une régression, ou une variable qualitative, menant à une classification.
- "K" est la dimension de l'espace de décision, correspondant au nombre de classes.
- Une fonction de classification "h" transforme l'espace des entrées "X" en espace des sorties "Y", telle que h(X₁) ≈ y_dj.
- Une base de données est une matrice de dimension DxN, où D est le nombre de dimensions et N le nombre d'exemples.
Exemple d'analyse de trafic routier
- Il s'agit d'un problème de discrimination camion/autres véhicules basé sur deux descripteurs: la longueur(m) et le bruit(dB).
- Chaque véhicule est classé comme camion(1) ou autre véhicule(-1).
- Un exemple est un camion avec une longueur de 20m et un bruit de 8dB, classé comme camion.
Décider sans apprendre : plus proche voisin
- On utilise une méthode de décision sans apprentissage basée sur l'algorithme du plus proche voisin.
- L'approche utilise un ensemble d'exemples de référence "E", chacun étant un vecteur étiqueté Xᵢ avec sa classe associée y_di.
- L'objectif est de déterminer la classe d'un vecteur inconnu "X".
- La méthode consiste à calculer les distances entre "X" et tous les vecteurs Xᵢ de "E" et à attribuer à "X" la classe de son plus proche voisin(distance minimum).
- La distance euclidienne(norme L2) entre deux vecteurs X₁ et X₂ est calculée comme la racine carrée de la somme des carrés des différences entre leurs composantes.
Interprétation géometrique
- Les frontières de décision obtenues avec l'algorithme du plus proche voisin sont linéaires par morceaux.
- Les classes sont définies par la réunion des domaines d'influence des références, et la précision de la résolution spatiale des frontières est liée à la densité des références.
Extension: k-plus-proches-voisins
- Calculer la distance entre X et tous les exemples de la base de référence.
- Déterminer les k vecteurs PPV(X) de la base les plus proches.
- Si k= 1, la classe est déterminée par l'argument minimum de la distance d(Xᵢ,X).
- Si k≠1, la classe est déterminée par la classe majoritaire des vecteurs PPV(X).
- Variante : exiger l'unanimité, sinon rejeter, ou prendre en compte la distance.
Dilemme biais-variance
- Le choix du paramètre "k" dans l'algorithme des k-plus-proches-voisins influence directement les propriétés du classifieur.
- Une faible valeur de "k" conduit à une bonne résolution avec des frontières complexes, mais rend le modèle très sensible au bruit.
- Une grande valeur de "k" conduit à une faible résolution avec un lissage des frontières, rendant le modèle peu sensible au bruit.
Avantages
- L'algorithme du plus proche voisin est simple à mettre en œuvre ("lazy learning") et naturellement multiclasse.
- De plus, il est incrémental et tend asymptotiquement vers l'erreur optimale, et s'adapte facilement à la régression.
Inconvénients
- Le stockage des références est une contrainte, ainsi que la quantité de calculs proportionnelle au nombre de références.
- L'algorithme ne permet pas d'extraction d'information utile et nécessite le réglage du paramètre "k".
Exercice TD
- Analyser les BDD des transparents 9-10-11 et déterminer leurs caractéristiques(dimension, nombre d'exemples…).
- Coder les algorithmes 1-ppv et k-ppv(langage*).
- Savoir déterminer graphiquement des frontières en 2D.
Performances dans le contexte du Machine Learning
- La performance se mesure en utilisant une base d'apprentissage/de référence et une base de test/de généralisation, qui évalue la capacité à classer de nouvelles données inconnues et les performances opérationnelles.
- Le taux de reconnaissance(TR) représente la proportion de classifications correctes, tandis que le taux d'erreur(TE) représente la proportion de classifications incorrectes, et le taux de rejet(Tr) indique la proportion d'instances rejetées par le modèle.
- En classification multiclasse, une matrice de confusion est utilisée pour évaluer les performances en comparant les classes prédites(y) avec les classes réelles(y_d).
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Le texte traite de l'apprentissage supervisé et non supervisé, de l'importance de savoir apprendre et raisonner. Il aborde également l'intelligence, le cancer du sein et les ensembles de données sur l'arythmie. L'épaisseur de la masse et d'autres attributs sont essentiels pour la classification des tumeurs et la prédiction des problèmes cardiaques.