Chapitre 3 - Appréhender l'apprentissage supervisé.odt
Document Details
Uploaded by ReasonedFlute
VISIPLUS Academy
Tags
Full Transcript
Chapitre 3 - Appréhender l\'apprentissage supervisé --------------------------------------------------- appréhender l\'apprentissage supervisé Nous allons nous concentrer sur l\'apprentissage supervisé. Vous allez peut-être vous dire que l\'apprentissage. Prenons un exemple de données que nous allo...
Chapitre 3 - Appréhender l\'apprentissage supervisé --------------------------------------------------- appréhender l\'apprentissage supervisé Nous allons nous concentrer sur l\'apprentissage supervisé. Vous allez peut-être vous dire que l\'apprentissage. Prenons un exemple de données que nous allons recevoir une base de données. Nous observons tout de suite qu\'il y a une grande diversité dans les dans les données sont manquantes orthographe différentes avec ou sans majuscule. certains chiffres comme sur la colonne prix par exemple ou des des formats différents virgule\ apparition du cas pour kilo euro toute cette tâche de préparation et de nettoyage c\'est finalement la tasse la plus compliquée.pour\ Data scientist mais une fois nettoyer réparer les données\ Nettoyer préparer les données finalement cette relativement simple. Dans l\'exemple que nous avons là, nous allons chercher à déterminer le prix d\'un bien immobilier à partir de ses caractéristiques. pour cela définissons tout d\'abord un peu de vocabulaire. C\'est un échantillon parle de ligne parle d\'observation, on parle d\'individus. De la maladie ses caractéristiques ces variables, ce sont ses colonnes en anglais, on parle de si tu veux. Parmi les colonnes, il y en a une qui est un petit peu différente, c\'est celle qu\'on cherche à prédire, c\'est justement la valeur cible la target donc je vais souvent utiliser les termes anglais dans la suite de la formation si tu es sûr et target.la première étape lorsque on a modèle et donné\ Ça va être l\'entraînement en quoi ça consiste. À quoi on prend les features d\'entraînement donc des biens immobiliers, c\'est caractéristiques. On prend également le prix de la route la target et on donne ses deux éléments au modèle le modèle le modèle va ensuite s\'entraîner. Et va déterminer les règles qui relie justement ses caractéristiques à la target\ Une fois que cette première phase est terminée cette phrase d\'entraînement, on passe à la phase d\'exploitation ou la phase d\'inférence, c\'est lorsque le modèle va être utilisé en production dans un carême dans ce cas-là, nous avons que des nouvelles figures, on les donne aux modèles avec ses règles et le modèle va donc nous faire une prédiction. alors attention\ Prédire on n\'est pas expliqué. Ce n\'est pas parce que un modèle va déterminer des règles qui va pouvoir expliquer la cause le modèle ne va voir que des corrélations, c\'est légèrement différent. Voyons un exemple pour ça. On voit deux courbes sur ce graphique du groupe qui sont extrêmement corrélés et inversement. On pourrait penser que l\'une est la cause de l\'autre. Pas du tout ; regardons un peu en détail ce que signifie la première.\ En rouge représente le nombre de noyades dans les piscines aux États-Unis alors que l\'autre en noir représente tout simplement le nombre de films ou Nicolas Cage est apparu. A priori, il y a peu de chance que les deux est une causalité par contre, elles sont extrêmement corrélées pour faire le modèle peut déterminer des corrélation. Mais en aucun cas soyez toujours prudent lorsque vous entraînez un modèle et que vous allez expliquer les corrélations. En apprentissage supervisé, on va retrouver deux types. d\'apprentissage la première apprentissage c est la classification\ On va chercher à prédire un élément parmi une classe déterminée parmi un ensemble fini. par exemple, est-ce que cet email est un spamme première classe est-ce qu\'il va neiger première classe oui il va neiger deuxième classe non il ne va pas neiger l\'autre type d\'apprentissage supervisé c\'est l\'apprentissage supervisé de type régression cette fois-ci, on prédit un nombre continue par exemple, quel est le prix d\'un bien immobilier. quelle sera la température demain combien de temps en seconde avant la prochaine panne on cherche à prédire un nombre continu\ Ce qu\'il faut retenir, c\'est que il avocat un vocabulaire spécifique dans les données, on parle d\'échantillons pour les lignes de colonnes pour les futurs et de Target ou de cible pour la colonne. Un modèle a besoin d\'une première phase, c\'est l\'entraînement et une fois qu\'il est entraîné, on va pouvoir l\'exploiter lors de la phase. Attention car faire des prédictions n\'est pas expliqué le modèle ne fait que chercher des corrélations. Enfin, il y a deux catégories de problèmes supervisés la classification et la régression.