CM Enjeux des Données PDF
Document Details
Uploaded by Deleted User
Tags
Related
- Protection des Données à Caractère Personnel PDF
- Traitement des données de santé : Aspects pratiques, techniques et réglementaires - Sorbonne Université - PDF
- 5.0_Les Données.pdf
- Appel d'offres pour la construction d'une école maternelle - Côte d'Ivoire PDF
- Missing Data in Clinical Research Analysis PDF
- 5 Astuces pour Protéger Vos Données Personnelles (PDF)
Summary
Ce document présente des cours sur divers sujets liés aux données, tels que les définitions, l'évolution, les enjeux éthiques et les perspectives critiques. Il comprend différents chapitres (CM1 à CM6) dédiés à des aspects spécifiques des données et de leur utilisation, comme la datavisualisation, la physicalisation, l'Open Data et les intelligences artificielles. Le document aborde également l'importance des choix de collecte, de traitement et d'utilisation des données.
Full Transcript
CM1 Définitions et Nature des Données - Définition : Une donnée est une description élémentaire (ex: prix, vitesse). - Différentes natures de données : Personnelles: Sensibles, biométriques. Publiques (open data). Données industrielles et d’audience. - Exemples d’utilisation : IA géné...
CM1 Définitions et Nature des Données - Définition : Une donnée est une description élémentaire (ex: prix, vitesse). - Différentes natures de données : Personnelles: Sensibles, biométriques. Publiques (open data). Données industrielles et d’audience. - Exemples d’utilisation : IA générative, algorithmes de recommandation. Évolution Technologique et Datafication - Big Data: Révolution numérique (fin des années 2000). - Loi de Moore: Augmentation de la capacité de stockage et de calcul. - Datafication: Transformation des pratiques et objets en données numériques. Enjeux pour la Communication et les Médias - Stratégie: Législation des données, analyse des tendances. - Création de contenu: Usage d’IA, datavisualisation. - Réputation et performance: Connaissance des algorithmes, analyse des métriques. Débats et Perspectives Critiques -Questions clés: Les données sont-elles neutres ou construites ? -Aspects sociaux et politiques: Importance des choix de collecte, traitement et des effets sociaux des données. CM2 Introduction à la Datavisualisation - Débat de fin de cours : Fiabilité ou orientation des représentations graphiques. - Datavisualisation : Représentation visuelle de données structurées, aidant à leur interprétation. Principes et Objectifs - But: Faciliter la compréhension rapide des données et les rendre accessibles. - Concepts-clés : Jacques Bertin : Graphiques comme réduction cognitive, relations identifiables entre données. Edward Tufte: Critique des mauvaises visualisations. Principes d’excellence graphique: éviter l’ambiguïté, la distorsion, et les distractions. Exemples et Applications - Types de Datavisualisation : Différenciation entre datavisualisation et infographie Visualisations notables : W.E.B. du Bois pour l’exposition universelle de 1900, Florence Nightingale pour améliorer l’hygiène militaire. Enjeux et Perspectives - Critiques : Vision de la datavisualisation comme pratique « universelle » remise en question par les théories de Data Feminism. - Place des émotions : Exemple du projet Periscopic sur les armes à feu, intégrant une dimension émotionnelle. À Retenir - La datavisualisation est une technique communicationnelle à fort impact. - Pratique située: Son interprétation dépend du contexte culturel et social de chaque public. CM3 Introduction à la Physicalisation des Données - Physicalisation: Technique de représentation des données sous forme physique, facilitant une interaction sensorielle. - Origines historiques: Exemples anciens (tablettes sumériennes, quipus incas). - Question : Une représentation graphique est-elle fiable ou orientée ? Éléments de la Physicalisation 1. Données: Source de base pour toute représentation. 2. Mise en forme : Choix du type d'objet ou de matériau pour donner une forme physique aux données. 3. Questionnement : Définition de l’angle de traitement et du message à communiquer. Types et Avantages - Types de physicalisation : Statique : Représentations fixes (ex: maquette de bâtiment). Dynamique : Objets interactifs ou programmables. - Avantages: Accessibilité accrue (ex : adapté pour les non-voyants). Engagement du public et apprentissage intuitif. Processus de Création (Huron, 2017) 1. Préparation des données : Choix et nettoyage. 2. Idéation : Définir les questions et scénarios. 3. Sélection du matériel : Choix des objets ou matériaux. 4. Réalisation : Conception de l’objet. 5. Réflexion : Analyse de l’impact de la représentation. Objectifs et Conclusion Objectifs : Faciliter l’exploration et la compréhension des données, renforcer l'engagement public et promouvoir la littératie des données. Conclusion : La physicalisation est une science émergente, enrichissant l’approche pédagogique et pratique des données dans des contextes variés. CM4 1. Introduction et définitions Données publiques Produites dans le cadre d'une mission de service public Par une administration, collectivité ou délégataire de service public Obligation de restitution des données à la collectivité (loi "République numérique") Degrés d'ouverture 1. Données "secret défense" 2. Données ouvertes sous conditions (ex: Health Data Hub) 3. Données ouvertes à tous (Open Data) 2. L'Open Data : Fondements et valeurs Définition Données librement accessibles et réutilisables Mouvement d'ouverture des données publiques Valeurs fondamentales Démocratiques ○ Transparence ○ Bien commun Sociétales ○ Intelligence collective ○ Efficacité administrative ○ Création de valeur économique 3. Historique Dates clés 1789 : Déclaration des droits de l'homme (droit de demander des comptes) 1978 : Loi CADA en France 2007 : Rencontre Open Government Group 2009 : Appel "Raw data now!" de Tim Berners-Lee 2011 : Création d'Etalab en France 2016 : Loi pour une République Numérique 4. Principes techniques 8 principes fondamentaux 1. Données complètes 2. Données primaires 3. Données "fraîches" 4. Données accessibles 5. Données exploitables par machines 6. Données non discriminatoires 7. Format ouvert 8. Licence ouvre Conditions de réutilisation Technique Juridique Économique Sociale 5. Infrastructure et exemples Portails de données (France) Échelle nationale : data.gouv.fr Échelle régionale : data.laregion.fr Échelle départementale Échelle métropolitaine Exemples de réutilisation 1. Projets citoyens ○ Open Food Facts/Yuka ○ OpenStreetMap/Pokémon Go 2. Projets institutionnels ○ nosdeputes.fr ○ Applications immobilières ○ Outils COVID-19 6. Limites et problèmes Faible réutilisation Utilisateurs majoritairement experts Peu d'intérêt citoyen "Politique de l'offre" Problèmes techniques Documentation insuffisante Données mal structurées Mise à jour irrégulière Découvrabilité limitée Enjeux éthiques Données non neutres Risques de renforcement des discriminations Impact social à relativiser CM5 Les Algorithmes : Définitions, Types et Enjeux 1. Origines et définition basique Origines historiques Terme dérivé d'Al-Khwarizmi (mathématicien perse du 9ème siècle) Considéré comme "le père de l'algèbre" Définition simple Programme de calcul plus ou moins complexe Traite des données Omniprésent dans notre quotidien Plus ou moins visible 2. Comprendre les algorithmes par analogie Trois analogies principales 1. Le tri des chaussettes 2. La recette de cuisine Ingrédients → Données Étapes → Séquences d'instruction Indications → Instructions formalisées Plat final → Produit de données 3. Le mode d'emploi Éléments communs Ensemble de données à traiter Mécanisme de traitement Automatisation du traitement Nouveau produit de données 3. Types d'algorithmes principaux 1. Algorithmes de tri Exemple : recherche dans un dictionnaire Classement selon des critères définis 2. Algorithmes d'appariement Exemple : applications de rencontre Mise en relation selon des critères de compatibilité 3. Algorithmes de recommandation Personnalisation des propositions Basé sur : Préférences personnelles Comportements similaires Popularité des contenus 4. Algorithmes de chiffrement Sécurisation des échanges Transformation des données avec clé 4. Niveaux de compréhension 1. Niveau technique Méthode de traitement Ensemble de procédés systématiques Opérations sur les données 2. Niveau stratégique Production sociale Objectifs définis Satisfaction de besoins identifiés 3. Niveau politique Organisation du pouvoir Impact sur la vie sociale et culturelle Influence sur l'organisation sociétale 5. Enjeux dans les industries culturelles Contexte Incertitude radicale sur la valeur des biens/services Société de l'hyperchoix Multiplication des contenus Problématiques 1. Choix et recommandation Orientation par identification Recherche d'originalité Enjeu de satisfaction/captation 2. Profilage Fin de la segmentation traditionnelle Multiplication des sources de données Analyse des activités en ligne Débats Tension entre découverte et habitudes Questions éthiques et sociétales Impact sur la diversité culturelle CM6 Les Intelligences Artificielles : Fondamentaux et Enjeux 1. Définitions essentielles Origine du terme : Expression créée lors de la conférence de Dartmouth en 1956 Définition générale : Système automatisé capable de faire des prévisions, recommandations ou décisions influant sur des environnements réels ou virtuels Principe : Faire réaliser à une machine des tâches considérées comme intelligentes si réalisées par un humain 2. Histoire et évolution Deux approches principales : A. IA Symbolique (1953-1997) Principe : Imitation du raisonnement humain via des règles précises Dates clés : ○ 1956 : Conférence de Dartmouth ○ 1972 : MYCIN (diagnostic médical) ○ 1997 : Deep Blue bat Kasparov aux échecs B. IA Connexionniste (1940-présent) Principe : Imitation du fonctionnement du cerveau via des réseaux de neurones Dates clés : ○ 1943 : Premier modèle mathématique de réseau neuronal ○ 1955 : Invention du Perceptron ○ 2012 : Reconnaissance d'images par Google ○ 2022 : Lancement de ChatGPT Périodes de "Hivers de l'IA" Premier hiver (1973-1980) : Rapport Lighthill, baisse des financements Second hiver (1987-1993) : Limites des systèmes experts 3. Fonctionnement moderne IA Génératives Définition : Technologies entraînées sur des données massives pour générer de nouveaux contenus Fonctionnement : Entrée (prompt) → Modèle IA → Sortie 4. Enjeux éthiques majeurs Atteinte à la vie privée Limitation de la liberté de choix Risques de discrimination Impact environnemental Manque de transparence Automatisation du travail 5. Limites importantes Performance inférieure au cerveau humain Besoin important en ressources Tâches très spécialisées Absence d'adaptabilité et de créativité autonome Dépendance aux données d'entraînement Points clés à retenir 1. L'IA est une discipline scientifique, pas une entité unique 2. Il existe de multiples types d'IA avec des approches différentes 3. Les capacités actuelles restent limitées par rapport à l'intelligence humaine 4. Les enjeux éthiques sont nombreux et doivent être considérés