Document Details

IrreplaceableGyrolite5254

Uploaded by IrreplaceableGyrolite5254

Tags

data collection data sources data analysis information technology

Summary

These are notes on data collection and storage, different data sources, and data analysis tools. The document also mentions various information platforms like the Internet and social media.

Full Transcript

Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources I. LES SOURCES D’INFORMATION ET OUTILS DE VEILLE 1. L’Internet...

Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources I. LES SOURCES D’INFORMATION ET OUTILS DE VEILLE 1. L’Internet -La grande richesse de ce réseau est le nombre d’informations disponibles et accessibles en « Ligne » - Des logiciels du domaine public pour toutes les plateformes matérielles -Les normes et les recommandations techniques de tous bords ; -Les présentations des entreprises, catalogues, organigrammes ; -Des informations diverses ; -Des informations techniques, des thèses, des livres. -Malgré l’importance de cette source, il n’en demeure pas moins qu’elle a ses limites piratage de l’information). 2. LES SOURCES D’INFORMATION INFORMELLES -Les fournisseurs et les clients - Les concurrents - Les colloques - Les comités de normalisation - Les sous-traitants 1 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources 3. LES OUTILS DE LA VEILLE - La bibliométrie: analyse quantitative des productions scientifiques des chercheurs - Les logiciels d’analyse des informations de type texte - Les observatoires - Les plateformes de travail collaboratif - Exemple Les professionnels de la communication utilisent la veille média pour mesurer le succès de leur communication, identifier les stratégies réussies de leur concurrent et analyser la perception de leur marque dans la presse. Elle répond aussi à des besoins de veille concurrentielle, technologique et sectorielle, et permet aux entreprises de rester informées des innovations et tendances de leur marché, en France et à l’international. Des outils de veille média comme Meltwater vous permettent de recevoir chaque jour dans votre boîte mail les dernières actualités ou de mettre en place des alertes dans la journée pour rester réactif et protéger votre e-réputation 2 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources Exemple : Tableau de de bord d’une Analyse complète des médias Nous savons que les professionnels RP et marketing doivent contrôler la gestion de la réputation de leur entreprise. Ces analyses portent sur l’exposition aux médias, les graphiques de part de voix, l’écho social avancé et les fonctions personnalisées de scoring. Nos fonctions d’analyse des médias basées sur les données vous permettent de : Informer les principales parties prenantes Comparer vos propres performances à celles de vos concurrents Suivre l’écho social de vos communiqués de presse, en temps réel Profiter de fonctions personnalisées de scoring 3 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources A. Réseaux sociaux : (quel intérêt pour la veille ?) ❑ Les plateformes du web social et notamment les réseaux sociaux ont générés de nouveaux contenus, des usages innovants qui ont à la fois facilité et complexifié la tâche du veilleur et changé la façon dont ils effectuent la veille digitale. ❑ Il y a des réseaux sociaux mobiles, autour de la musique ou de la vidéo, pour jouer ou apprendre… ❑ Il y a des réseaux pour piloter sa carrière, pour recruter, afficher son personale (ou son Professional), publier, communiquer, vendre ; ❑ sans compter tous les outils qui tournent autour de ces réseaux pour analyser (nombre et origine des visiteurs), mesurer l’influence, gérer plusieurs profils, faciliter la diffusion entre plusieurs comptes, etc ❑ Ils sont privilégiés par les internautes pour partager leurs expériences, recommander des produits ou des lieux qu’ils ont visités et pour manifester leur mécontentement face à un produit décevant. ❑ Les réseaux sociaux sont également excellents pour surveiller ses concurrents de plus près et voir ce qu’ils publient, de quelle manière et à quelle fréquence... 4 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources Les outils de veille réseaux sociaux : La veille médias sociaux permet de suivre en temps réel les conversations qui ont lieu sur les principaux réseaux sociaux (Twitter, Facebook, Instagram…) ainsi que sur les forums, les blogs ou encore les sites d’avis consommateur. Leur usage ne se limite pas à la communication, ils peuvent par exemple servir à détecter des insights consommateurs qui permettront au marketing de prendre de meilleures décisions stratégiques 5 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources a. Surveiller Meta « Facebook » ❑ Facebook est le réseau social le plus utilisé dans le monde avec 2,85 milliards d’utilisateurs; ❑ Il peut être utiliséà titre personnel (carrière, entrepreneurs) et par une entreprise qui utilisera une page pour établir sa présence ; ❑ Il est massivement utilisé par les marketeurs (agences, annonceurs). ❑ Le fonctionnement de Facebook repose sur un moteur de recherche sémantique qui lui permet de savoir quels sont les profils socialement connectés. ❑ Cela va lui permettre de proposer des résultats très personnalisés; ❑ les résultats proposés tiennent compte en effet de ce que le réseau de contacts a recommandé, ce qui peut en faire un instrument intéressant pour le « profilage » de personnes et la veille digitale. 6 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources a. Surveiller Meta « Facebook » Solutions de veille sur Facebook : En raison de la structure et du fonctionnement peu ouvert de Facebook , il n’est pas facile d’y mettre en place une veille. Un marché important de solutions d’écoute des médias sociaux s’est développée : Meltwater: Offre une solution de veille et analyse de la presse en ligne et écrite, des médias sociaux et des podcasts, en collectant les contenus et les conversations, elle veille plus de 300 000 sources d'information dans le monde entier, ainsi que des plateformes de médias sociaux comme Facebook, Twitter,Instagram, des blogs, des forums, YouTube 7 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources a. Surveiller Meta « Facebook » Solutions de veille sur Facebook : Linkfluence: C’est une startup française spécialisée dans l'écoute et l'analyse du web social créée en 2006. Elle est rachetée en 2021 par l'entreprise américaine Meltwater Mention: C’est un outil de surveillance des médias sociaux et du Web. L'outil fournit des alertes en temps réel pour le mot clé d'une entreprise et permet aux utilisateurs de surveiller des millions des ources en temps réel et dans 42 langues 8 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources a. Surveiller Meta « Facebook » Les bonnes pratiques 1- il faut faire attention aux contenus privés ; Les solutions automatiser ne surveille que les pages publiques. 2- faire partie de groupes, notamment professionnels ; C’est un bon moyen de découvrir des experts, ou des informations avant-première, 3-Faire attention à l’instabilité des solutions gratuites ; 4- analyser la désinformation, ou l’origine d’un buzz ; Il peut être intéressant d’utiliser Facebook pour remonter à l’origine d’un bad buzz. Résumé : - Les type de veille que l’entreprise peut faire sur Facebook sont: Veille e-réputation, Veille technologique et Veille concurrentielle. - Intérêt de veille sur Facebook:-Partage d’articles ou documents. - Surveillance des pages d’entreprises - Exploitations des commentaires. - Annonces de nouveaux produits 9 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources b. Surveiller « Twitter» ❑ Twitter est le réseau social qui se prête le plus à la veille, grâce à ses contenus originaux et à son caractère ouvert qui favorise la collecte automatisée. ❑ Au-delà du web social, Twitter est le meilleur média d’information en temps réel. Les entreprises s’appuient sur twitter pour : - Se faire connaître, publier une information, lancer un sondage, informer et s’informer en temps réel… grâce à la simplicité et à la grande viralité de l’outil. -Faire une veille (concurrence, marché, sa marque…). -Toucher des journalistes, des blogueurs, des influenceurs, des leaders d’opinion, -Toucher une cible internationale. (publier des articles internationaux grâce à Twitter). ❑ La collecte des données sur twitter ce fait à partir : de mots clés ; de modèles d’apprentissage; d’un système de géolocalisation, des contenus utiles pour la veille technologique (article de chercheur tweeter, live-tweete durant les conférences 10 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources b. Surveiller « Twitter» Solutions de veille sur twitter ❑ Tweetdeck : C’est une application, créée en 2008 par un tiers, qui permet de consulter et gérer un ou plusieurs comptes Twitter, via une interface graphique composée de plusieurs colonnes. Elle a été rachetée en 2011 par twitter, et est accessible gratuitement en ligne à tous utilisateur du réseau. ❑ L'intérêt de TweetDeck réside dans sa gestion des flux par colonne qui permet de créer un tableau de bord de veille : les flux de l'utilisateur sont représentés sous forme de colonnes, permettant ainsi d'avoir plusieurs flux sur le même écran à suivre simultanément ; il est possible de suivre en parallèle des flux sous forme de: -colonnes qui représentent le flux d'actualités ; -favoris de l'utilisateur ; -flux générer à partir de hashtag ; -comptes Twitter. 11 -messages privés, des listes, etc. Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources b. Surveiller « Twitter» Solutions de veille sur twitter ❑ Tweetdeck : ❑ Inoreader: C’est un lecteur de contenu conçu pour permettre à l’utilisateurs de suivre ses principales sources d'information, le conten u vient directement à l’utilisateur, et lui per met d'économiser le temps et de vérifier chaque site. C’est une solution intéressante pour surveiller Twitter , dans la mesure où l’on peut à la fois surveiller des profils, et collecter automatiquement les articles 12 mentionnant un mot clé ou hashtag donné. Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources b. Surveiller « Twitter» Solutions de veille sur twitter Les bonnes pratiques : 1.Faire attention à la redondance amplifier par les retweets ; Il faut limiter le nombre de profils à suivre et cibler le profil publiant de l’information de première main. 2.S’abonner aux listes pertinentes qui correspondent à un centre d’intérêt thématique. 3. surveiller les abonnés ou abonnements des comptes pertinents pour identifier des nouvelles sources. 4.s’appuyer sur les hashtags les plus pertinents pour la veille. 5.s’appuyer sur des applications tierces comme: -Followerwonk, twittonomy ⤇identifier et comparer les followers -Hashtagify,me ⤇identifier des hashtags -Socioviz ⤇identifier les influenceurs -Warble ⤇automatiser des alertes à partir des contenus tweeter 13 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources b. Surveiller « Twitter» Solutions de veille sur twitter Résumé : ❑ Les type de veille que l’entreprise peut faire sur Twitter sont: Veille e-réputation ,Veille technologique et Veille concurrentielle ❑ Intérêt de veille sur tweeter : -Suivie en temps réel les documents tweetés. -Suivie de live-tweetts de conférences, salons professionnels. -Annonces de nouveaux produits. -Repérage des tendances. -Suivie des offres d’emplois. 14 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources c. Surveiller « LinkedIn» ❑ LinkedIn s’impose comme une solution incontournable de veille en ressource humaines, mais également utiles pour la veille concurrentielle ou commerciale. Tout comme Facebook, LinkedIn reste très fermé et la surveillance ne se fait qu’à travers les flux d’actualités mis à jour quotidiennement à partir des notifications des profils suivis. ❑ LinkedIn est une base très qualifiée, Chaque membre, pour faire la promotion de ses produits ou pour trouver un emploi, renseigne son parcours et ses points forts ; ❑ c’est le réseau des professionnels, son moteur de recherche permet d’effectuer des recherches dans les profils, il est doté de nombreuses fonctionnalités qui donnent des résultats personnalisés en fonction de ce qui peut être plus pertinent pour chaque membre. 15 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources c. Surveiller « LinkedIn» Solutions de veille sur LinkedIn ❑ La plateforme de blogging Pulse permet aux entreprises de publier des articles liés à un produit, une actualité, ou à une expertise particulière, tout en agissant en tant qu'outil de veille. ❑ Pulse est un agrégateur de contenus, Il a été racheté en 2013 par LinkedIn et utilisé comme plateforme de publication de contenu sur LinkedIn réservé aux influenceurs uniquement. Depuis 2015, tous les membres de LinkedIn peuvent y avoir accès pour publier des articles qui sont souvent très intéressants et originaux, mais il n’est pas facile de les identifier s’ils n’ont pas été rédigés par les membres du réseau de l’utilisateur, les experts suggèrent de passer par la recherche avancée de Google en limitant la recherche au site LinkedIn et en incluant le terme Pulse dans l’url. Si l’on recherche des articles sur la veille stratégique par exemple, on pourra donc entrer la requête suivante : « veille stratégique » OR « competitive intelligence » site:linkedin.com in url:pulse ❑ La pratique de la veille la plus efficace via LinkedIn consiste à identifier des interlocuteurs intéressants via des groupes ou des pages, et de mener dans un deuxième temps des entretiens privés 16 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources c. Surveiller « Instagram» ❑ C’était un réseau social principalement utilisé par les jeunes sur des thématiques assez féminines : le luxe, la déco, la beauté, la cuisine, le voyage. Tous les s secteurs dont le vecteur de communication est l’image. ❑ Aujourd’hui, tous les secteurs investissent ce réseau social. Instagram aide à construire rapidement une communauté autour de l’entreprise. ❑ Les bloggeuses de mode l’ont d’ailleurs très bien compris et sont massivement présentes sur Instagram, Pour communiquer sur Instagram, il faut avoir une image ou une vidéo et les #hashtags. ❑ La solution la plus simple pour surveiller les contenus des réseaux sociaux multimédia est de créer un compte sur chaque réseau, le risque de cette approche est l’éparpillement 17 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources B. Agrégateurs de flux RSS (Automatiser la collecte de page web Agrégateurs de fluxRSS) Les outils de veille des sites Web: Les outils de veille web permettent de surveiller le référencement, le trafic ou encore les liens entrants de vos concurrents. Ces outils sont efficaces pour déterminer les stratégies gagnantes de vos concurrents et inspirer la gestion de votre site. Ce sont des outils qui vont donc intéresser plus particulièrement les chargés SEO ( SearchEngineOptimization) et les chargés de content marketing Les flux RSS: acronyme de Really Simple Syndication) est une technologie de veille informationnelle qui détecte les dernières nouveautés ajoutées. Les flux RSS sont un excellent moyen de se tenir informé, ils permettent de suivre l’actualité provenant de blogs, de sites Web (notamment des sites de presse), mais aussi des moteurs de recherche d’actualités. Cet outil permet d’avoir en temps réel des résumés de contenu d’information dans un seul même lecteur de flux RSS ; 18 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources B. Agrégateurs de flux RSS (Automatiser la collecte de page web Agrégateurs de fluxRSS) Contexte : - La mise sous surveillance de flux RSS vient après les étapes de sourcing et de validation des sources repérées. - Une page Web (ou un site) à périodicité régulière vous alertant en cas de changement Les agrégateurs ou lecteurs de flux RSS: Les flux RSS est un fil d’information automatisé, issu d’un site internet, envoyé de façon continue ou non. Un agrégateur de flux RSS est aussi appelé lecteur de flux (ou “reader”). Il s’agit, soit d’une application web, soit d’un service en ligne, soit d’un logiciel, soit d’un module intégré à une messagerie. Les plus connus sont : 19 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources B. Agrégateurs de flux RSS (Automatiser la collecte de page web Agrégateurs de fluxRSS) Feedly: C’est un agrégateur de flux RSS en ligne. Il est accessible par un navigateur internet, et est également disponible sous forme d'application pour smartphone. Il permet, via une interface web ou une application mobile, de gérer et personnaliser les abonnements à des flux RSS 20 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources B. Agrégateurs de flux RSS (Automatiser la collecte de page web Agrégateurs de fluxRSS) Netvibes :Cette application permet de se constituer un site web personnel articulé en module de veille facile à réorganiser avec la possibilité d’intégrer les flux RSS. Mode d’utilisation : Mettre sous surveillance le flux RSS d’un blog : › Rechercher le logo (RSS ou XML) du flux RSS de la page qui vous intéresse. › Copier l’adresse du lien correspondant (commande accessible d’un clic droit sur le logo). › L’intégrer dans votre agrégateur de flux RSS (« collez »). › Régler les options de surveillance des flux qui vous sont proposées par l’outil que vous utilisez 21 Licence Big Data 3 ème année Chapitre 3 : Collecte et sauvegarde des informations : différentes sources B. Agrégateurs de flux RSS (Automatiser la collecte de page web Agrégateurs de fluxRSS) Mettre sous surveillance les résultats d’une recherche dans l’actualité: Les flux RSS vont permettre de mettre en place une veille « radar » qui va renforcer la veille ciblée ;Se rendre sur un moteur de recherche d’actualités. Exemple : Yahoo :actualités : fr.news.yahoo.com Google actualités : https://news.google.com/ › Lancer la recherche par mots-clés. › Classer les résultats par date (« tri par date »). › Copier le flux RSS présent en bas de page. › L’intégrer dans l’agrégateur de flux (« collez ») 22 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 23 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 24 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 25 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 26 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 27 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 28 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 29 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 30 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 31 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 32 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 33 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 34 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 35 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 36 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 37 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 38 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 39 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 40 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 41 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 42 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 43 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 44 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 45 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 46 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 47 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 48 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 49 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 50 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 51 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 52 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 53 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 54 Licence Big Data 3 ème année Chapitre 4 : Cas particulier : collecte des informations depuis internet (Web scraping) 55

Use Quizgecko on...
Browser
Browser