Data Mining e Business dei Dati PDF
Document Details
Tags
Summary
This presentation discusses the concepts of Data Mining and the Business of Data. It covers topics like data mining techniques, tools, business intelligence, and the importance of data warehousing for data analysis.
Full Transcript
Data Mining e data business Data Mining e business dei dati OTTIMIZZAZIONE Proscrizionale Qual è la cosa migliore...
Data Mining e data business Data Mining e business dei dati OTTIMIZZAZIONE Proscrizionale Qual è la cosa migliore Analitica che può accadere? MODELLAZIONE PREDITTIVA PREVISIONE Aggiunta di valore Predittivo Quali sono le Azienda Analitica tendenze? Analitica ANALISI STATISTICA AVVISI Quali azioni sono necessarie? Descrittivo Analitica QUERY OLAP Azienda Intelligenza RELAZIONI AD HOC Quanti, con quale frequenza, dove? RAPPORTI STANDARD Attività di data mining SLIDE 1: Introduzione al Data Mining Data Mining: Trovare modelli utili in set di dati. Scoperta della conoscenza nelle banche dati (KDD): Identificare modelli utili e comprensibili. Applicazione nel decision-making aziendale. Sofisticatezza: Oltre analisi dati di base, impiega algoritmi complessi. SLIDE 2: Tecniche e Applicazioni del Data Mining Uso nel rispondere a domande analitiche. Scoperta di cause, anomalie, clustering di clienti, previsioni. Strumenti per analisi: Python, R, RapidMiner, SAS, SPSS. Esempi: Regressione, clustering. SLIDE 3: I Dati come Nuovo Petrolio Metafora: "I dati sono il nuovo petrolio" (Clive Humby, 2006). Dati come materia prima richiedono elaborazione. Analogia: Dati = Petrolio greggio, Informazioni = Benzina, Conoscenza = Energia. Processo: Dati grezzi → Informazioni utili → Conoscenza per decisioni. SLIDE 4: Decision-making Basato sui Dati Trasformazione: Dati → Informazioni → Conoscenza. Ruolo degli analisti: Convertire dati in informazioni per decisioni aziendali. Importanza della conoscenza basata sui dati nel processo decisionale. Dati : informazioni, misurazioni, transazioni, opinioni ed elementi che Dati raccogliamo dai nostri clienti, transazioni, la base per Attraverso l'analisi diventa rispondere alle domande. Informazione - una volta Informazione analizzati i dati rispondendo a E poi ci informiamo domande e traendo conclusioni; Ci informiamo. Conoscenza - ora possiamo Conoscenza fare scelte informate su cosa fare - formulare Quindi sappiamo cosa raccomandazioni su come agire; Sappiamo cosa fare. FIGURA 1.3 Il processo decisionale data-driven. SLIDE 5: Business Intelligence vs. Business Analytics Business Intelligence: Analisi descrittiva, riporta dati passati. Strumenti BI: ERP, CRM per reportistica. Business Analytics: Approfondimenti, previsioni, utilizza data mining. Evoluzione degli strumenti BI: Inclusione di capacità di data mining. SLIDE 6: Capacità Analitiche in Ambiente Aziendale Aspettative: Personale aziendale capace di analisi dati base con strumenti come Excel. Analisi dati avanzata richiede maggiore competenza. Valore dell'analisi dei dati: Maggiore impatto rispetto alla semplice analisi descrittiva. SLIDE 7: Tecnologie Algoritmiche nel Data Mining Algoritmi sofisticati in data mining. Classificazioni principali: Classificazione, Regressione, Clustering, Rilevamento anomalie. Esempi: Alberi decisionali, Regressione logistica, K-Means. Origini: Sviluppati in vari campi come astronomia, statistica. SLIDE 8: Data Mining e Data Warehousing Data warehousing: Strutturazione dati per analisi. Differenza tra sistemi transazionali e data warehouse. Utilizzo di SQL per estrazione dati da sistemi operativi per data mining. Ruolo del data warehouse: Facilitare query strategiche. SLIDE 9: Applicazioni Aziendali del Data Mining Case Study 1.1: Esempi di attività di data mining in contesti aziendali. Classificazione, Regressione, Rilevamento anomalie, Serie storiche, Clustering. Applicazioni in varie aree: Politica, Finanza, Marketing, ecc. SLIDE 10: Caso A - Classificazione Attività: Prevedere l'appartenenza a classi predefinite. Algoritmi: Alberi decisionali, reti neurali, Random Forest. Domanda analitica: Classificazione elettori per partito. Contrasto con BI: Conteggio voti per partito/geografia. SLIDE 11: Caso B - Regressione Attività: Stima numerica per un punto dati. Algoritmi: Regressione lineare e logistica. Domanda analitica: Previsione tasso di disoccupazione, premi assicurativi. Contrasto con BI: Analisi storica su disoccupazione e entrate assicurative. SLIDE 12: Caso C - Rilevamento Anomalie Attività: Identificare valori anomali. Algoritmi: Local Outlier Factor, altri basati su distanza/densità. Domanda analitica: Individuare transazioni fraudolente con carte di credito. Contrasto con BI: Totale addebiti carta di credito mensili. SLIDE 13: Caso D - Serie Storiche Attività: Previsione basata su dati storici. Algoritmi: ARIMA, regressione, altri. Domanda analitica: Previsioni vendite e produzione. Contrasto con BI: Analisi storica vendite e produzione. SLIDE 14: Caso E - Clustering Attività: Identificare cluster naturali in set di dati. Algoritmi: K-Means, clustering basato su densità. Domanda analitica: Segmentazione clienti per marketing. Contrasto con BI: Analisi chiamate clienti per tipo e valore. SLIDE 15: Conclusione Data Mining: Cruciale per insight aziendali e decision-making. Superamento di BI: Verso analytics avanzate. Evoluzione degli strumenti e competenze: Da semplici analisi a tecniche sofisticate. Importanza crescente della data literacy in ambiente aziendale.