Analisi dei Dati con Applicazioni Informatiche PDF
Document Details
Uploaded by EuphoricLasVegas
Lombardi
Tags
Summary
Questo documento fornisce un'introduzione al pacchetto R per l'analisi statistica dei dati. Vengono descritti la storia, le caratteristiche e il linguaggio base di R, includendo gli operatori aritmetici e di confronto.
Full Transcript
ANALISI DEI DATI CON APPLICAZIONI INFORMATICHE Lombardi a.a. 2024/2025 MODULO 1: Introduzione generale al pacchett...
ANALISI DEI DATI CON APPLICAZIONI INFORMATICHE Lombardi a.a. 2024/2025 MODULO 1: Introduzione generale al pacchetto R 1. Evoluzione e storia del pacchetto statistico R Il pacchetto R è nato in ambito accademico. Si tratta di un opensource e freeware. Inizialmente venne sviluppato da un software commerciale “S”, il quale, però, richiedeva l’acquisto di una licenza costosa (25/30 anni fa). S ha dato luogo allo sviluppo di due software specifici 1. S+ 2. Il pacchetto R → dall’origine come modalità open source (direttamente modificabile dagli utenti) e freeware (senza la necessità di un acquisto specifico: non di natura commerciale) R è stato sviluppato in un ambiente GNU project → ambiente con le seguenti caratteristiche: ❖ Software gratuito ❖ Sviluppato in ambiente accademico Caratteristiche dell’ambiente R → 3 proprietà fondamentali: 1. Set di strumenti per l’analisi statistica dei dati: linguaggio di programmazione per elaborare dati di natura statistica. 2. Linguaggio di tipo object-oriented per la descrizione di modelli statistici: software progettato a moduli per cui si compone di un insieme di funzioni che permettono di fare specifiche operazioni matematiche e statistiche. 3. Gestione ottimale dei grafici: grande capacità di poter gestire in modo ottimale le rappresentazioni grafiche dei dati. 2. Il linguaggio base di R Il pacchetto R non funziona per selezione di opzioni da un menu → R richiede la scrittura di specifici comandi (sintassi) che permettono di produrre particolari operazioni: richiede l’apprendimento di uno specifico linguaggio di programmazione. Operatori aritmetici Simbolo R Significato matematico + Addizione - Sottrazione * Moltiplicazione / Divisione ^ Elevamento a potenza R usa solo le parentesi tonde. Esempio: Operatori di confronto Simbolo R Significato Matematico < < > > = ≥ == = != ≠ Gli operatori di confronto sono operatori di tipo matematico ma permettono di confrontare delle quantità. I segni di ≤ e ≥ vanno inseriti in R senza spazio tra > o < e l’=. I simboli composti non vanno mai inseriti con gli spazi tra i due simboli di composizione. Esempio: → Il risultato di questa espressione è un valore logico. Si tratta di un'espressione che combina operatori algebrici (10/2) e operatori di confronto (>). Se sulla tastiera uso le frecce posso muovermi tra le operazioni, in particolare con la freccia in alto torno alle operazioni precedenti, mentre con la freccia verso il basso torno alle operazioni successive. I valori “TRUE” e “FALSE” sono chiamate costanti logiche → sono entità che sono presenti nel sistema e che non possono e non devono essere modificate → le costanti logiche sono solo due: 1. TRUE 2. FALSE → In questo caso sto confrontando un valore “TRUE” con >= 1 → Prima bisogna eseguire l’operatore di uguaglianza e poi l’operatore di confronto, indicando l’ordine con delle parentesi tonde. Bisogna utilizzare le parentesi per esser certi di far eseguire la sequenza delle operazioni secondo la nostra sequenza stabilita e non quella stabilita dal sistema. In che senso il valore “TRUE” ((5+2)==(9-2)) è >= 1? Che tipo di decodifica ha fatto R? → Codificare il valore logico in un valore booleano: “1” sta per “TRUE” “0” sta per “FALSE” In questo caso ((5+2)==(9-2)) viene codificato come valore logico “TRUE” e come valore booleano “1” che quindi è >= 1. >= 2 è falso perché non posso confrontare un valore logico “TRUE” con un valore numerico “2” >= TRUE è vero perché il risultato della prima operazione di confronto è vero >= FALSE è vero perché corrisponde al valore booleano “0” che quindi è