Statistica Francesa Manna 2 PDF

Document Details

AdvantageousDialogue5929

Uploaded by AdvantageousDialogue5929

Libera Università Mediterranea

Tags

statistics univariate statistics measures of central tendency mathematical statistics

Summary

This document outlines different measure of synthesis and their applications and examples within the field of univariate statistics, such as mean, median, mode, and their relation to frequency distributions.

Full Transcript

LE MISURE DI SINTESI RIFERITE AD UN CARATTERE UNICO Ci troviamo nel campo della STATISTICA UNIVARIATA, che studia un carattere per volta. [≠ bivariata: 2 caratteri contemporaneamente; multivariata: + caratteri contemporaneamente] Dopo essere partiti da un insieme non aggregato abbiamo effettuato una...

LE MISURE DI SINTESI RIFERITE AD UN CARATTERE UNICO Ci troviamo nel campo della STATISTICA UNIVARIATA, che studia un carattere per volta. [≠ bivariata: 2 caratteri contemporaneamente; multivariata: + caratteri contemporaneamente] Dopo essere partiti da un insieme non aggregato abbiamo effettuato una sintesi ottenendo una distribuzione statistica del carattere (discreto o continua). Dobbiamo ora effettuare una ulteriore sintesi dell’indagine statistica con una sola variabile attraverso le MISURE DI SINTESI:  Misure di posizione (o tendenza):  Centrale: MEDIA, MODA E MEDIANA.  Non centrale: QUARTILI, DECILI E PERCENTILI.  Misure di dispersione (o variabiltà): VARIANZA, SCARTO QUADRATICO MEDIO, CAMPO DI VARIAZIONE, COEFFICIENTE DI VARIAZIONE.  Misure di concentrazione MISURE DI POSIZIONE CENTRALE: MEDIA, MODA e MEDIANA LA MEDIA ARITMETICA μ(X) Dato un carattere X, ottenuti i valori di un esperimento xi i = 1... N, la media aritmetica si indica con μ(X) ed ha sempre la stessa unità di misura degli elementi cui si riferisce. Distinguiamo diverse situazioni: 1. Nel caso di INSIEMI NON AGGREGATI la media aritmetica è data da: 𝟏 μ(X) = ∑𝐍𝐢 𝟏 𝐱𝐢 (Sommatoria per i che va da 1 a N (numerosità della popolazione = numero di osservazioni) del numero delle osservazioni diviso N) 𝐍 a. Per un CARATTERE DISCRETO: Esempio1: X = # componenti famiglia xi i = 1…10 x1 = 3 x3 = 4 x5 = 4 x7 = 4 x9 = 4 x2 = 4 x4 = 4 x6 = 5 x8 = 4 x10 = 5 μ= b. Per un CARATTERE CONTINUO: Esempio2: X = altezza xi i = 1…10 x1 = 171.33 x3 = 178.25 x5 = 176.82 x7 = 174.38 x9 = 172.15. μ= = 179.136 x2 = 178.10 x4 = 180.15 x6 = 183.21 x8 = 186.25 x10 = 190.72 2. Nel caso di DISTRIBUZIONE STATISTICA CON FREQUENZE ASSOLUTE la media: a. Per un CARATTERE DISCRETO è data da: 𝟏 μ(X) = ∑𝐡𝐢 𝟏 𝐱𝐢∗ 𝐧𝐢 (Sommatoria per i che va da 1 a h (numero delle modalità) delle modalità moltiplicate per la frequenza assoluta diviso N) 𝐍 Esempio1: X = # componenti famiglia (dati precedenti) X*i ni 𝐱𝐢∗ 𝐧𝐢 3 1 3 (3 x 1) μ= = = 4.1 4 7 28 (4 x 7) 5 2 10 (5 x 2) b. Per un CARATTERE CONTINUO è necessaria una semplificazione (comporta una perdita di informazioni): approssimiamo i risultati con il punto medio (mi) di ciascuna classe: 𝟏 μ(X) = ∑𝐡𝐢 𝟏 𝐦𝐢 𝐧𝐢 𝐍 Esempio2: X = altezza (dati precedenti) x*i – x*i-1 ni mi mini 170 - 175 3 172.5 517.5.... μ= = = 179.5 175 - 180 3 177.5 532.5 180 - 185 2 182.5 365 NB: la media è diversa (meno precisa) da quella ottenuta dall’insieme non aggregato (1) [179.136] 185 - 190 1 187.5 187.5 190 - 195 1 192.5 192.5 3. Nel caso di DISTRIBUZIONE STATISTICA CON FREQUENZE RELATIVE la media: a. Per un CARATTERE DISCRETO è data da: μ(X) = ∑𝐡𝐢 𝟏 𝐱𝐢∗ 𝐩𝐢 (Sommatoria per i che va da 1 a h (numero delle modalità) delle modalità moltiplicate per la frequenza relativa. NB non va divisa per N perché la divisione è compresa nella formula della frequenza relativa). Esempio1: X = # componenti famiglia (dati precedenti) X*i pi 𝐱𝐢∗ 𝐩𝐢 3 0.1 0.3 (3 x 0.1) μ = 0.3+2.8+1 = 4.1 4 0.7 2.8 (4 x 0.7) 5 0.2 1 (5 x 0.2) b. Per un CARATTERE CONTINUO è data da: μ(X) = ∑𝐡𝐢 𝟏 𝐦𝐢 𝐩𝐢 (NB anche in questo caso non va divisa per N perché la divisione è compresa nella formula della frequenza relativa). Esempio2: X = altezza (dati precedenti) x*i – x*i-1 pi mi mipi 170 - 175 0.3 172.5 51.75 175 - 180 0.3 177.5 53.25 μ = 51.75 + 53.25 + 36.5 + 18.75 = 179.5 180 - 185 0.2 182.5 36.5 [NB: μ ≠ insieme non aggregato: 179.136 / μ = distribuzione con ni (stessa approssimazione) 185 - 190 0.1 187.5 18.75 190 - 195 0.1 192.5 19.25 7 ▪ Le PROPRIETA’ DELLA MEDIA ARITMETICA sono: 1. La media di una costante è la costante stessa [c: costante]: μ(c) = c 2. La media della somma fra una costante e una variabile è data dalla somma tra la costante e la media della variabile: μ(c + X) = c + μ(X) 3. La media del prodotto fra una costante e una variabile è data dal prodotto tra la costante e la media della variabile: μ(c · X) = c · μ(X) 4. La media di una somma algebrica di due variabili è fata dalla somma algebrica tra la media della variabile1 e la media della variabile2: μ(X ± Y) = μ(X) ± μ(Y) 5. La somma degli scarti dalla media è nulla (la media è quell’operatore che annulla gli scarti): ∑ [x − μ(X)] = 0 DIMOSTRAZIONE: - Distribuiamo la sommatoria: ∑ [x − μ(X)] = ∑ x – ∑ μ(X) - Sappiamo che μ(X) = ∑ x , quindi: ∑ x = Nμ(X) - Dal momento che μ(X) è una costante: ∑ μ(X) = μ(X) moltiplicata Nvolte = Nμ(X) - Otteniamo dunque: Nμ(X) – Nμ(X) = 0 6. La media è l’operatore che minimizza la somma degli scarti quadratici (il punto di minimo in una sommatoria di quadrati si ha nel punto in cui la costante (a) corrisponde alla media aritmetica). Lo scarto (xi – a) è la differenza tra le singole osservazioni e una costante qualsiasi. ∑ (x − a) → MIN a=μ(X) DIMOSTRAZIONE: - Per calcolare il punto di minimo svolgiamo la derivata di ∑ (x − a) : –2 ∑ (x − a) - Poniamo la derivata uguale a 0 e semplifichiamo il -2: ∑ (x − a) = 0 - Distribuiamo la sommatoria: ∑ x – ∑ a = 0 - Sappiamo che ∑ x = Nμ(X) e che ∑ a = Na - Otteniamo dunque: Nμ(X) – Na = 0 - Semplifichiamo N: μ(X) – a = 0 - Dunque il punto di minimo (derivata’=0) si ha in μ(X) = a ▪ La media aritmetica è solo una delle tante tipologie di media, è intesa come MOMENTO I (primo). Infatti, dalla formula generatrice dei momenti sappiamo che: Mk (momento kappesimo) = ∑ 𝑥  Media aritmetica: MOMENTO PRIMO (M1; k:1) = ∑ X  Media quadratica: MOMENTO SECONDO (M2; k: 2) = ∑ X  Media armonica: MOMENTO TERZO (M3; k: -1) = ∑ LA MODA (Mo) La MODA È L’OSSERVAZIONE CHE SI PRESENTA CON MAGGIORE FREQUENZA. Distinguiamo:  MODA PER UN INSIEME NON AGGREGATO In caso di insieme non aggregato, la moda è l’osservazione che si presenta più volte. Esempio: X = animali domestici X1 = 0 X3 = 0 X5 = 2 Mo = 0 X2 = 1 X4 = 0 X6 = 1  MODA PER UNA DISTRIBUZIONE STATISTICA CON CARATTERE DISCRETO In caso di distribuzione statistica, la moda è la modalità con la frequenza più alta Esempio: X = animali domestici X*i ni 0 1 Mo = 1 1 4 2 2 3 3 NB: se ci sono più valori con la stessa frequenza, avremo una distribuzione BIMODALE (due mode) Esempio: X = animali domestici X*i ni 0 1 Mo = 1 e 2 1 4 2 4 3 3  MODA PER UNA DISTRIBUZIONE STATISTICA CONTINUA PER INTERVALLI In caso di distribuzione statistica continua per intervalli, non avremo una moda ma una CLASSE MODALE. 8 LA MEDIANA (Me) La MEDIANA DIVIDE L’INSIEME IN PARTI EQUIFREQUENTI: vi sono tante osservazioni più piccole quante sono quelle più grandi. Distinguiamo:  MEDIANA PER UN INSIEME NON AGGREGATO ▪ Supponiamo di avere n rilevazioni di un determinato carattere: X1 X2 (insieme ordinato secondo l’arrivo delle osservazioni: … X1= prima osservazione; Xn = ultima osservazione) Xn ▪ Ordiniamo le osservazioni in modo non decrescente: X(1) X(2) (insieme ordinato secondo la grandezza delle osservazioni: … X1= osservazione più piccola; Xn = osservazione più grande) X(n) ▪ A questo punto, distinguiamo due situazioni: o CASO 1: N DISPARI Nel caso in cui la numerosità della popolazione è dispari, la mediana è data dall’osservazione X posizionata in Me = 𝐗 (𝐍 𝟏 ) 𝟐 ▪ Esempio1: X = componenti della famiglia; N = 5 X1 = 3 X3 = 4 X5 = 4 X2 = 1 X4 = 2 Ordiniamo l’insieme in maniera non decrescente: X(1) = 1 X(3) = 3 X(5) = 4 X(2) = 2 X(4) = 4 Me = X( ) = X ( )= X ( ) = 3 (3 è il valore centrale nell’insieme non aggregato che divide la popolazione in due parti equifrequenti: ci sono 2 persone che hanno carattere ≥ 3 e 2 persone che hanno carattere ≤3). ▪ Esempio2 con carattere discreto: X =numero di esami dati; N = 11 X1 = 9 X3 = 8 X5 = 7 X7 = 6 X9 = 12 X11 = 12 X2 = 10 X4 = 7 X6 = 7 X8 = 5 X10 = 9 Ordiniamo l’insieme in maniera non decrescente: X(1) = 5 X(3) = 7 X(5) = 7 X(7) = 9 X(9) = 10 X(11) = 12 X(2) = 6 X(4) = 7 X(6) = 8 X(8) = 9 X(10) = 12 Me = X( ) = X ( )= X ( ) = 8 (8 è il valore centrale nell’insieme non aggregato che divide la popolazione in due parti equifrequenti: ci sono 5 persone che hanno carattere ≥ 8 e 5 persone che hanno carattere ≤8). o CASO 2: N PARI Nel caso in cui la numerosità della popolazione è pari, la mediana è data dalla media aritmetica tra X posizionato in e X posizionato in +1 Me = 𝛍 [𝐗 (𝐍) , 𝐗 (𝐍 𝟏) ] 𝟐 𝟐 ▪ Esempio: X = componenti della famiglia; N = 6 X1 = 3 X3 = 4 X5 = 4 X2 = 1 X4 = 2 X6 = 5 Ordiniamo l’insieme in maniera non decrescente: X(1) = 1 X(3) = 3 X(5) = 4 X(2) = 2 X(4) = 4 X(6) = 5 Me = μ [X( ) , X( )] = μ [X( ) , X( ) ] = μ [X( ), X( )] = μ (3; 4) = 3.5 (3.5 è il valore centrale nell’insieme non aggregato che divide la popolazione in due parti equifrequenti: ci sono 3 persone che hanno carattere ≥ 3.5 e 3 persone che hanno carattere ≤3.5). ▪ Esempio2 con carattere discreto: X =numero di esami dati; N = 10 X1 = 9 X3 = 8 X5 = 7 X7 = 6 X9 = 12 X2 = 10 X4 = 7 X6 = 7 X8 = 5 X10 = 9 Ordiniamo l’insieme in maniera non decrescente: X(1) = 5 X(3) = 7 X(5) = 7 X(7) = 9 X(9) = 10 X(2) = 6 X(4) = 7 X(6) = 8 X(8) = 9 X(10) = 12 Me = μ [X( ) , X( )] = μ [X( ), X( ) ] = μ [X( ), X( )] = μ (7; 8) = 7.5 (7.5 è il valore centrale nell’insieme non aggregato che divide la popolazione in due parti equifrequenti: ci sono 5 persone che hanno carattere ≥ 7.5 e 5 persone che hanno carattere ≤7.5). NB: la mediana è una misura di sintesi di posizione che NON SUBISCE L’INFLUENZA DEI VALORI ESTREMI (≠ media): variando un carattere estremo la mediana non cambia [Se avessimo avuto X(10)=28 o X(1)=0, N sarebbe stata sempre la stessa per cui la mediana non sarebbe cambiata]. 9  MEDIANA PER UNA DISTRIBUZIONE STATISTICA CON CARATTERE DISCRETO In caso di distribuzione statistica con carattere discreto, la mediana coincide con la modalità in corrispondenza della quale le frequenze cumulate Fi superano per la prima volta il 50%. Me = X*i in corrispondenza della quale Fi > 0.5 per la prima volta ▪ Esempio: X =numero di esami dati (dati precedenti-> aggreghiamo insieme precedente) X*i ni (f. ass.) pi (f. rel.) Fi 5 1 0.09 0.09 6 1 0.09 0.18 7 3 0.27 0.45 Fi > 0.5 = 0.54 8 1 0.09 0.54 Me = 8 9 2 0.18 0.72 10 1 0.09 0.81 12 2 0.18 1 NB: ECCEZIONE Fi = 0.5: Nel caso in cui la frequenza cumulata è pari al 50%, la mediana è data dalla media aritmetica tra X*i in cui Fi=0.5 e X*i successiva. Me = μ (X*i in cui Fi=0.5; X*i successivo) ▪ Esempio: X =numero di esami dati X*i ni pi Fi 5 1 0.1 0.1 6 1 0.1 0.2 7 3 0.3 0.5 Me = μ (7; 8) = 7.5 8 1 0.1 0.6 9 2 0.2 0.8 10 1 0.1 0.9 12 2 0.1 1  MEDIANA PER UNA DISTRIBUZIONE STATISTICA DI UN CARATTERE CONTINUO PER INTERVALLI In caso di distribuzione statistica di un carattere continuo per intervalli, per ricavare la mediana, determiniamo la forma analitica della funzione di ripartizione ed individuiamo il binomio relativo alla classe mediana, in cui Fi supera per la prima volta il 50%. ▪ Esempio: X =numero di esami dati 𝒑 X*i – X*i+1 pi fi ( ∗ 𝒊 ∗ ) Fi 𝑿𝒊 𝟏 𝑿𝒊 0 - 10 0.1 0.01 0.1 10 - 20 0.3 0.03 0.4 20 - 30 0.4 0.04 0.8 30 - 40 0.2 0.02 1 Per ottenere la forma analitica della funzione disegniamo l’istogramma della funzione: Da qui la forma analitica della funzione di ripartizione: 0 x

Use Quizgecko on...
Browser
Browser