Tema 1. Introduccion a la estadistica inferencial (1).pptx
Document Details
![SpiritualJoy](https://quizgecko.com/images/avatars/avatar-7.webp)
Uploaded by SpiritualJoy
Comillas
Full Transcript
Tema 1: Introducción a la estadística inferencial Pablo Fernández Cáncer Parte I: Escalas de medida y tipos de variable Tipos de escalas de medida Clasificación de Stevens • Nominal Dicotómicas (sexo biológico) o politómicas (estado civil) • Ordinal Escalas Likert (nunca, casi nunca, a veces...
Tema 1: Introducción a la estadística inferencial Pablo Fernández Cáncer Parte I: Escalas de medida y tipos de variable Tipos de escalas de medida Clasificación de Stevens • Nominal Dicotómicas (sexo biológico) o politómicas (estado civil) • Ordinal Escalas Likert (nunca, casi nunca, a veces, a menudo, siempre) • Intervalos Inteligencia, un examen de cualquier asignatura... • Razón Altura, peso, tiempo... Escala nominal Son variables categóricas: Dicotómica (2 categorías) o politómica (>2 categorías) Ejemplos: Sexo (H, M); Orientación sexual (Homo, Hetero, Bi...); Estado civil (casado, viudo...); Procedencia (España, Italia, Francia...) Permiten establecer una relación de igualdad/desigualdad: - Homo = Homo; Homo ≠ Hetero. Pero no relaciones de mayor que/menor que: - Heterosexual no es más ni menos que Homosexual (son categorías distintas) Escala ordinal Son variables categóricas. Ejemplos: Escalas Likert - 1 = En desacuerdo, 2 = Algo de ac., 3 = Bastante de ac., 4 = Totalmente de ac. - 1 = ‘0 veces a la semana’, 2 = ‘entre 1 y 5 veces a la semana’, 3 = ‘más de 5 veces a la semana’. Permiten establecer una relación de igualdad/desigualdad, pero también de mayor/menor que: - Bastante de acuerdo < Totalmente de acuerdo Pero no sabemos cuál es exactamente la magnitud de la diferencia entre un nivel y el siguiente. Escala de intervalos Ejemplos: Inteligencia, narcisismo, un examen de cualquier asignatura, un test de sintomatología ansiosa, temperatura... Permiten establecer una relación de igualdad/desigualdad, de mayor/menor que, pero no hay cero absoluto. - María tiene exactamente 20 unidades más que Pablo, y Pedro tiene 20 unidades más que María. - No podemos decir que Alejandro tenga el doble de inteligencia que Pablo, porque un 0 en inteligencia no significa ausencia de inteligencia (el cero es un punto arbitrario de la escala) Escala de razón Ejemplos: El tiempo, la longitud, el peso, la edad... Mismas propiedades que las de intervalo y, además, tienen un cero absoluto. Este cero no es un punto arbitrario, sino que realmente significa “ausencia de”: - Podemos decir que María mide el doble que Alejandro. Tipos de variables - Dicotómicas (2 niveles, nominales) Variables categóricas - Politómicas (2< niveles, nominales) - Ordinales (entre 3 y 6 niveles, generalmente) Variables cuantitativas - Intervalo o razón, principalmente - Pueden ser discretas (sin decimales) o continuas (con decim.) EJERCICIO Variable Pregunta que se responde mediante escala Likert Índice de masa corporal Narcisismo medido con un test Nota en el examen de metodología Estatus socioeconómico (alto, medio, bajo) Pregunta que se responde con SI/NO Número de hijos Escala de medida Tipo de variable ¿Por qué tenemos que saber esto? Para poder valorar si, con los datos que tenemos, tiene sentido efectuar determinado tipo de análisis estadísticos o no. Por ejemplo: - Comparar 2 grupos: Necesitamos una categórica y una cuantitativa - Comparar 2< grupos: Necesitamos una categórica y una cuantitativa - Examinar la asociación entre dos variables: - Si tenemos variables cuantitativas Correlación de Pearson - Si tenemos variables ordinales Correlación de Spearman - Si tenemos variables nominales Prueba Chi cuadrado de independencia Parte II: Media, varianza y desviación típica La media La media es un resumen de las puntuaciones en una variable. 𝑿=𝟔 0 1 2 3 4 La media se calcula como: 5 6 7 8 9 10 La media Al usar la media, estoy caracterizando a la muestra con una única puntuación, pero cada individuo tiene una puntuación distinta. Es decir, al usar la media estoy cometiendo cierto error. ¿Por qué en este caso la media es 6 y no otro valor? Porque es el valor con el que menos error cometemos. Si calculamos el error que cometemos al utilizar la media para caracterizar a todos los individuos de mi muestra, vemos que da 0. ∑ 𝑒𝑖=𝟎 𝑿=𝟔 0 1 2 3 4 5 6 7 8 9 10 La media ¿Qué pasaría si caracterizáramos a nuestra muestra con otro número, como por ejemplo el 5? ∑ 𝑒𝑖=𝟒 𝑿=𝟓 20 15 Error 10 5 0 0 1 2 3 4 x 5 6 Puntuaciones 7 8 9 10 La media En resumen: La media es el valor que minimiza los errores cometidos al resumir toda la información muestral en un solo número. Los errores indican cuánto me estoy desviando de un valor determinado (en este caso la media). La varianza La varianza es el grado de dispersión de las puntuaciones. Cuando las puntuaciones son muy poco dispersas, tienen poca varianza porque varían poco: 0 1 2 3 4 5 6 7 8 9 10 Mientras que aquí, las puntuaciones varían más y, por tanto, la varianza es mayor: 0 1 2 3 4 5 6 7 8 9 10 La varianza La varianza se puede interpretar como una cuantificación del error que cometemos cuando caracterizamos a nuestra muestra con un único valor (la media). Es decir, la varianza resume los errores en un solo número. 2 2 𝑆 = 𝑿𝒊 ∑ ( 𝑋𝑖− 𝑋 ) 𝑛 𝟐 ∑ ( 𝑿 𝒊− 𝑿 ) 𝟐 𝑿𝒊 − 𝑿 ( 𝑿𝒊− 𝑿 ) 𝒏 𝟐 𝑺 =𝟑. 𝟑𝟑 0 1 2 3 4 5 6 7 8 9 10 La desviación típica La desviación típica nos informa de lo mismo que la varianza, y no es más que su raíz cuadrada 𝑆= √( 2 ∑ ( 𝑋𝑖− 𝑋 ) 𝑛 ) Lo interesante de las desviaciones típicas es que me ayudan a sabe el rango de valores en torno al que se acumula la mayoría de los sujetos. La desviación típica En una variable que se distribuye de forma normal: - Approx. el 68.4% de los sujetos están entre -1 y +1 desviaciones típicas de la media. - Approx. el 95% de los sujetos están entre -2 y +2 desviaciones típicas la media. Es de decir, si las notas de clase son 7.5, con desviación típica de 1, eso significa que... - El 68.4% de los alumnos tienen notas de entre 6.5 y 8.5 notas. - El 95% de los alumnos tienen notas de entre 5.5 y 9.5 - Sólo un 5% de los alumnos sacan notas por debajo del 5.5 o por encima del 9.5 Parte III: Inferencia, población, muestra, parámetro y estadístico Inferencia estadística La inferencia un razonamiento que procede de lo particular a la general: intenta extraer conclusiones de tipo general a partir de unos pocos datos particulares. Al hablar de conclusiones de tipo general nos estamos refiriendo a conclusiones sobre una población o alguno de sus parámetros, y al hablar de datos particulares, hablamos de una muestra o sus estadísticos. Población y muestra Ejemplo: - Queremos probar la eficacia de un nuevo tratamiento para aliviar el insomnio. - Problema: No es posible reunir a todas las personas que padecen insomnio - Solución: Aplicar el tratamiento sólo a algunos pacientes. Población: Conjunto de elementos (personas) que poseen una o más características en común (ej. personas que padecen insomnio). Muestra: Subconjunto de elementos de una población. Población y muestra Importante: “Población” en estadística no tiene el mismo significado que en nuestro lenguaje cotidiano. No se refiere necesariamente al conjunto de habitantes de un lugar, sino a un conjunto de personas que comparten una característica que nos interesa estudiar. Para que mis conclusiones sean válidas es necesario que la muestra utilizada sea representativa de la población a la que se supone que representa. Esto se consigue mediante técnicas de muestreo. Parámetro y estadístico Parámetro: Es un valor numérico que describe una característica poblacional. Población de personas con depresión: N = 100.000 Si midiéramos “estado de salud percibido”, obtendríamos tantos valores numéricos como elementos formen la población (suponiendo que tuviéramos acceso a toda ella...) Si calculáramos la media (por ejemplo este número sería un parámetro, pues describe numéricamente una característica de la población (estado de salud de personas con depresión. Si calculamos el número de hombres y mujeres, podemos extraer otro parámetro: la proporción de hombres/mujeres. Parámetro y estadístico Población de personas con depresión: N = 100.000 Estado de salud percibido: Proporción de mujeres: Características de los parámetros: - Son valores poblacionales - Son valores desconocidos. - Son valores constantes. - Para referirnos a ellos, utilizaremos letras griegas minúsculas (ej., , etc.) Parámetro y estadístico Estadístico: Es un valor numérico que describe una característica muestral. Población de personas con depresión: N = 100.000 Muestra de personas con depresión: n = 100 Estado de salud percibido: Proporción de mujeres: Estado de salud percibido: Proporción de mujeres: Parámetro y estadístico Características de los estadísticos: - Son valores muestrales - Son valores que varían de una muestra a otra. - Son valores conocidos - Se representan con letras latinas minúsculas (, etc.) Los estadísticos se usan para intentar formarnos una idea sobre los verdaderso valores de sus correspondientes parámetros poblacionales desconocidos. Cuando atribuimos a un parámetro el valor que toma su correspondiente estadístico, estamos haciendo una estimación. Estamos estimando el valor del parámetro. ¿Para qué sirve la estimación? Para extraer conclusiones de tipo general a partir de unos pocos datos particulares. Este salto de lo particular a lo general se llama inferencia. Para poder hacer inferencias plausibles, es importante: - Utilizar la técnica estadística adecuada - Contar con un tamaño muestral suficiente - Seleccionar apropiadamente los datos que se van a analizar. Técnicas de muestreo Parte IV: Técnicas de muestreo El muestreo Es imprescindible que las muestras sean representativas de la población. Esto sólo se consigue cuando todos los elementos de la población tienen la oportunidad (la misma probabilidad) de ser elegidos. Pensad en la población de “pacientes con insomnio”. Los sujetos varían en nivel educativo, sexo, edad, tratamiento, nivel socioeconómico, estado civil, lugar de procedencia... Estas características deben estar correctamente representadas en la muestra. El muestreo El muestreo es el proceso seguido para extraer una muestra de una población. Puede ser: Probabilístico No probabilístico Cada persona tiene asociada una probabilidad conocida (o calculable) de pertenecer a la muestra. Ejemplo: Mi población son los 1000 alumnos de la U. de Comillas, y tomo una muestra de 100. Cada alumno tiene una probabilidad de 100/1000 = 0.1 = 10% de ser seleccionado. No se tiene en cuenta la probabilidad asociada a cada posible resultado muestral (ej. muestreo por conveniencia) Ej. voluntarios que responden a un anuncio, alumnos matriculados en el centro, pacientes que acuden a mi hospital... El muestreo Sólo el muestreo probabilístico nos permite formarnos una idea sobre el grado de representatividad de la muestra. Un muestreo no-probabilístico no implica necesariamente que la muestra no sea representativa, pero no nos proporciona info. al respecto. Para conseguir un muestreo probabilístico, hacemos uso del azar: - Permite que todos los sujetos tengan la misma probabilidad de ser elegidos. - El resultado de una extracción no afecta ni depende del resultado de cualquier otra. El muestreo aleatorio El muestreo aleatorio garantiza que la muestra elegida sea representativa de la población. El muestreo aleatorio puede ser: - Sistemático - Estratificado - Por conglomerados - Polietápico El muestreo aleatorio sistemático El muestreo aleatorio sistemático funciona bien si tenemos una lista de los elementos que componen la población. Yo quiero tomar una muestra de N =20 Extraigo 1 sujeto al azar de los n=4 primeros, y resulta ser el sujeto número 3. Vamos a llamarlo i = 3. Con n = 4, puedo extraer hasta 5 muestras: 𝑘= N 20 = =5 n 4 Obtengo la muestra mediante la fórmula: i, i + k, i + 2k, i + 3k... Mi muestra final la componen los sujetos: 3, 8, 13 y 18. El muestreo aleatorio estratificado El muestreo aleatorio estratificado se utiliza cuando quiero asegurarme al 100% de que todos los estratos de la población tengan una adecuada representación. N =20 Estrato 1: Hombres n=10 Estrato 2: Mujeres El muestreo aleatorio por conglomerados Se seleccionan varios conglomerados de sujetos y se reclutan al completo. Ejemplo: Queremos estudiar el desarrollo cognitivo en niños durante la educación primaria de la Comunidad de Aragón. La muestra La población San Vicente de Paúl C.P. Joaquín Costa La Salle Franciscanas C.P. Basilio Paraíso C.P. Recarte y Ornat La Salle Franciscanas C.P. Basilio Paraíso C.P. Recarte y Ornat El muestreo aleatorio polietápico Es un tipo de muestreo por conglomerados que se hace por etapas. Primero se divide la población en k conglomerados, se escogen al azar varios conglomerados, y se vuelve a dividir cada uno en varios sub-conglomerados... Etapa 1 Etapa 2 Muestra final Huesca Salesianos San Viator Juan XXIII Madrid San Viator Juan XXIII Bilbao Tarragona Sag. Cor. Escolapios CP. Juan M.S.M Sag. Cor. CP. Juan M.S.M Parte V: Puntuaciones típicas y curva normal Puntuaciones directas Supongamos que tenemos las calificaciones de varios estudiantes en universidades distintas: Comillas Complutense Europea ¿Qué puede decirse de la calificación de 4? ¿Indica un rendimiento alto o bajo? ¿Qué indicaría una puntuación de 8? La interpretación depende de la universidad. Puntuaciones típicas Para solucionar el problema de que las variables tengan diferente métrica y distinto grado de dispersión (y, por tanto, no sean comparables), usamos puntuaciones típicas. Las puntuaciones típicas se calculan como: 𝑍= (𝑌 − 𝑌 ) 𝑆𝑌 Puntuaciones típicas ¿Qué podemos decir ahora de la calificación de 4? ¿Y la de 8 en Comillas y la Europea? Puntuaciones típicas Las puntuaciones típicas nos indican que: la calificación de 4 está 1.73 desviaciones típicas por debajo de su media en Comillas, y que la calificación de 4 en Complutense se encuentra justo en el centro de su distribución. Aunque, en términos absolutos, la distancia de la calificación 8 a la media vale 2 puntos tanto en Comillas como en la Europea, esa distancia es, en términos relativos, el doble de grande en Comillas (1.73) que en la Europea (0.86). Puntuaciones típicas Las puntuaciones típicas sirven para comparar puntuaciones individuales de distintos grupos y variables con solvencia. Esto permite constatar que dos puntuaciones directas iguales pueden ocupar posiciones relativas distintas, y también que dos puntuaciones directas distintas pueden ocupar posiciones relativas iguales. Básicamente, estamos relativizando las puntuaciones originales para referirlas a algo, y así dotarlas de sentido y facilitar su interpretación. Esto, además, permite realizar comparaciones y estudiar relaciones entre variables. La curva normal Las distribuciones de variables cuantitativas pueden adoptar formas muy diversas, pero habitualmente tienen una forma particular: la mayoría de los valores se encuentran próximos al centro, y van siendo menos frecuentes a medida que nos alejamos de él. La curva normal Variable con poca varianza Variable con mucha varianza Puntuaciones directas Puntuaciones típicas La curva normal Cuando trabajamos con puntuaciones típicas, sabemos que una puntuación de 0 significa que estamos en la media. Una puntuación de 1 significa que nos estamos alejando 1 desviación típica de la media. Si los datos se ajustan perfectamente a una curva normal, entre el -1 y el 1 se encontrarán aprox. el 68.2% de las personas. Entre el -1.96 y el 1.96 se encontrarán aprox. el 95% de las personas. Parte IV: Distribuciones muestrales de los estadísticos Distribuciones Tenemos que distinguir entre distribuciones empíricas y distribuciones teóricas. Una distribución empírica es la que se construye a partir de los datos observados (mediante histogramas para variables cuantitativas o gráficas de barras para variables categóricas). Distribuciones Tenemos que distinguir entre distribuciones empíricas y distribuciones teóricas. Una distribución teórica es la que no está generada a partir de unos datos, sino a partir de una función matemática. Son, por ejemplo, la distribución binomial (utilizada para variables dicotómicas), o la distribución normal (utilizada para variables cuantitativas). La distribución muestral de la proporción Pensemos en que tiro una moneda 2 veces, y os pido que acertéis si va a salir cara o cruz. ¿Qué resultados son esperables? La distribución muestral de la proporción Pensemos en que tiro una moneda 2 veces, y os pido que acertéis si va a salir cara o cruz. ¿Qué resultados son esperables? 0.5 - OO XX OX XO 2 aciertos 1/4 = 0.25 0 aciertos 1/4 = 0.25 0.25 0.25 1 acierto 2/4 = 0.5 0 1 2 número de aciertos La distribución muestral de la proporción Pensemos en que tiro una moneda 3 veces, y os pido que acertéis si va a salir cara o cruz. ¿Qué resultados son esperables? .375 - OOO XXX 3 aciertos 1/8 = 0.125 0 aciertos 1/8 = 0.125 - OXX XOX XXO 1 acierto 3/8 = 0.375 - XOO OXO OOX 2 aciertos 3/8 = 0.375 .125 0 .375 .125 1 2 3 número de aciertos La distribución muestral de la proporción Y si tiro la moneda 4 veces... - OOOO XXXX - OOOX OOXO OXOO XOOO - OOXX OXXO XXOO OXOX XOXO - XXXO XXOX XOXX OXXX 4 aciertos 1/15 = 0.066 0 aciertos 1/15 = 0.066 .33 .26 .26 3 aciertos 4/15 = 0.266 .06 .06 2 aciertos 5/15 = 0.333 0 1 2 3 número de aciertos 1 acierto 4/15 = 0.266 4 ¿Qué vemos aquí? 1. Al aumentar n, los valores más extremos se vuelven menos probables. 2. Es decir, la distribución se vuelve más estrecha en torno al valor medio (el más probable, 0.5) 3. Al aumentar n, la distribución binomial se parece cada vez más a una curva normal ¿Qué vemos aquí? Hasta ahora, las distribuciones mostradas no son realmente las del estadístico “proporción de aciertos”, sino las del estadístico “número de aciertos”. Distribucion muestral del número de aciertos: Distribucion muestral de la proporción de aciertos: 0 .5 1 0 .37 .37 1 0 .25 .5 .75 1 0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1 Ejemplo La tasa de recuperación de un trastorno es del 0.1. Si tomo muestras de 10 sujetos, lo más probable es que de esas 10 personas, 1 se recupere (). Pero también es probable que no se recupere ninguna (). Ejemplo Para distintos tamaños muestrales con , tendríamos: Vemos que incluso con , la distribución binomial va pareciéndose más a una curva normal conforme aumenta n. Propiedades de la distribución Podemos caracterizar la distribución con 3 elementos: - Su centro - Su dispersión - Su forma Resumen de la nomenclatura Para construir la distribución de probabilidad, sólo hemos necesitado dos parámetros: = Proporción de recuperados en la población n = Tamaño de la muestra Si en nuestra muestra encontramos que hay 5 recuperados de 50, podemos obtener los siguientes estadísticos: = Número de recuperados, que tomará un valor de 5. = Proporción de recuperados, que tomará un valor de 0.1 El centro de la distribución El centro de la distribución se suele llamar valor esperado porque es el que tiene asociado la probabilidad más alta. Este valor esperado coincide con la media de la distribución. El valor esperado (o media) de (número de recuperados) es: 𝑬 ( 𝒏 𝟏 ) =μ𝑛 =𝒏 𝛑 𝟏 1 Es decir, el centro de la distribución muestral del número de aciertos () es n veces la proporción de recuperados. Si y n = 10, entonces el valor esperado de recuperados es: El centro de la distribución También podemos obtener el estadístico (proporción de recuperados). El centro (o valor esperado) de la distribución de este estadístico es: Si la proporción de recuperados en la población es , el valor esperado es también 0.1. La dispersión de la distribución Cuando tratamos con proporciones, la varianza (es decir, el grado de dispersión) de la distribución muestral del estadístico “número de recuperados” y del estadístico “proporción de recuperados” se obtienen como: Habitualmente, se informa del error típico, en lugar de la varianza, que no es más que su raíz cuadrada: La dispersión de la distribución Siguiendo el ejemplo de = 0.1. Los errores típicos del estadístico proporción en los siguientes casos son: σ 𝑛 =√ 0.1· ( 0.9 ) /𝟐=𝟎. 𝟐𝟏 1 σ 𝑛 =√ 0.1 · ( 0.9 ) /𝟏𝟎=𝟎 .𝟎𝟗 1 σ 𝑛 =√ 0.1· ( 0.9 ) /𝟓𝟎=𝟎 .𝟎𝟒 1 La forma de la distribución La forma de las distribuciones muestrales del “número de recuperados” y la “proporción de recuperados” se ajustan a la distribución binomial con parámetros n y : La distribución binomial se usa para conocer las probabilidades asociadas a cada posible valor de los estadísticos y en las diferentes muestras de tamaño n. En la práctica, esto nos permite ver cómo de probable es obtener un resultado determinado (una proporción de aciertos, de recuperados, etc.). La distribución muestral de la media Pensemos que tengo una población a la que les he administrado una escala de bienestar subjetivo que se puntúa de 1 a 5: Y tomo muestras de n = 2. Éstas son todas las medias que podría obtener: 1, 1 = 1 2, 1 = 1.5 3, 1 = 2 4, 1 = 2.5 5, 1 = 3 1, 2 = 1.5 2, 2 = 2 3, 2 = 2.5 4, 2 = 3 5, 2 = 3.5 1, 3 = 2 2, 3 = 2.5 3, 3 = 3 4, 3 = 3.5 5, 3 = 4 1, 4 = 2.5 2, 4 = 3 3, 4 = 3.5 4, 4 = 4 5, 4 = 4.5 1, 5 = 2.5 2, 5 = 3.5 3, 5 = 4 4, 5 = 4.5 5, 5 = 5 La distribución muestral de la media Vemos, por ejemplo, que obtener una media de 2.5 es más probable que obtener una media de 1, porque hay más formas distintas de obtenerla: 1, 1 = 1 2, 1 = 1.5 3, 1 = 2 4, 1 = 2.5 5, 1 = 3 1, 2 = 1.5 2, 2 = 2 3, 2 = 2.5 4, 2 = 3 5, 2 = 3.5 1, 3 = 2 2, 3 = 2.5 3, 3 = 3 4, 3 = 3.5 5, 3 = 4 1, 4 = 2.5 2, 4 = 3 3, 4 = 3.5 4, 4 = 4 5, 4 = 4.5 1, 5 = 3 2, 5 = 3.5 3, 5 = 4 4, 5 = 4.5 5, 5 = 5 La distribución muestral de la media .20 .16 .12 .08 .04 .16 .12 .08 .04 Resumen de la nomenclatura Para construir la distribución de probabilidad del estadístico media, se necesitan dos parámetros (media y varianza/DT): = Media poblacional = Varianza poblacional = Desviación típica poblacional Y podemos obtener los siguientes estadísticos: = Media muestral = Varianza muestral = Desviación típica muestral El centro de la distribución Al igual que antes, el centro de la distribución es su valor esperado (porque es el que tiene asociado la probabilidad más alta) y se calcula como la media muestral: La dispersión de la distribución La dispersión de la distribución muestral de la media se calcula como la varianza poblacional de Y dividida por el tamaño de la muestra: 2 𝑉 ( 𝑌 ) =σ 2 = σ 𝑌 𝑌 /𝑛 De nuevo, la raíz cuadrada de lo anterior se conoce como error típico: Igual que en la distribución del estadístico “proporción”, a mayor n, menor error típico (menor dispersión) y más estrecha será la distribución en torno al valor esperado. La forma de la distribución La forma de la distribución muestral de la “media en bienestar” se ajusta a la distribución normal con parámetros y : La distribución normal se usa para conocer las probabilidades asociadas a los valores del estadístico o superiores en las diferentes muestras de tamaño n. En la práctica, esto nos permite ver cómo de probable es obtener un resultado determinado (una media post-intervención, etc.). ¿Para qué me sirve la distribución muestral de la media? Ejemplo: Según los registros, parece que ha habido un aumento del CI promedio en las últimas décadas (conocido como efecto Flynn). Estudios previos han situado la media poblacional de CI en , con desviación típica de 15. Nosotros hemos tomado una muestra de n = 80 personas y hemos obtenido una media de 110. ¿Ha habido realmente una mejora del CI de 10 puntos o mi muestra está sesgada? Si partimos de una población con = 100 y DT=15, ¿cómo de probable es extrar una muestra de n = 80 que tenga media de 110? Necesitamos conocer las probabilidades asociadas a cada possible resultado muestral (o, al menos, al resultado de 110).