Tema 1 - Introducción a la Inferencia Estadística PDF
Document Details
Uploaded by Hohoho
Antonio
Tags
Summary
This document provides an introduction to statistical inference, covering topics such as concepts, types of inference, and methods. It includes a discussion of parameters and statistics, along with an overview of the concepts.
Full Transcript
Tema 1 Introducción a la inferencia estadística Objetivos Comprender el comportamiento aleatorio de los valores muestrales, así como el concepto de estadístico como variable aleatoria. Comprender y generar las distribuciones muestrales de los estadísticos más habituales a partir de diferentes mu...
Tema 1 Introducción a la inferencia estadística Objetivos Comprender el comportamiento aleatorio de los valores muestrales, así como el concepto de estadístico como variable aleatoria. Comprender y generar las distribuciones muestrales de los estadísticos más habituales a partir de diferentes muestras. Contenidos 1.- Conceptos básicos. 2.- Introducción. 3.- Tipos de inferencias acerca de la población. 4.- Distribución de estadísticos en el muestreo. 4.1.- Concepto de distribución muestral. 4.2.- Media y varianza de una distribución muestral. 5.- Determinación de la distribución muestral de algunos estadísticos. 6.- Ejemplos. Conceptos básicos Conceptos básicos Población Es el conjunto de todos los elementos que comparten una o varias características (todos los casos que nos interesan. No necesariamente personas). Muestra Es un conjunto representativo de una determinada población. La representatividad se refiere al grado en que la muestra tiene las mismas características que la población. Un elemento con unas características en la población debe tener la misma probabilidad de ser escogido que en la muestra. Dado un experimento aleatorio con una distribución D, consideramos a la muestra n como el conjunto formado por n variables aleatorias todas ellas con distribución D. La muestra se compone de n repeticiones de un experimento aleatorio Conceptos básicos Parámetros Son los diferentes índices (media, varianza, etc.) que permiten describir una población. Obviamente cada población tendrá un único índice descriptivo (una media, una varianza, etc.). Los parámetros se designan por letras del alfabeto griego (media = µ, desviación típica = σ, proporción = π, etc.). Estadísticos Son los diferentes índices (media, varianza, etc.) que permiten describir una muestra extraída de una población. Obviamente por cada muestra extraída habrá un estadístico (una media, una varianza, etc.) que puede ser diferente a los estadísticos calculados con las otras posibles muestras que se pueden extraer. Los estadísticos se designan por letras del alfabeto latino. Introducción Introducción Las poblaciones de interés para los psicólogos son demasiado amplias, por lo que no es posible la medida de cada uno de sus elementos. Para poder realizar la mayor parte de las investigaciones, es necesario utilizar la Estadística Inferencial. La Estadística Descriptiva que hemos visto sirve como un prerrequisito necesario, ya que el propósito principal de los métodos estadísticos es legitimar las generalizaciones sobre las poblaciones usando datos de muestras. Introducción Cualquier estudio implica: • Identificar una población • Seleccionar una muestra representativa • Obtener datos de esa muestra • Realizar análisis estadísticos apropiados • Hacer inferencias acerca de toda la población a partir de la que se seleccionó la muestra Tipos de inferencia acerca de la población Tipos de inferencia acerca de la población Pueden clasificarse en tres categorías: Estimación puntual de parámetros Consiste en estimar los valores de los parámetros poblacionales. Cualquier estadístico calculado sobre una muestra, para producir una estimación del parámetro poblacional correspondiente recibe el nombre de estimador puntual La diferencia entre el valor estimado para la muestra y el obtenido para la población recibe el nombre de error de muestreo Si lo demás no cambia y la muestra es representativa, cuanto mayor sea la muestra, menor será el error de muestreo Tipos de inferencia acerca de la población Estimación por intervalos o cálculo de intervalos de confianza Un estimador puntual no resulta suficientemente informativo ya que no indica la proximidad al parámetro real. Esta información la proporciona el intervalo de confianza, que es un conjunto de valores con una probabilidad conocida de contener el verdadero valor del parámetro. Contraste de hipótesis Decidir con una probabilidad, a partir de muestras, si un parámetro poblacional toma un determinado valor Distribución de estadísticos en el muestreo Concepto de distribución muestral La inferencia estadística es un tipo de razonamiento que procede de lo concreto (muestra) a lo general (población): intenta extraer conclusiones sobre los parámetros de una población, a partir de la información contenida en los estadísticos de una muestra procedente de esa población Ese razonamiento está basado en el conocimiento de la variabilidad mostrada por un estadístico, de una muestra a otra, es decir, el conocimiento de cómo un estadístico se comporta en las distintas muestras que es posible extraer de una población Un Estadístico se distribuye porque podemos calcularlo para distintas Muestras distribución muestral Distribución Muestral: es “una distribución teórica que asigna una probabilidad concreta a cada uno de los valores que puede tomar un estadístico en todas las muestras, del mismo tamaño, que es posible extraer de una determinada población.” Un estadístico se considera una variable aleatoria y los valores que pueda tomar en todas las muestras, serán los valores posibles de dicha variable. La distribución muestral empírica tiende a aproximarse a una distribución teórica VALORES DEL ESTADÍSTICO PROBABILIDAD DE OCURRENCIA La media y la varianza de una distribución muestral Una distribución muestral queda bien caracterizada, al igual que cualquier otra distribución de probabilidad, mediante su media y desviación típica. Cuando se trabaja con distribuciones muestrales, es habitual utilizar la desviación típica, en vez de la varianza, refiriéndose a ella como error típico. Piensa que si no hubiera variabilidad, el error sería cero La media y la varianza de una distribución muestral Distribución muestral Un caso concreto Para entender el concepto de distribución muestral, vamos a trabajar un ejemplo: distribución muestral de la media Determinación de la distribución muestral de algunos estadísticos Distribución muestral de algunos estadísticos Distribución muestral de la media Un aspecto interesante de la distribución muestral de la media es que si la población de origen es normal, o si el tamaño de la muestra es grande (a menudo con n = 10 ó 20 bastará), entonces en cualquier caso la distribución muestral de la media presentará la forma aproximadamente normal. De manera genérica respecto al muestreo aleatorio puede afirmarse que, en muestras aleatorias de tamaño n, la media de la muestra fluctúa alrededor de la media de la población µ con un error estándar o típico de (donde σ es la desviación estándar o típica de la población). Distribución muestral de algunos estadísticos Más formalmente: Sean X1, X2,…, Xn, variables independientes igualmente distribuidas (cualquiera que sea su distribución), con parámetros µ y σ, ambos finitos, así: Es decir, la distribución muestral de la media, es una distribución normal. Distribución muestral de algunos estadísticos Bajo las mismas circunstancias, calcular la variable tipificada: Z= X −µ σ/ n podemos N(0, 1) Eso supone que se puede utilizar la distribución normal estandarizada para conocer las probabilidades asociadas a los distintos valores del estadístico en su distribución muestral. Distribución muestral de algunos estadísticos El error típico y el tamaño muestral se encuentran íntimamente relacionados: conforme aumenta el tamaño muestral, disminuye el error típico. Conforme la variabilidad tiende a 0, los posibles valores que tome el estadístico se parecerán cada vez más a su valor esperado µ Si el parámetro σ es desconocido: Z= X −µ ~ S/ n =Z= X −µ S / n −1 tn-1 Si el parámetro σ es desconocido pero n ≥ 100: Z= X −µ σ/ n N(0, 1) Distribución muestral de algunos estadísticos Distribución muestral de la varianza Existen dos tipos de varianza: X ∑ y la insesgada n − 1 2 la sesgada − (X )2 Ambas tienen una distribución idéntica pero no es una distribución conocida. Para que sigan una distribución conocida es necesario transformarlas: Si n > 30, entonces: Z= (nS 2 / σ 2 ) − (n − 1) 2(n − 1) ~ [ (n − 1) S = 2 ] / σ 2 ) − (n − 1) 2(n − 1) N(0,1) Distribución muestral de algunos estadísticos Distribución muestral de la proporción El estadístico “proporción de éxitos en n extracciones” p = X/N, con X = Nº éxitos en las n extracciones, se distribuye según una Binomial (n, π) con E(p) = π y σ(p) =