Tema 13: Intervalos de Confianza (PDF)
Document Details
Uploaded by EyeCatchingDramaticIrony
Tags
Summary
Este documento presenta una introducción a los intervalos de confianza, un concepto fundamental en estadística. Describe las definiciones, métodos, y consideraciones a tener en cuenta para la construcción de estos intervalos. Se exploran temas como la estimación puntual y la necesidad de considerar la incertidumbre en los procesos de estimación.
Full Transcript
ón ill Capı́tulo 13 r Intervalos de confianza st Ca El procedimiento...
ón ill Capı́tulo 13 r Intervalos de confianza st Ca El procedimiento de estimación puntual parece demasiado drástico y es más natural tratar de determinar una región, función de la muestra, dentro de la cual se pueda asegurar que se encuentra el parámetro. Como la incertidumbre o se modeliza por probabilidad se busca una región que tenga una probabilidad alta de contener al parámetro y para facilitar su manejo se tratará de conseguir rr regiones que sean un intervalo, si el parámetro es unidimensional. zo 13.1. Regiones de confianza an Definición 13.1 (Familia de conjuntos aleatorios). Sea X una v.a. con fdD F ∈ {Fθ : θ ∈ Θ} ⊆ Rk y X = (X1 ,... , Xn ) una m.a.s de X. M Se dirá que S(X) es una familia de conjuntos aleatorios para θ si S(x) ⊆ Θ ∀x ∈ X a Definición 13.2 (Región de confianza). Una familia de conjuntos aleatorios S(X) se dirá que es una región de confianza para θ al nivel 1 − α (0 < α < 1) cı́ y se denotará S(X) = RC(θ, 1 − α), si Pθ [S(X) 3 θ] ≥ 1 − α ∀θ ∈ Θ Lu Se denomina coeficiente de confianza a ı́nf Pθ [S(X) 3 θ] θ 1 13.2. MÉTODOS GENERALES PARA LA CONSTRUCCIÓN DE 2 INTERVALOS DE CONFIANZA En particular, si Θ ⊆ R y S(X) = (T1 (X), T2 (X)), con T1 (X) ≤ T2 (X) se dirá que S(X) es un intervalo de confianza y se denotará ón S(X) = IC(θ, 1 − α) ill 13.2. Métodos generales para la construcción de intervalos de confianza r st Expondremos a continuación los dos métodos más usuales para la construcción de intervalos de confianza. Método de la cantidad pivotal Ca Definición 13.3 (Pivot). Sea X1 ,... , Xn una m.a.s de una v.a. X con fdD o F ∈ {Fθ , θ ∈ Θ ⊆ R} una función real. Se dirá que T (X, θ) es un pivot o cantidad pivotal para θ si: rr a) T (X, θ) es una función medible para cada valor de θ b) La distribución de T (X, θ) no depende de θ zo Sea T (X, θ) un pivot. Dado α ∈ (0, 1), existen λ1 (α) y λ2 (α), que no dependen an de θ de forma que Pθ (λ1 (α) ≤ T (X, θ) ≤ λ2 (α)) ≥ 1 − α M Despejando θ en las desigualdades λ1 (α) ≤ T (X, θ) y T (X, θ) ≤ λ2 (α) a obtendremos los valores T1 (X) y T2 (X) tales que cı́ P (T1 (X) ≤ θ ≤ T2 (X)) ≥ 1 − α Lu Nota 13.1. Si T (X, θ) sigue una distribución continua es posible encontrar λ1 (α) y λ2 (α) de forma que Pθ (λ1 (α) ≤ T (X, θ) ≤ λ2 (α)) = 1 − α ∀θ CAPÍTULO 13. INTERVALOS DE CONFIANZA 3 Nota 13.2. Ya que los valores λ1 (α) y λ2 (α) no quedan determinados de forma ón única, y teniendo en cuenta que la información que proporciona el intervalo de confianza es más precisa cuanto menor sea su amplitud, es interesante de- terminar λ∗1 (α) y λ∗2 (α) de forma que se minimice la amplitud del intervalo, o ill bien el valor esperado de la amplitud. La amplitud del intervalo suele ser también una función decreciente del tamaño muestral n. Un incremento de n lleva asociado un incremento de la precisión r del intervalo. st Método de general de Neyman Ca Sea X1 ,... , Xn m.a.s. de X con fdD F ∈ {Fθ , θ ∈ Θ} una función real y T (X) un estadı́stico. Dado α ∈ (0, 1), existen λ1 (α, θ) y λ2 (α, θ) que dependen de θ de forma que Pθ (λ1 (α, θ) ≤ T (X) ≤ λ2 (α, θ)) ≥ 1 − α o rr si además las funciones λ1 y λ2 son estrictamente monótonas en θ, del mismo sentido y las ecuaciones λ1 (α, θ) = T (X) zo λ2 (α, θ) = T (X) an se pueden invertir para resolverlas en θ como función de T = t, entonces se puede construir un intervalo para θ de grado de confianza 1 − α. M Al obtener los valores λ1 (α, θ) y λ2 (α, θ) despejamos el parámetro θ y obtene- mos el intervalo de confianza. a 13.3. Tamaño de la muestra cı́ Hasta ahora hemos estudiado métodos para obtener intervalos de confianza de Lu parámetros de una población, basándonos en la información contenida en una muestra dada. Sin embargo, se puede pensar que el intervalo de confianza es demasiado amplio, reflejando una importante incertidumbre sobre el parámetro estimado. La única forma de obtener un intervalo más preciso, con un nivel de confianza dado, es aumentando el tamaño muestral. 4 13.4. INTERVALOS DE CONFIANZA EN POBLACIONES NORMALES En algunas circunstancias, se puede fijar previamente la amplitud del intervalo, ón eligiendo un tamaño muestral adecuado. Por ejemplo, en el caso de la media de una población normal con σ conocido, si se fija la amplitud L y se mantiene el nivel de confianza en 1 − α el tamaño muestral óptimo es ill 2 σ2 n = 4z1−α/2 L2 r 13.4. Intervalos de confianza en poblaciones st normales Ca Intervalo de confianza para la media si la varianza es conocida Sea una población con distribución normal N (µ, σ) de donde se extrae una m.a.s. de tamaño n, con σ conocida. o X̄ − µ rr Se puede tomar el pivote T (X, µ) = √ ∼ N (0, 1). σ/ n El I.C. para µ de nivel 1 − α vendrá dado por la expresión zo σ σ P (λ1 ≤ N (0, 1) ≤ λ2 ) = 1 − α ⇒ P λ1 √ ≤ X̄ − µ ≤ λ2 √ =1−α n n an σ σ ⇒ P X̄ − λ2 √ ≤ µ ≤ X̄ − λ1 √ =1−α n n σ σ y, por tanto, el intervalo obtenido, será X̄ − λ2 √ , X̄ − λ1 √ cuya longi- M n n tud es σ σ σ D = λ1 √ − λ2 √ = √ (λ2 − λ1 ) n n n a distancia que deberá ser mı́nima sujeta a la condición cı́ P (λ1 ≤ N (0, 1) ≤ λ2 ) = 1 − α Lu Empleando el método de los multiplicadores de Lagrange se deberá buscar el mı́nimo de 1 2 Z λ2 σ 1 − u Φ = √ (λ2 − λ1 ) + γ √ e 2 du − (1 − α) n λ1 2π CAPÍTULO 13. INTERVALOS DE CONFIANZA 5 cuyas primeras derivadas parciales son ón 1 δΦ σ 1 − λ22 = √ + γ√ e 2 = 0 δλ2 n 2π ill 1 δΦ σ 1 − λ21 = √ + γ√ e 2 = 0 δλ1 n 2π 1 r Z λ2 δΦ 1 − u2 = √ e 2 du − (1 − α) = 0 δγ 2π st λ1 Ca 1 2 1 − λ2 − λ21 De las dos primeras ecuaciones se obtiene e 2 = e 2. Por tanto, λ21 = λ22 cuyas posibles soluciones son: λ1 = λ2 ⇒ D = 0 (Contradicción) o rr σ σ λ1 = −λ2 ⇒ X̄ − λ √ , X̄ + λ √ , con λ = z1−α/2. n n zo Intervalo de confianza para la media si la varianza es desconocida an Dado que σ es desconocido se recurre a la cantidad pivotal X̄ − µ T (X, µ) = √ ∼ tn−1 S/ n − 1 M El I.C. para µ de nivel 1 − α vendrá dado por la expresión a P (λ1 ≤ tn−1 ≤ λ2 ) = 1 − α cı́ Por la simetrı́a de la distribución respecto al origen de coordenadas, siguiendo el mismo procedimiento que para el caso anterior se llega a que el intervalo de longitud mı́nima es aquel que verifica λ1 = −λ2 , λ = tn−1,1−α/2. Por tanto, Lu X̄ − µ P −tn−1,1−α/2 ≤ √ ≤ tn−1,1−α/2 = 1 − α S/ n − 1 S S ⇒ P X̄ − tn−1,1−α/2 √ ≤ µ ≤ X̄ + tn−1,1−α/2 √ =1−α n−1 n−1 6 13.4. INTERVALOS DE CONFIANZA EN POBLACIONES NORMALES y, por tanto, el intervalo obtenido, será ón S S X̄ − t1−α/2 √ , X̄ + t1−α/2 √ n−1 n−1 ill Intervalo de confianza para la varianza si la media es desconocida r Tomamos como pivote el estadı́stico nS 2 st T (X, σ 2 ) = ∼ χ2n−1 σ2 Ca La distribución χ2 no es simétrica, por lo cual el intervalo de longitud mı́nima se obtiene para unos lı́mites extremos de cálculo complejo. En este caso, para llegar a un intervalo único, se opta por el criterio de repartir por igual la α probabilidad complementaria a 1 − α, es decir, α1 = α2 =. Para calcular 2 o rr zo an los valores λ1 y λ2 que verifican P (λ1 ≤ χ2n−1 ≤ λ2 ) = 1 − α M se tiene en cuenta que α P (χ2n−1 ≤ λ1 ) = ⇒ λ1 = χ2n−1;α/2 2 α α P (χ2n−1 ≤ λ2 ) = 1 − α + = 1 − ⇒ λ2 = χ2n−1;1−α/2 a 2 2 cı́ determinado λ1 y λ2 , tendremos que Lu nS 2 P χ2n−1;α/2 ≤ 2 ≤ χ2n−1;1−α/2 =1−α σ ! nS 2 nS 2 ⇒P ≤ σ2 ≤ =1−α χ2n−1;1−α/2 χ2n−1;α/2 CAPÍTULO 13. INTERVALOS DE CONFIANZA 7 y, por tanto, el intervalo obtenido, será ón ! nS 2 nS 2 , χ2n−1;1−α/2 χ2n−1;α/2 ill Intervalo de confianza para la varianza si la media es conocida r Tomamos como pivote el estadı́stico st n 2 X (Xi − µ)2 T (X, σ ) = ∼ χ2n σ2 Ca i=1 α Al igual que en el caso anterior haremos, α1 = α2 = y obtendremos 2 λ1 = χ2n;α/2 o λ2 = χ2n;1−α/2 rr determinado λ1 y λ2 , tendremos que n ! X (Xi − µ)2 χ2n;α/2 ≤ ≤ χ2n;1−α/2 zo P =1−α i=1 σ2 n n ! X (Xi − µ)2 X (Xi − µ)2 ⇒P ≤ σ2 ≤ =1−α an i=1 χ2n;1−α/2 i=1 χ2n−1;α/2 y, por tanto, el intervalo obtenido, será M n n ! 1 X 1 X (Xi − µ)2 , (Xi − µ)2 χ2n−1;1−α/2 i=1 χ2n−1;α/2 i=1 a Intervalo de confianza para la diferencia de medias con σ1 y σ2 conocidas cı́ Si se dispone de dos m.a.s. de tamaños n1 y n2 de dos poblaciones, X con dis- Lu tribución N (µ1 , σ1 ) e Y con distribución N (µ2 , σ2 ) respectivamente, se puede tomar el pivote X̄ − Ȳ − (µ1 − µ2 ) T (X; µ1 , µ2 ) = r 2 ∼ N (0, 1) σ1 σ22 + n1 n2 8 13.4. INTERVALOS DE CONFIANZA EN POBLACIONES NORMALES Dada la simetrı́a de la distribución con respecto al origen de coordenadas se ón tendrá que λ2 = −λ1 = z1−α/2 ill X̄ − Ȳ − (µ1 − µ2 ) P (λ1 ≤ N (0, 1) ≤ λ2 ) = 1 − α ⇒ P −z1−α/2 ≤ r ≤ z1−α/2 =1−α σ12 σ22 + n1 n2 r st r r ! σ12 σ22 σ12 σ22 Por tanto, el IC será X̄ − Ȳ − z1−α/2 + , X̄ − Ȳ + z1−α/2 + n1 n2 n1 n2 Ca Intervalo de confianza para la diferencia de medias con varianzas desconocidas pero Si se dispone de dos m.a.s. de tamaños n1 y n2 de dos poblaciones, X con o distribución N (µ1 , σ) e Y con distribución N (µ2 , σ) respectivamente, con σ rr desconocido, se puede tomar el pivote X̄ − Ȳ − (µ1 − µ2 ) T (X; µ1 , µ2 ) = r s ∼ tn1 +n2 −2 zo 1 1 (n1 − 1)Sc21 + (n2 − 1)Sc22 + n1 n2 n1 + n2 − 2 an Dada la simetrı́a de la distribución con respecto al origen de coordenadas se tendrá que λ2 = −λ1 = tn1 +n2 −2,1−α/2 M P (λ1 ≤ tn1 +n2 −2 ≤ λ2 ) = 1 − α ⇒ X̄ − Ȳ − (µ1 − µ2 ) a P −tn1 +n2 −2,1−α/2 ≤ r s ≤ tn1 +n2 −2,1−α/2 =1−α 1 1 (n1 − 1)Sc21 + (n2 − 1)Sc22 + cı́ n1 n2 n1 + n2 − 2 Lu Por tanto, el IC será s 1)Sc21 1)Sc22 r 1 1 (n1 − + (n2 − X̄ − Ȳ ∓ tn1 +n2 −2 + n1 n2 n1 + n2 − 2 CAPÍTULO 13. INTERVALOS DE CONFIANZA 9 Intervalo de confianza para el cociente de varianzas poblacionales ón Si se dispone de dos m.a.s. de tamaños n1 y n2 de dos poblaciones, X con dis- tribución N (µ1 , σ1 ) e Y con distribución N (µ2 , σ2 ) respectivamente, se puede ill tomar el pivote σ2 S 2 σ2 T (X; 12 ) = c21 22 ∼ Fn1 −1,n2 −1 σ2 Sc2 σ1 r La distribución F no es simétrica, por lo que dada la dificultad para el intervalo α st de longitud mı́nima se toma α1 = α2 = , de donde se tiene que 2 λ1 = Fn1 −1,n2 −1,α/2 Ca λ2 = Fn1 −1,n2 −1,1−α/2 de donde se tiene que Sc21 σ22 P (λ1 ≤ Fn1 −1,n2 −1 ≤ λ2 ) = 1 − α ⇒ P Fn1 −1,n2 −1,α/2 ≤ 2 · 2 ≤ Fn1 −1,n2 −1,1−α/2 = 1 − α o Sc2 σ1 rr σ2 Sc21 Sc21 1 1 Por tanto, el IC para 12 será 2 , 2 σ2 Sc2 Fn1 −1,n2 −1,1−α/2 Sc2 Fn1 −1,n2 −1,α/2 zo an M a cı́ Lu