Bioestadística - Tema 3: Introducción a la Probabilidad PDF
Document Details
Uploaded by GoldenLavender4371
Tags
Summary
Este documento presenta una introducción a la probabilidad en el contexto de la bioestadística. Se definen conceptos básicos como espacio muestral y sucesos, y se exploran diferentes tipos de probabilidad (clásica, frecuencial y subjetiva). El documento analiza la dependencia e independencia de sucesos y proporciona ejemplos de aplicación en la medicina. Incluye también una introducción a la curva ROC y su uso en el diagnóstico médico. Explica diferentes medidas de asociación y su aplicación en estudios de factores de riesgo.
Full Transcript
Bioestadística Tema 3: Introducción a la probabilidad. Tema 3: Introducción a la probabilidad 1 La probabilidad es una función matemática que mide la incertidumbre. La probabilidad de la ocurrencia de un determinado suceso INDICA la frecuencia relativa con que dicho suceso tendrá lu...
Bioestadística Tema 3: Introducción a la probabilidad. Tema 3: Introducción a la probabilidad 1 La probabilidad es una función matemática que mide la incertidumbre. La probabilidad de la ocurrencia de un determinado suceso INDICA la frecuencia relativa con que dicho suceso tendrá lugar a largo plazo en pruebas repetidas en condiciones similares. La probabilidad tiene que ver con los resultados que pueden obtenerse ó los SUCESOS que pueden ocurrir cuando se realiza un EXPERIMENTO. EXPERIMENTO : cualquier proceso cuyos resultados no se conocen de antemano con certeza. En un experimento cada posible resultado puede ser especificado antes de realizar dicho experimento y se pueden asignar probabilidades a los distintos resultados y combinaciones de resultados. Tema 3: Introducción a la probabilidad 2 El objetivo de la INFERENCIA ESTADÍSTICA es conocer ó estimar la distribución de una ó varias variables en la población a partir de la información de una muestra. Población X x1,…xr …. Elijo un individuo al azar x La distribución de una variable X en la población es la distribución de probabilidades del experimento elegir un individuo de la población y observar el valor de X Las frecuencias relativas en una muestra estiman las probabilidades. Tema 3: Introducción a la probabilidad 3 DEFINICIONES BÁSICAS ESPACIO MUESTRAL : Conjunto de los posibles resultados de un experimento : Ω SUCESO : Cualquier subconjunto del espacio muestral: A,B,C SUCESO SIMPLE ó ELEMENTAL : Si no se puede expresar como unión de otros sucesos. El espacio muestral es también el conjunto de todos los sucesos elementales: OPERACIONES ENTRE SUCESOS Unión A U B = { ocurre A ó ocurre B } Intersección A ∩ B = { ocurre A y ocurre B } Complementario A= { no ocurre A } Sucesos disjuntos ó mutuamente excluyentes A ∩ B =Ø propiedades: A ∪ B = ( A ∩ B) A ∩ B = ( A ∪ B) A = ( A ∩ B) ∪ ( A ∩ B ) Tema 3: Introducción a la probabilidad 4 TRES PUNTOS DE VISTA EN LA INTERPRETACIÓN DE LAS PROBABILIDADES PROBABILIDAD CLÁSICA : Cociente entre casos favorables y casos posibles Cuando todos los sucesos elementales son igualmente probables PROBABILIDAD FRECUENCIAL : Límite de la frecuencia relativa. Si el "experimento" puede repetirse muchas veces en las mismas condiciones PROBABILIDAD SUBJETIVA : Grado de creencia del investigador.Basada en la experiencia ó información previa. Tema 3: Introducción a la probabilidad 5 En abstracto, independientemente de la interpretación, la probabilidad es una aplicación definida en "ciertos subconjuntos" de Ω que cumple tres AXIOMAS : A1: 0 ≤ p(A) ≤ 1 A2: p(Ω = 1) A3: p( ∪ Ai ) = ∑ p(Ai ) si Ai son mutuamente excluyentes i i A partir de estos axiomas se demuestran las primeras propiedades: 1 : p ( A ∪ B ) = p ( A) + p ( B ) − p ( A ∩ B ) 2 : p ( A ) = 1 − p ( A) 3 : p ( A) = p ( A ∩ B ) + p ( A ∩ B ) Tema 3: Introducción a la probabilidad 6 DEPENDENCIA E INDEPENDENCIA Ejemplo : De los datos recogidos en la encuesta a los alumnos de 1º de Medicina en el curso 97-98 se tiene la tabla siguiente: Alcohol\Sexo Varón Mujer SI 25 45 NO 8 52 Se elige un individuo al azar : Ω = { a1,....a130 } Sea A= { Varón y SI bebe alcohol } , p(A) =casos favorables/casos posibles = 25/130 La tabla de probabilidades conjunta: Alcohol\Sexo Varón Mujer SI 0.19 0.35 NO 0.06 0.40 Supongamos que además se sabe que el individuo elegido es Varón ¿ Cual es la probabilidad de beba alcohol? : El espacio muestral cambia : Ω' = { b1,...b33} La probabilidad cambia : p‘(A)= 25/33=0.76 Conocemos nueva información, la probabilidad cambia, la nueva probabilidad se denomina PROBABILIDAD CONDICIONADA Tema 3: Introducción a la probabilidad 7 Ejemplos : - En un juego de cartas cuando se han repartido varias cartas, la probabilidad de sacar una carta determinada en la siguiente ronda depende de las cartas ya jugadas. - En el estudio de la supervivencia a una enfermedad, la probabilidad de que un individuo sobreviva 1 año cambia si el individuo ha sobrevivido 6 meses. - La probabilidad de que un paciente tenga una enfermedad cambia después de conocer el resultado de análisis y pruebas diagnósticas. Definición : probabilidad condicionada de A a B p(A/B) = p(A∩B)/p(B) En el ejemplo inicial podemos construir las tablas de probabilidades condicionadas : Alcohol\Sexo varon mujer varón mujer SI 0.758 0.469 0.357 0.643 NO 0.242 0.541 0.133 0.867 Definición : Diremos que dos sucesos son independientes si el conocimiento de la ocurrencia de uno no modifica laprobabilidad de aparición del otro. A y B independientes ↔ p(A/B) = p(A) ↔ p(B/A) = p(B) Tema 3: Introducción a la probabilidad 8 Ejemplo: Mamografía ¿Cuál es la probabildiad de que una mujer de 54 años con una mamografía anormal tenga cáncer de pecho? P (C+, test +)=.0027 P(C+)=.003 P(C+, test -)=.0003 P(-, test +)=.10967 P(C-)=.997 P(-, test -) =.88733 ______________ 1.0 Probabilidad de cancer de pecho (entre las mujeres de 54 años) Ejemplo: Mamografía ¿Cuál es la probabildiad de que una mujer de 54 años con una mamografía anormal tenga cáncer de pecho? sensitividad P (C+, test +)=.0027 P(test +/C+)=.90 P(C+)=.003 P(test -/C+) =.10 P(C+, test -)=.0003 P(test +/C-) =.11 P(-, test +)=.10967 P(C-)=.997 P(test -/C-) =.89 P(-, test -) =.88733 ______________ especificidad 1.0 Probabilidad de cancer de pecho (entre las mujeres de 54 años) P(C+/test+)=.0027/(.0027+.10967)=2.4% REGLA DE LA MULTIPLICACIÓN : p(A∩B) = p(B)p(A/B) = p(A)p(B/A) PARTICIÓN DE UN ESPACIO: Una familia de sucesos mutuamente excluyentes B1,...,Bn cuya unión es el total. TEOREMA DE LA PROBABILIDAD TOTAL Sea B1,...,Bn una partición de Ω y A un suceso de Ω: p(A) = p(A∩B1) + p(A∩B2) +....+ p(A∩Bn) p(A) = p(A/B1)p(B1) + p(A/B2)p(B2) +....+ p(A/Bn)p(Bn) TEOREMA DE BAYES Sea B1,...,Bn una partición de Ω y A un suceso con probabilidad positiva : p ( A / Bi ) p ( Bi ) p ( Bi / A) = n ∑ p( A / B ) p( B ) j =1 j j Tema 3: Introducción a la probabilidad 11 APLICACIÓN DE LA PROBABILIDAD CONDICIONADA A LA DIAGNOSIS MÉDICA El problema fundamental del diagnóstico médico es el de que el médico puede conocer la probabilidad de un complejo particular de síntomas y signos producidos por una enfermedad pero habitualmente lo que necesita conocer es la probabilidad de la enfermedad cuando se observa el complejo de síntomas en un paciente. SITUACION : Se dispone de un test, prueba ó un conjunto de síntomas para ver si una persona tiene ó no una determinada enfermedad Normalmente se conoce la tabla de probabilidades condicionadas: E E p(+/E) =Sensitividad = probabilidad de que el conjunto de síntomas esté presente dado que la persona tiene + P(+/E) p(+/ E) la enfermedad p(-/E)= Probabilidad de falso negativo - P(-/E) p(-/E ) Especificidad = probabilidad de que el conjunto de síntomas no esté p(-/ E ) = presente dado que la persona no tiene la enfermedad p(+/E ) = Probabilidad de falso negativo Tema 3: Introducción a la probabilidad 12 CUANTO MAYOR SEAN LAS SENSITIVIDAD Y LA ESPECIFICIDAD MAS FIABLE SERÁ EL TEST La tabla de probabilidades condicionadas que queremos conocer: E E p(E/+) = valor predictivo positivo = probabilidad de + P(E/+) p(E /+ ) que la persona este enferma cuando presenta los síntomas p( E /+)= probabilidad de error en el diagnóstico. - P(E/-) p(E /- ) p( E /- ) = Valor predictivo negativo = probabilidad de que la persona esté sana cuando no presenta los síontomas. p(E/-)= probabilidad de error en el diagnóstico Tema 3: Introducción a la probabilidad 13 Los valores predictivos se calculan a partir de la sensititividad, la especificidad y p(E) utilizando el teorema de Bayes. VP+= VP-= Ejemplos : p(E) Sensitividad Especificidad VP+ VP- 0.75 0.90 0.63 0.88 0.67 0.25 0.90 0.63 0.45 0.95 0.01 0.90 0.63 0.02 0.998 Tema 3: Introducción a la probabilidad 14 APLICACIÓN EN ESTUDIOS DE FACTORES DE RIESGO + Tener el F.R - No tener el F.R nos interesa calcular : probabilidades del tipo p(E/+), p(E/-) y MEDIDAS DE ASOCIACIÓN F.R.-ENFERMEDAD Riesgo Relativo RR : Odds Ratio OR : p ( E / + ) /(1 − p ( E / + )) p ( E / − ) /(1 − p( E / − ) Tema 3: Introducción a la probabilidad 15 CURVA ROC En muchas ocasiones las pruebas diagnósticas son cuantitativas, sobre todo cuando corresponden a determinaciones analíticas. En ese caso el diagnóstico se haría fijando un punto de corte, un valor determinado del valor analítico, que marque el límite entre sano y enfermo. Podemos diseñar otras pruebas diagnósticas moviendo el punto de corte: Si queremos aumentar la probabilidad de detectar pacientes enfermos moveríamos el punto de corte hacia la izquierda, Y entonces también aumentaremos el número de falsos positivos. Si movemos el punto de corte hacia la derecha, disminuiremos los falsos positivos, pero a costa de aumentar el de falsos negativos. Resumiendo, un aumento de la sensibilidad disminuye la especificidad, y viceversa. Tema 3: Introducción a la probabilidad 16 curva ROC. Es una herramienta útil para evaluar la capacidad diagnóstica de una prueba cuantitativa para todos los posibles puntos de corte. Para obtener la curva ROC, se calcula la sensibilidad y especificidad para cada uno de los diferentes valores observados en nuestros datos y se representan en una gráfica, con la Sensitividad en el eje de las Y, (1-Especificidad) en el eje de las X. Una prueba que no discrimine en absoluto, corresponde a la línea diagonal (a 45º) que aparece en la figura. Por lo tanto, cuanto más desplazada esté la curva ROC hacia el vértice superior izquierdo, mejor es la capacidad discriminatoria de la prueba. Precisamente una forma de evaluar de manera global esa capacidad de discriminación consiste en calcular el área del polígono que queda debajo de la curva ROC, y se denomina área bajo la curva, sirviendo como índice de comparación entre pruebas diagnósticas, cuanto mayor es el área mejor es la capacidad diagnóstica. Tema 3: Introducción a la probabilidad 17 Ejemplo: Evaluación del volumen corpuscular medio (VCM) en el diagnóstico de anemia ferropénica. Se usa como "patrón de oro" la existencia de depósitos de hierro en la médula ósea VCM Sin Fe (n=34): 52, 58, 62, 65, 67, 68, 69, 71, 72, 72, 73, 73, 74, 75, 76, 77, 77, 78, 79, 80, 80, 81, 81, 81, 82, 83, 84, 85, 85, 86, 88, 88, 90, 92 Con Fe (n=66): 60, 66, 68, 69, 71, 71, 73, 74, 74, 74, 76, 77, 77, 77, 77, 78, 78, 79, 79, 80, 80, 81, 81, 81, 82, 82, 83, 83, 83, 83, 83, 83, 83, 84, 84, 84, 84, 85, 85, 86, 86, 86, 87, 88, 88, 88, 89, 89, 89, 90, 90, 91, 91, 92, 93, 93, 93, 94, 94, 94, 94, 96, 97, 98, 100, 103 Donde se observa solapamiento. Para diversos puntos de corte las sensibilidad y proporciones de falsos positivos figuran en la siguiente tabla: Punto Corte Sensibilidad 1-Especificidad 65 3/34=0,088 1/66=0,015 70 7/34=0,206 4/66=0,061 75 13/34=0,382 10/66=0,152 80 19/34=0,559 19/66=0,288 85 27/34=0,794 37/66=0,561 90 32/34=0,941 49/66=0,742 92 33/34=0,971 53/66=0,803 Tema 3: Introducción a la probabilidad 18