Clase 5 2024 Estadística Inferencial PDF

Estadística Inferencial Kabir Prem Sadarangani K. 27 de Agosto 2024 PhD Universidad Autónoma de Madrid Msc. Health and Society, University College London Resultados de Aprendizaje 1.- Los estudiantes serán capaces de comprender e interpretar intervalos de confianza. 2.- Los estudiantes serán capaces de formular hipótesis nulas y alternativas apropiadas para diferentes escenarios de investigación. 3.- Los estudiantes aprenderán a interpretar los valores p y a tomar decisiones estadísticas basadas en estos resultados. 4.- Los estudiantes serán capaces de comprender la normalidad de un conjunto de datos utilizando métodos gráficos y pruebas estadísticas. Resultados de Aprendizaje 5.- Los estudiantes serán capaces de interpretar coeficientes de correlación (como Pearson y Spearman) y podrán determinar la fuerza y la dirección de la relación entre dos variables cuantitativas. 6.- Los estudiantes podrán conocer pruebas de hipótesis para determinar la significancia de las asociaciones observadas. 7.- Los estudiantes conocerán los análisis de regresión lineal y logístico, interpretando los coeficientes de regresión. 8.- Los estudiantes serán capaces de conocer una base de datos en salud, identificando variables relevantes y aplicando técnicas estadísticas para responder a preguntas de investigación específicas. Acercamiento al Análisis Estadístico Existen dos acercamientos básicos al análisis estadístico 1. Estimación por Intervalos de Confianza. 2. Contraste de Hipótesis. Estimación por Intervalos de Confianza Estimación: Se utiliza cuando hemos medido o analizado de una muestra, y queremos sacar conclusiones acerca de la población de la cual esa muestra proviene. Esto implica que tenemos una muestra representativa. Esto se realiza a través de la estimación de intervalos de confianza. Estimación por Intervalos de Confianza Estimación por Intervalos de Confianza Estimación por Intervalos de Confianza Contraste de Hipótesis El Testeo de Hipótesis es usado para calcular la probabilidad (pvalue) de encontrar diferencias entre grupos o la de obtener un efecto debido a la variación por chance, si la hipótesis nula es verdadera. Mientras más pequeño el valor de p, menor es la razón para afirmar nuestra hipótesis nula. P +/- 0.3 Pobre +/- 0.3 -> +/- 0.4 Aceptable +/- 0.4 -> +/- 0.6 Bueno +/- 0.6 -> +/- 0.8 Muy Bueno +/- > 0.8 Excelente Coeficiente de Correlación Pearson El coeficiente de correlación de Pearson es usado en estadística paramétrica. Es de suponer que ambas variables “X” e “Y” estén normalmente distribuidas. Si la suposición de distribución normal es violada, las correlaciones no paramétricas, como Spearman (p) o Kendall (τ) deben ser usadas. Coeficiente de Coeficiente de Correlación Correlación !Ojo! La correlación no supone a priori en cuanto una variable es dependiente en la otra. La correlación no implica causalidad. Cuando “X” y “Y” están correlacionadas, no se puede concluir que una es la causa de la otra. Al contrario, si una correlación no existe, una relación causal puede ser desechada. Pruebas de Asociación Pruebas de Asociación Medidas de Asociación Relativas 0 1 ∞ 1 Ausencia de asociación. >1 Asociación positiva o directa: Factor de Riesgo. 1 y su LI es < 1 Asoc. causal no significativa (daño) Ej: 1,78 (95% LC 0,91-1,97) > 1 y su LI es > 1 Asoc. causal significativa (daño) Ej: 1,78 (95% LC 1,27-1,97) < 1 y su LS es < 1 Asoc. causal significativa (protección) Ej: 0,93 (95% LC 0,83-0,97) < 1 y su LS es > 1 Asoc. causal no significativa (protección) Ej: 0,93 (95%LC 0,87-1,12) 30 Relación entre las Medidas de Asociación Relativas y Límites de Confianza ¿Cuál decisión de BDZ prescriben? ØObjetivo: Determinar diferencias en el riesgo de fractura de cadera en personas de 65 años y más al ingerir actualmente BZD con vida media de eliminación prolongada (24 hrs. o más) o BZD de vida media corta (menos de 24 hrs.) en residentes de la provincia de Saskatchewan (Canadá) de 65 años y más. (Consumo actual: Cumplir con la prescripción en los 30 días anteriores a la entrevista) ØMuestra: 4501 casos y 24041 controles. Entre 1977 y 1985. ØResultados: El RR fractura de cadera fue: Ø1.7 (95% IC, 1.5-2.0) para quienes consumen actualmente BDZ de vida media larga. Ø1.2 (95% IC, 0.9-1.3), para los que consumen BZD de vida media corta, controlando las variables sexo, edad, hospitalización o cuidados por enfermera en el hogar. Ray WA, Griffin MR, Downey W. Benzodiazepines of long and short elimination half-life and the risk of hip fracture. JAMA 1989;262:3303-7 Regresión Lineal Estamos interesados en como una variable (X) puede ser utilizada para predecir otra (Y) Y es la variable “dependiente” y de tipo continua Y es el “outcome” el cual queremos predecir X se llama variable “predictora” or “explanatoria” (es la independiente) 33 Regresión Lineal Alumno CI Promed X io de Nota Y 1 110 1 Tenemos datos de CI 2 112 1.6 y su promedio de 3 118 1.2 4 119 2.1 notas de 12 5 122 2.6 escolares 6 125 1.8 7 127 2.6 8 130 2 9 132 3.2 10 134 2.6 11 136 3 12 138 3.6 Total 1503 27.3 Regresión Lineal 3.5 3 promedio de notas 2 2.5 1.5 1 110 120 130 140 CI Regresión Lineal Regresión Lineal El coeficiente para edad es 0.49, eso significa que por cada año más existe un aumento de 0.49mmHg en la presión arterial sistólica. La constante es de 105. Por ende la ecuación de regresión de la presión arterial sistólica sobre la edad es: PA sistólica = 105 + 0.49*Edad Regresión Logística El modelo de regresión logística se La variable Es una utiliza para La variable dependiente variación explicar los independien (Y) es una de la efectos de la variable te (X) puede regresión variable ser continua dicotómica ordinaria. explicativa o categórica o binaria sobre la respuesta binaria. Regresión Logística A diferencia de la regression lineal, la regression logística La regresión no asume que la Tampoco asume logística estima la relación entre las probabilidad de que la variable variables dependiente o los que ocurra un independientes y la determinado términos de error se variable dependiente distribuyen evento en función es lineal. normalmente. de una función no lineal Regresión Logística COMMAND: logistic cvd sex Logistic regression Number of obs = 8148 LR chi2(1) = 5.58 Prob > chi2 = 0.0182 Log likelihood = -3585.141 Pseudo R2 = 0.0008 cvd | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval] + sex |.8666514.0524559 -2.36 0.018.7697038.9758099 0=Hombre (referencia) 1=Mujer Regresión Logística Las mujeres en comparación a los hombres tienen menor probabilidad de tener ECV, OR

Clase 5 2024 Estadística Inferencial PDF

Document Details

Tags

Related

Summary

Full Transcript