Regresión Lineal y Análisis de Correlación

DivineGothicArt avatar
DivineGothicArt
·
·
Download

Start Quiz

Study Flashcards

38 Questions

¿Qué representan los métodos estadísticos presentados en el Capítulo 8 para comparar las medias de una variable entre dos poblaciones?

La relación entre una variable de resultado y una variable clasificatoria.

¿Qué es la regresión lineal?

La regresión lineal es una técnica estadística que estudia cómo relacionar una variable de resultado distribuida normalmente con una o más variables predictoras.

El coeficiente de correlación se utiliza para cuantificar la asociación entre dos variables categóricas.

False

En regresión lineal, la recta de regresión tiene la forma y = _ + _x, donde el primer blanco es la intersección y el segundo blanco es la pendiente de la línea.

¿Qué valores se utilizan para calcular Lxy y Lxx?

x, y, yi, y, yo, Xi

¿Cuál es la fórmula para calcular la pendiente de la recta de regresión?

Lxy / Lxx

¿Qué valor representa 'a' en la ecuación de la línea de regresión y = ______ + 0.608x?

21.52

La estadística F para regresión lineal simple sigue una distribución F con 1 y n-2 grados de libertad.

True

¿Cómo se calcula el valor p para la prueba F de regresión lineal simple?

Se calcula como p = Pr(F1, n – 2 > F)

¿Qué representa R2 en el contexto de regresión lineal?

R2 se define como Reg SS/Total SS y representa la proporción de la varianza de y que se explica por x.

¿Cómo se interpreta R2 en una regresión lineal?

R2 representa el porcentaje de la variación en la variable dependiente que puede explicarse por la variable independiente.

¿Cómo se puede interpretar el coeficiente β en una ecuación de regresión lineal?

Si β es mayor que 0, entonces a medida que x aumenta, el valor esperado de y aumentará. Si β es menor que 0, entonces a medida que x aumenta, el valor esperado de y disminuirá. Si β es igual a 0, no existe una relación lineal entre x e y.

¿Qué representa σ2 en el efecto de una línea de regresión?

σ2 representa la dispersión alrededor de la línea de regresión. Si σ2 es 0, todos los puntos caerán exactamente en la línea de regresión, mientras que si σ2 es mayor que 0, habrá mayor dispersión alrededor de la línea de regresión.

¿Cómo se calcula la estimación de la pendiente b en el método de mínimos cuadrados?

La estimación de la pendiente b se calcula como b = Lxy / Lxx, donde Lxy es la suma de los productos cruzados y Lxx es la suma de cuadrados de x.

¿Qué proporción de la varianza del FEV puede explicarse por la altura?

0.0513

¿Por qué la línea de regresión ajustada es estadísticamente significativa?

El estadístico F es mayor que 21.04.

¿El coeficiente de regresión muestral b es un estimador insesgado del coeficiente de regresión poblacional β?

True

¿Cuál es la fórmula para calcular la estadística de prueba tb?

tb = (s L yxxx) / 2

¿Qué se debe hacer si el valor de la estadística de prueba tt es mayor que n-2 o menor que -t para una prueba bilateral con nivel de significancia α?

Rechazar H0

El valor p viene dado por p = 2 × (área a la _ de t bajo una distribución tn-2) si t < 0.

izquierda

La prueba t de regresión lineal simple y la prueba F de la ecuación 11.7 siempre proporcionan los mismos valores p.

True

Relaciona los errores estándar con las estimaciones de intervalo para los parámetros de regresión:

Errores estándar y estimaciones de intervalo para los parámetros de una línea de regresión. = Datos sobre la precisión de las estimaciones. Comparar coeficientes de regresión con coeficientes publicados previamente. = Decidir si los resultados son comparables. Verificar si β0 y α0 están dentro de los intervalos de confianza del 95% para β y α. = Decidir si dos conjuntos de resultados son comparables.

¿Cuál es el propósito principal de los métodos de regresión lineal?

Relacionar una variable de resultado con una o más variables predictoras

¿Cómo se puede cuantificar la relación entre nivel de estriol y peso al nacer según el estudio Greene-Touchstone?

A través de una relación lineal representada por la ecuación E(y|x) = α + βx

La recta y = α + βx es la ______ de regresión en un modelo lineal.

recta

¿Qué se puede calcular para centrarnos más claramente en una cuestión relacionada con la regresión?

residuos sobre la línea de regresión ajustada

¿Qué se menciona como característica de los errores acerca de la recta de regresión verdadera?

Tienen varianza constante

¿Qué ocurre con la varianza de los residuos alrededor de la línea de regresión ajustada?

tienen diferentes varianzas dependiendo de qué tan lejos esté un valor x individual del valor medio x utilizado

En el caso que xx i − sea muy grande, ¿la recta de regresión se verá obligada a pasar por el punto (xi , yi )?

True

¿Cómo se define la desviación estándar de los residuos con respecto a la línea de regresión ajustada?

se da en la Ecuación 11.14

¿Por qué es arriesgado hacer predicciones a partir de una recta de regresión para valores de x muy alejados de x?

Porque es probable que las predicciones sean más inexactas.

¿Cómo se puede encontrar el FEV medio estimado y el error estándar de la estimación en el contexto de la función pulmonar?

Se puede encontrar utilizando la ecuación 11.12 y calculando el error estándar.

¿Cuál es el procedimiento para calcular el error estándar de una regresión lineal?

Se calcula utilizando la fórmula se^2y(^) = s / sqrt(n) * sqrt(1 + ((x - x̄)^2 / Σ(xi - x̄)^2)).

¿Cuál es la mejor estimación del valor promedio de y para una x dada en una regresión lineal?

La mejor estimación es y^ = a + bx.

¿Por qué el error estándar para el valor promedio de y aumenta a medida que la distancia de x se aleja del valor medio de x utilizado para la estimación?

Porque la precisión de la estimación disminuye cuanto más se aleja el valor de x del valor medio de x utilizado en la regresión.

¿Cómo se calcula el error estándar de la pendiente en un modelo de regresión lineal simple?

El error estándar de la pendiente se calcula como seb = syx / sqrt(Sumatoria de (xi - x̄)^2)

¿Cómo se calcula el intervalo de confianza del 95% para el parámetro 'β' en un modelo de regresión lineal simple?

El intervalo de confianza del 95% para β se calcula como (β ± t_(n-2,α/2) * seb)

¿Qué significa que un valor caiga dentro de un intervalo de confianza del 95% en un modelo de regresión lineal simple?

Significa que este valor es estadísticamente consistente con los datos y la estimación de los parámetros, dada la confianza del 95% en el intervalo.

Study Notes

Regresión y Métodos de Correlación

  • La regresión lineal es una técnica para relacionar una variable de resultado (y) con una o más variables predictoras (x1, ..., xk) donde las x pueden ser variables continuas o categóricas.

Introducción

  • Se presentan métodos estadísticos para comparar las medias de una variable de resultado distribuida normalmente entre dos poblaciones basándose en pruebas t.
  • Se consideran las técnicas como casos especiales de métodos de regresión lineal.

Ejemplos

  • El nivel de estriol en mujeres embarazadas cercanas al término se relaciona con el peso del recién nacido.
  • La presión arterial de los padres se relaciona con la presión arterial de los hijos.

Conceptos Generales

  • La recta de regresión se define como y = α + βx, donde α es la intersección y β es la pendiente de la línea.
  • La relación entre y y x se puede cuantificar ajustando una línea de regresión.
  • Se introduce un término de error e, que representa la varianza del peso al nacer entre todos los bebés de mujeres con un nivel de estriol determinado x.

Definiciones

  • La variable dependiente es la variable que se está tratando de predecir (y).
  • La variable independiente es la variable que se utiliza para intentar predecir la variable dependiente (x).

Interpretación de la Pendiente (β)

  • Si β > 0, entonces a medida que x aumenta, el valor esperado de y aumentará.
  • Si β < 0, entonces a medida que x aumenta, el valor esperado de y disminuirá.
  • Si β = 0, entonces no existe una relación lineal entre x y y.

Ajuste de Líneas de Regresión: Método de Mínimos Cuadrados

  • El método de mínimos cuadrados se utiliza para encontrar la línea de regresión que mejor se ajusta a los datos.
  • La pendiente de mínimos cuadrados (b) se calcula como b = Lxy / Lxx.
  • El signo de b es el mismo que el signo de la suma de los productos cruzados Lxy.### Estimación de la Recta de Mínimos Cuadrados
  • La ecuación 11.3 proporciona la fórmula para estimar los coeficientes de la recta de mínimos cuadrados y = a + bx: b = Lxy / Lxx y a = (∑yi - b∑xi) / n
  • La recta de regresión se puede utilizar para predecir valores de y para datos dados de x
  • El valor previsto, o promedio, de y para un valor dado de x se denota por yˆ y se estima mediante la fórmula yˆ = a + bx

Ejemplos de Aplicación

  • Ejemplo 11.8: se calcula la recta de regresión estimada para los datos de obstetricia utilizando los datos de la tabla 11.1
  • Ejemplo 11.9: se utiliza la recta de regresión para predecir el peso promedio al nacer de un feto si una mujer embarazada tiene un nivel de estriol de 15 mg/24 h
  • Ejemplo 11.10: se utiliza la recta de regresión para determinar el nivel de estriol para el que el peso previsto al nacer es de 2500 g

Conceptos de Regresión y Correlación

  • Definición 11.6: el valor previsto, o promedio, de y para un valor dado de x se estima mediante la recta de regresión
  • Definición 11.13: el cuadrado medio residual (Res MS) es la relación de la suma de cuadrados residual (Res SS) dividido por los grados de libertad de la suma residual de cuadrados (Res df)

Prueba F para Regresión Lineal Simple

  • Ecuación 11.7: se proporciona la fórmula para la estadística de prueba F para probar la hipótesis nula de que la pendiente de la recta de regresión es cero
  • Ecuación 11.5: se proporciona la fórmula para calcular la suma de cuadrados de regresión (Reg SS) y la suma de cuadrados residual (Res SS)
  • Tabla 11.2: se muestra un ejemplo de tabla de análisis de varianza (ANOVA) para la regresión lineal simple

Ejemplo de Aplicación de la Prueba F

  • Ejemplo 11.12: se aplica la prueba F para determinar la significancia de la línea de regresión derivada para los datos de peso al nacer-estriol en el ejemplo 11.8### Análisis de Regresión

  • En el análisis de regresión, se prueba la hipótesis nula (H0) que establece que la pendiente de la recta de regresión es igual a 0, lo que implica que no hay una relación lineal entre las variables.

  • La hipótesis alternativa (H1) establece que la pendiente de la recta de regresión es diferente de 0, lo que implica que hay una relación lineal entre las variables.

  • Se utiliza el estadístico F para probar la significancia estadística de la recta de regresión.

  • Si el valor de p es menor que 0.001, se rechaza la hipótesis nula y se acepta la hipótesis alternativa, lo que implica que la relación lineal entre las variables es significativa.

  • La medida de bondad de ajuste R2 se define como la proporción de la varianza de y que se explica por x.

  • R2 se calcula como la relación entre la suma de los cuadrados de la regresión (Reg SS) y la suma de los cuadrados totales (Total SS).

  • Si R2 es igual a 1, entonces toda la variación en y se puede explicar por la variación en x, y todos los puntos de datos caen en la recta de regresión.

  • Si R2 es igual a 0, entonces x no proporciona información sobre y, y la varianza de y es la misma con o sin conocimiento de x.

  • Si R2 está entre 0 y 1, entonces, para un valor dado de x, la varianza de y es menor que la varianza total, pero sigue siendo mayor que 0.

Ejemplos de Regresión

  • En el ejemplo 11.12, se encontró que la relación lineal entre el peso al nacer y el nivel de estriol es significativa, con un valor de p menor que 0.001.

  • La pendiente de la recta de regresión es de 0.0513, lo que significa que por cada aumento de 1 cm en la altura, el FEV aumenta en 0.0513 litros.

  • En el ejemplo 11.14, se encontró que la relación lineal entre el FEV y la altura en niños de 10 a 15 años es significativa, con un valor de p menor que 0.001.

  • La proporción de la varianza del FEV que se puede explicar por la altura es de 0.372.

Coeficiente de Regresión

  • El coeficiente de regresión muestral b es un estimador insesgado del coeficiente de regresión poblacional β.

  • La varianza de b se calcula como la suma de los cuadrados de la regresión (Reg SS) dividido entre la suma de los cuadrados totales (Total SS).

  • La mejor estimación de la varianza de σ2 se obtiene mediante el cálculo de sy x.

Prueba t para Regresión Lineal Simple

  • La prueba t se utiliza para probar la hipótesis nula (H0) que establece que el coeficiente de regresión β es igual a 0.

  • La estadística de prueba t se calcula como la relación entre el coeficiente de regresión muestral b y la desviación estándar de b.

  • Si el valor de p es menor que el nivel de significancia α, se rechaza la hipótesis nula y se acepta la hipótesis alternativa, lo que implica que la relación lineal entre las variables es significativa.

Aprende a relacionar variables y medir la correlación con técnicas estadísticas como la regresión lineal y pruebas t. Descubre cómo analizar las medias de variables de resultado entre diferentes poblaciones.

Make Your Own Quizzes and Flashcards

Convert your notes into interactive study material.

Get started for free

More Quizzes Like This

Quiz sur la régression linéaire
6 questions
Linear Regression in Statistics
5 questions
تحليل الانحدار الخطي
2 questions
Use Quizgecko on...
Browser
Browser