Introducción al Proceso de Datos

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

El coeficiente de correlación de Pearson puede tomar valores únicamente entre 0 y 1.

False (B)

La prueba estadística T de Student se utiliza para comparar la media de dos grupos.

True (A)

El análisis de varianza (Anova) se aplica para comparar medias de más de dos grupos.

True (A)

El coeficiente Phi se utiliza para variables nominales politómicas.

False (B) Signup and view all the answers

El coeficiente de determinación $R^2$ permite conocer la capacidad explicativa de la ecuación de regresión.

True (A) Signup and view all the answers

En una regresión lineal simple, la ecuación es $Y = a + bX$.

True (A) Signup and view all the answers

La regresión logística se usa para analizar variables dependientes en ordinales y nominales.

True (A) Signup and view all the answers

Mann-Whitney es una prueba paramétrica que compara dos medias.

False (B) Signup and view all the answers

Un diagrama de dispersión solo puede representar la relación entre variables cualitativas.

False (B) Signup and view all the answers

Si la nube de puntos en un diagrama de dispersión tiene pendiente positiva, la relación es inversa.

False (B) Signup and view all the answers

Las pruebas de dependencia analizan múltiples variables y establecen relaciones entre ellas.

True (A) Signup and view all the answers

La potencia de contraste se refiere a la capacidad de detectar diferencias significativas entre grupos.

True (A) Signup and view all the answers

El peso de la variable independiente en relación a la variable dependiente se representa como la ordenada en la ecuación de regresión.

False (B) Signup and view all the answers

La regresión lineal múltiple permite predecir una variable dependiente en función de varias variables independientes.

True (A) Signup and view all the answers

El error de predicción se representa como $Y - Y'$ en la regresión.

True (A) Signup and view all the answers

El valor de la pendiente $b$ es siempre comparable entre diferentes modelos de regresión.

False (B) Signup and view all the answers

La cuasivarianza se calcula dividiendo entre $N-1$ para obtener un mejor estimador de la varianza poblacional.

True (A) Signup and view all the answers

El coeficiente de variación se expresa en decimales y se utiliza para medir la variabilidad de una sola variable.

False (B) Signup and view all the answers

El recorrido intercuartil (IQR) se calcula como la diferencia entre el primer cuartil y el tercer cuartil.

False (B) Signup and view all the answers

Una distribución normal tiene asimetría cero y su kurtosis es igual a cero.

False (B) Signup and view all the answers

Los percentiles dividen una muestra en 100 partes, mientras que los cuartiles la dividen en 4 partes.

True (A) Signup and view all the answers

El coeficiente de correlación alcanza su valor máximo de 1 solo cuando las variables son inversamente proporcionales.

False (B) Signup and view all the answers

La prueba K-S se utiliza para verificar la normalidad de una distribución.

True (A) Signup and view all the answers

Una curva leptocúrtica tiene una curtosis mayor que cero, lo que indica una distribución más puntiaguda.

True (A) Signup and view all the answers

Los casos anómalos pueden influir en la media de un conjunto de datos.

True (A) Signup and view all the answers

Los outliers se definen como datos que caen dentro del percentil 25 y 75.

False (B) Signup and view all the answers

El bloxpot es un gráfico utilizado para identificar casos anómalos.

True (A) Signup and view all the answers

La mediana es un estadístico robusto frente a los casos anómalos.

True (A) Signup and view all the answers

La covarianza es una medida estandarizada de la relación entre dos variables cuantitativas.

False (B) Signup and view all the answers

Un puntaje de 291 puede considerarse un outlier si P75 es 250.

True (A) Signup and view all the answers

Los brazos cortos y la caja grande en un bloxpot indican una distribución platicúrtica.

False (B) Signup and view all the answers

Para una puntuación de 346, se considera un outlier si es mayor que 430.

False (B) Signup and view all the answers

El IQR se calcula restando el percentil 25 del percentil 75.

True (A) Signup and view all the answers

Un extreme se define como un dato que se encuentra a más de ±1.5 IQR.

False (B) Signup and view all the answers

Si la mediana está por debajo del centro, indica asimetría negativa.

False (B) Signup and view all the answers

La prueba de Lilliefors se utiliza para comprobar el supuesto de homogeneidad.

False (B) Signup and view all the answers

Una puntuación menor que 80 puede considerarse un extremo si el IQR es 80.

True (A) Signup and view all the answers

Transformar una variable es una solución cuando no sigue una distribución normal.

True (A) Signup and view all the answers

La correlación tiene un rango de entre -1 y 0.

False (B) Signup and view all the answers

Para muestras de menos de 30 sujetos, se aplica la corrección de Kolmogorov-Smirnov.

False (B) Signup and view all the answers

La falta de respuestas en una muestra puede ser comprobada utilizando el método T de Student.

True (A) Signup and view all the answers

Para equilibrar una muestra, se debe multiplicar las variables con menos representación por un valor inferior a 1.

False (B) Signup and view all the answers

La media de los puntos adyacentes es uno de los métodos propuestos para imputar datos faltantes.

True (A) Signup and view all the answers

Completar el trabajo de campo es la única solución a los problemas de datos faltantes.

False (B) Signup and view all the answers

El coeficiente de ponderación se calcula dividiendo el tamaño de la muestra teórica entre la muestra real.

True (A) Signup and view all the answers

Los datos que faltan no deben ser tratados usando la media de las subclases si los grupos son muy heterogéneos.

True (A) Signup and view all the answers

Para analizar si la falta de datos corresponde con alguna variable sociodemográfica, se debe comprobar la aleatoriedad de los datos.

True (A) Signup and view all the answers

El método de Interpolación lineal es considerado el mejor método de imputación de datos faltantes.

False (B) Signup and view all the answers

Flashcards

Desviación típica

La desviación típica (σ) es una medida de dispersión que indica la variabilidad de los datos alrededor de la media. Se calcula como la raíz cuadrada de la varianza.

Cuasivarianza

La cuasivarianza es una medida similar a la varianza, pero en lugar de dividir por el número total de datos (N), se divide por N-1. Esto la hace un mejor estimador de la varianza poblacional cuando se trabaja con muestras pequeñas.

Amplitud o Rango

La amplitud o rango es una medida de variabilidad que se calcula como la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos.

Coeficiente de variación

El coeficiente de variación es una medida adimensional que sirve para comparar la dispersión de dos variables con diferentes escalas de medida. Se expresa en porcentaje y facilita la interpretación.