Repaso Bioestadística PDF

Summary

This document appears to be a biostatistics practice or review sheet. It contains a series of questions about Hypothesis testing, ANOVA, Chi-Square tests and other statistical concepts.

Full Transcript

Repaso bioestadística Preguntas simulador: 1.- Qué suposición es importante para realizar un ANOVA? a) Las muestras deben ser emparejadas b) Las variables deben ser categóricas c) Las varianzas deben ser homogéneas (iguales) d) Las muestras deben ser grandes 2.- Para que el te...

Repaso bioestadística Preguntas simulador: 1.- Qué suposición es importante para realizar un ANOVA? a) Las muestras deben ser emparejadas b) Las variables deben ser categóricas c) Las varianzas deben ser homogéneas (iguales) d) Las muestras deben ser grandes 2.- Para que el teorema del límite centra se aplique correctamente, las muestras deben ser… a. Independientes y de tamaño grande b. Dependientes de tamaño grande c. Independientes y de cualquier tamaño d. Dependientes y de cualquier tamaño 3.- Una distribución binomial a una distribución de poisson se puede aplicar bajo las siguientes condiciones: - El número de ensayos “n” es grande y la probabilidad de éxito “p” es pequeña - El valor de “np” es pequeño 4.- Cuando se utiliza ANOVA en lugar de la prueba de t de student a. Cuando la muestra es pequeña b. Cuando los datos no son normales c. Cuando la desviación estándar de la población no es conocida d. Cuando se comparan las medias de 2 o más grupos 5.- Es el procedimiento por medio del cual se llega a conclusiones acerca de una población con base en los resultados obtenidos de una muestra extraída de esa población a. Estadística descriptiva b. Distribución binomial c. Probabilidad condiciona d. Inferencia estadística 6.- Que representa el valor “p” en la prueba de chi-cuadrada? a. El valor del erro de la desviación estándar de la población b. La probabilidad de que las diferencias observadas se deban al azar c. El rango del valor estimado de la media poblacional d. La mediana de la población 7.- Qué suposición es importante para realizar un ANOVA? a. Las muestras deben ser emparejadas b. Deben ser grandes, las variables deben ser categóricas c. Las varianzas de los grupos deben ser homogéneas 8.- Es el valor más frecuente, a veces hay más de un solo valor a. Cuartil b. Media c. Moda d. Mediana 9.- Procedimiento estadístico para comprobar si dos o varias muestras pueden considerarse o no como extraídas de la misma población a. Estimación z b. Estimación de la media poblacional c. Proporcionalidad de chi cuadrada d. Contraste de hipótesis 10.- Qué es un error de tipo II en la prueba de hipótesis? a. No rechazar la hipótesis alternativa cuando es falsa b. No rechazar la hipótesis nula cuando es falsa c. Aceptar la hipótesis nula cuando es verdadera d. Rechazar la hipótesis nula cuando es verdadera 11.- Se utiliza para comparar las distribuciones de una variable ordinal en tres o más grupos independientes a. Prueba de Kruskal-Wallis b. ANOVA c. T-student d. Prueba exacta de Fisher 12.- Si se toma una muestra aleatoria suficientemente grande de una población, la distribución de la media muestral… a. No cambiará con el tamaño de la muestra b. Se aproximará a una distribución normal, independientemente de la forma de la distribución de la población c. Será exactamente igual a la distribución de la población d. Siempre será sesgada 13.- Si el p-valor es menor que el nivel de significancia, entonces: a. Se acepta la hipótesis nula b. Se rechaza la hipótesis nula c. No se rechaza la hipótesis nula d. Se necesita una muestra más grande 14.- Cuál es el propósito principal de la prueba de Duncan en el análisis de varianza? a. Establecer el intervalo de confianza del valor de la media general de todos los grupos b. Comparar la varianza entre grupos a partir de una ANOVA c. Identificar cuales grupos tienen diferencias significativas después de ANOVA d. Evaluar la normalidad de los datos en cada grupo en una prueba preliminar de ANOVA 15.- Si las muestras tienen un tamaño inferior a 25 pero han sido tomadas de una población normal, la media de dichas muestras sigue una distribución… a. T-student b. F de ficheros c. Chi-cuadrada d. Poisson 16.- Que es un error de tipo II en una prueba de hipótesis? a. Rechazar la hipótesis alternativa cuando es falsa b. Aceptar la hipótesis nula cuando es falsa c. Aceptar la hipótesis alternativa cuando es verdadera d. Rechazar la hipótesis nula cuando es verdadera 17.- Que distribución se usa para la prueba z? a. Distribución normal estándar b. Distribución de t-student c. Distribución F d. Distribución de chi-cuadrada 18.- En una prueba de hipótesis para la media de una población, si se conoce la desviación estándar de la población, ¿qué distribución se utiliza para esa prueba? a. Distribución F b. Distribución de chi-cuadrada c. Distribución de Laurent d. Distribución normal 19.- Qué representa el nivel de significancia en una prueba de hipótesis? a. La probabilidad de aceptar la hipótesis alternativa b. La probabilidad de rechazar la hipótesis nueva cuando es verdadera c. La probabilidad de aceptar la hipótesis nula d. La probabilidad de que la hipótesis alternativa sea falsa 20.- Es el evento que consiste en todos los resultados que están en un conjunto A o en B o en ambos eventos a. Exclusión b. Unión c. Complemento d. Intersección 21.- ¿Cuál es el propósito principal de ANOVA? a. Evaluar la relación entre 2 o más variables categóricas b. Comparar las medias de 3 o más grupos c. Predecir un valor continuo d. Comparar las varianzas de dos grupos 22.- Cuál es la suposición más importante de la chi cuadrada? a. Las observaciones deben ser independientes b. Las variables deben ser continuas c. Las muestras deben estar emparejadas d. Las muestras deben ser pequeñas 23.- Es la probabilidad de que el estadístico asuma un valor tan extremo o más que el que observamos cuando suponemos que la hipótesis nula es cierta a. Error beta b. Error cuadrático medio c. El p-valor de un contraste d. Error absoluto 24.- En el contexto de ANOVA ¿Qué se hace si el valor de p es menos que el nivel de significancia? a. Se concluye que hay al menos una diferencia significativa entre las medias de los grupos b. Se utiliza una prueba t en su lugar c. Se aumenta el tamaño de la muestra d. Se concluye que no hay diferencias significativas entre las medias de los grupos 25.- Qué ocurre con la forma de distribución t a mediodía que aumenta el tamaño de la muestra? a. Se vuelve más estrecha y se aproxima a la distribución normal b. Permanece igual sin importar el tamaño de la muestra c. Se vuelve más amplia y se aleja de la distribución normal d. Se vuelve más simétrica y tiene más colas 26.- Es el valor que separa al 50% de los valores inferiores del otro 50% de valores superiores a el, es la típica medida de centralización para una variable ordinal a. Moda b. Cuartil c. Media d. Mediana 27.- Para que se utiliza la prueba de chi-cuadrada? a. Para evaluar la relación entre 2 variables categóricas b. Para predecir valores futuros c. Comparar varianzas d. Comparar las medias de 2 grupos 28.- En que contexto se utiliza la prueba Duncan? a. Para realizar una comparación múltiple de medias después de un ANOVA b. Para realizar una regresión lineal múltiple entre variables c. Para analizar la relación entre dos variables cualitativas d. Comparar la varianza entre 2 grupos preliminar a un ANOVA 29.- Es la desviación típica de la distribución de medias a. Desviación estándar poblacional b. Chi-cuadrada c. Varianza global d. Error estándar de la media 30.- Es un tipo de variable categórica que se caracteriza por tener categorías que tienen un orden o secuencia natural. Ejemplo: insatisfecho, natural, satisfecho. a. Variables cuantitativas continuas b. Variables ordinales c. Variables cuantitativas discretas d. Variables nominales 31.- En una universidad, el 40% de los estudiantes están inscritos en un curso de matemáticas, el 30% están inscritos en un curso de física, y el 15% están inscritos en ambos cursos. ¿Cuál es la probabilidad de que un estudiante esté inscrito en el curso de física dado que está inscrito en el curso de matemáticas? 32.- En una universidad, el 40% de los estudiantes están inscritos en un curso de matemáticas, el 30% están inscritos en un curso de física, y el 15% están inscritos en ambos cursos. Si se selecciona un estudiante al azar. ¿Cuál es la probabilidad de que esté inscrito en el curso de matemáticas dado que está inscrito en el curso de en el curso de física? 33.- La siguiente gráfica corresponde una distribución: a. Distribución normal b. Distribución de t-student c. Distribución de chi-cuadrada d. Distribución binomial 34.- Intervalo construido a partir de los datos de forma que el recorrido o rango de estos datos lo dividimos en un número de partes, habitualmente iguales. a. Cuartil b. Clase c. Histograma d. Moda 35.- Función que calcula la probabilidad de un suceso dando valores a la variable aleatoria, tanto si es discreta como continua. a. Poisson b. Binomial c. Normal d. De probabilidad 36.- Para que sirve la siguiente fórmula: a. Desviación estándar b. Varianza c. Rango d. Percentiles 37.- Si de una población tomamos infinitas muestras y de cada muestra obtenemos su media, obtendremos una distribución de medias. La desviación típica de esta se denomina: a. Varianza global b. Desviación estándar c. Media artimética d. Error estándar de la media 38.- Una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones. a. Media b. Moda c. Mediana d. Percentil 39.- Establece por qué la distribución de medias puede considerarse como una distribución normal, si el valor de n es suficientemente grande. a. Test de ajuste b. Teorema de límite central c. Teorema de la probabilidad d. Estratificación de variables 40.- Es la desviación típica de la distribución de medias. 41.- Distribución formada por el cociente de dos distribuciones chi - cuadrado. 42.- Procedimiento estadístico para comprobar si dos o varias muestras pueden considerarse o no como extraídas de la misma población. 43.- Según el teorema del límite central, a medida que el tamaño de la muestra aumenta, la distribución de la media muestral se aproxima a una: a. Distribución exponencial b. Distribución normal c. Distribución binomial d. Distribución de Poisson 44.- Las hipótesis estadísticas se formulan siempre con la esperanza de que sea posible… a. Aceptar ambas hipótesis: nula y alternativa b. Rechazar con un intervalo de confianza ambas hipótesis: nula y alternativa c. Rechazar la hipótesis nula y aceptar la alternativa d. Rechazar la hipótesis alternativa y aceptar la hipótesis nula 45.- Cuándo se utiliza la ANOVA en lugar de la prueba t? = Cuando se comparan tres o más grupos. 46.- En una prueba z, ¿qué representa el valor crítico a. El tamaño del efecto b. El valor en la distribución normal que corresponde al nivel de significancia c. La desviación estándar de la muestra d. La media de la muestra 47.- Cuál es la importancia del teorema del límite central en la estadística? a. Permite transformar cualquier distribución en una distribución discreta b. Permite calcula la mediana de la población c. Asegura que la media muestral siempre es igual a la media poblacional d. Permite hacer inferencias sobre la media de la población a partir de la media de la muestra 48.- Es la probabilidad de que el estadístico asuma un valor tan extremo o más que el que observamos cuando suponemos que la hipótesis nula es cierta. a. El p-valor de un contraste b. El error absoluto c. El erro beta d. El erro cuadrático medio 49.- Se dice que un resultado es estadísticamente significativo si nos permite: a. Rechazar la hipótesis nula. b. Aceptar la hipótesis alternativa c. No hay suficiente evidencia para rechazar o aceptar la hipótesis nula d. Aceptar la hipótesis nula 50.- Cuál es el objetivo principal de una prueba de hipótesis? a. Evaluar la evidencia en contra de una hipótesis nula b. Describir una muestra c. Estimar un parámetro poblacional d. Determinar el tamaño de la muestra 51.- Qué distribución se usa para la prueba z? = normal 52.- ¿Qué establece el teorema del límite central? = Establece que, a medida que el tamaño de la muestra aumenta, la distribución de la media muestral se aproxima a una distribución normal, independientemente de la distribución original de la población. 53.- Evaluar la correlación entre dos variables continuas que siguen una distribución normal. a. T-student b. Prueba de Kruskal-Wallis c. Coeficiente de Pearson d. ANOVA 54.- En un experimento, el término clasificación simple o de una vía se refiere a: a. Para cada variable se calcula un p-valor b. No se ha realizado nungún intento de emparejar unidades experimentales de las distintas muestras c. Se utiliza solamente una prueba estadística, sin considerar una prueba de bondad d. Solamente se estudia un factor de cada experimento 55.- Una empresa fabrica focos que tienen una vida útil de 800 horas, con desviación estándar de 40 horas. Al tomar una muestra de 40 focos estos tienen una duración promedio de 788 horas. Determine a un nivel de significación del 5% si la media poblacional de estos focos es efectivamente 800 horas. ¿Cuál sería la hipótesis nula y la hipótesis alternativa? 56.- No parecen de forma numérica, sino como categóricas o atributos. Por ejemplo, el sexo, color de ojos, profesión, resultado de tratamiento, etc. a. Variables discretas b. Variables continuas c. Variables cuantitativas d. Variables cualitativas 57.- Es el universo de individuos al cual se refiere el estudio que se pretende realizar. a. Muestra b. Población c. Variable independiente d. Variable dependiente 58.- Número de maneras en que se pueden ordenar o arreglar un conjunto de elementos a. Permutaciones b. Sucesos complementarios c. Muestreo aleatorio d. Combinaciones 59.- Es el formado por todos los resultados de la prueba aleatoria, cualquiera que esta sea, a. Población b. Espacio muestral c. Variables d. Probabilidad 60.- Se divide un círculo en sectores circulares, el área de cada sector representa el número de elementos de una clase o el porcentaje de casos de la misma a. Histograma b. Error estándar de la media c. Distribución de frecuencias d. Diagrama de sectores 61.- 1.- La población o conjunto que se va a muestrear se compone de N individuos, objetos o elementos. 2.- Cada individuo puede ser caracterizado como éxito E o falla F y hay M éxitos en la población. 3.- Se selecciona una muestra de n individuos, sin reemplazo de tal modo que cada subconjunto de tamaño n es igualmente probable de ser seleccionado. 4.- La variable aleatoria de interés es X, el número de éxito en la muestra. La distribución de probabilidad de X depende de los parámetros n, M y N, así que se desea obtener P(X = x) = h(x; n,M, N) a. Distribución binomial b. Distribución normal c. Distribuciones hipergeométricas d. Distribución binomial negativa 62.- Distribución formada por el cociente de dos distribuciones chi-cuadrada: a. T de estudent b. F de fisher c. Normal d. Binomial 63.- Evento que no contiene resultados en absoluto a. Conjunto intersección b. Conjunto unión c. Conjunto complementario d. Conjunto nulo 64.- Cuándo se utiliza la prueba z en lugar de la prueba t? a. Cuando se comparan medias de mas de 2 grupos b. Cuando los datos no son normales c. Cuando la muestra es pequeña d. Cuando la desviación estándar de la población es conocida 65.- Qué es un error de tipo I en una prueba de hipótesis? a. No rechazar la hipótesis nula cuando es falsa b. No rechazar la hipótesis alternativa cuando es verdadera c. Aceptar la hipótesis alternativa cuando es falsa d. Rechazar la hipótesis nula cuando es verdadera 66.- Qué se necesita para aplicar el teorema de límite central? a. Una muestra de tamaño pequeño y datos con distribución paramétrica b. Datos provenientes exclusivamente de una distribución normal c. Una muestra de tamaño grande, preferiblemente mayor a 30 d. Una muestra aleatoria de cualquier tamaño 67.- Toman valores numéricos porque son frecuentemente el resultado de una medición. Por ejemplo, el peso de una persona. a. Variable cuantitativa discreta b. Variable cuantitativa continua c. Variable ordinal d. Variable nominal 68.- En un experimento, diseño completamente aleatorio con efectos fijos se refiere a: a. Se utiliza solamente una prueba estadística, sin considerar una prueba de bondad b. No se ha realizado ningún intento de emparejar unidades experimentales de las distintas muestras c. Solamente se estudia un factor en cada experimento d. Para cada variable se calcula un p-valor 69.- medida de la desviación de una distribución a partir de la diferencia de cada observación con la media. a. Media aritmética b. Desviación estándar c. Percentil d. Diagrama de sectores 70.- — El experimento consiste en una secuencia de ensayos independientes. — Cada ensayo puede dar por resultado un éxito (E ) o una falla (F). — La probabilidad de éxito es constante de un ensayo a otro, por lo tanto P(E en el ensayo i) = p con i = 1, 2, 3,... — El experimento continúa (se realizan ensayos) hasta que un total de r éxitos hayan sido observados, donde r es un entero positivo especificado. a. Distribución binomial negativa b. Distribución hipergeométrica c. Distribución normal d. Distribución binomial 71.- Parecido al histograma, la altura de cada barra es igual a la frecuencia de la clase que le corresponde, las barras no están unidas entre si: a. Pictograma b. Diagrama de barras c. Rango d. Ojiva 72.- Número de maneras en que se pueden seleccionar elementos de un conjunto, donde el orden de los elementos no importa. a. Suceso elemental b. Combinaciones c. Prueba aleatoria d. Permutaciones 73.- Subconjunto de la población cuyos valores de la variable que se pretende analizar son conocidos. a. Variable dependiente b. Variable independiente c. Población d. Muestra 74.- Es la diferencia entre el valor más alto y el más bajo en un conjunto de datos. a. Media b. Rango c. Desviación estándar d. Varianza 75.- Es cualquier recopilación (subconjunto) de resultados contenido en el espacio muestral. a. Variable b. Evento c. Muestra d. Población 76.- La siguiente fórmula corresponde a la distribución de probabilidad de: a. Distribución t-student b. Distribución normal c. Distribución de Poisson d. Distribución binomial 77.- La suma de todos los elementos, dividida por el número total de elementos a. Mediana b. Moda c. Cuartil d. Media 78.- Es el resultado de dividir la desviación típica entre la medida de una distribución y multiplicarlo por 100. Su fórmula expresa la desviación típica de cada observación con la media. a. Media aritmética b. Desviación estándar c. Varianza d. Coeficiente de variación 79.- Cuál de las siguientes afirmaciones es verdadera respecto a los errores de Tipo I y Tipo II? a. Un error de Tipo II ocurre cuando se rechaza la hipótesis nula cuando es verdadera b. Aumentar el tamaño de la muestra puede disminuir la probabilidad de cometer un error de tipo II c. Un error de Tipo I ocurre cuando no se rechaza la hipótesis nula cuando es falsa d. Aumentar el nivel de significancia (a) disminuye la probabilidad de cometer un error de Tipo I y de Tipo II 80.- qué establece el teorema de límite central? a. Qué la varianza de una muestra siempre es igual a la varianza de la población b. Que la suma de una gran cantidad de variables aleatorias independientes y idénticamente distribuidas se aproxima a una distribución normal c. Que la media de una muestra siempre es igual a la media de la población d. Que cualquier distribución de probabilidad se convierte en una distribución discreta con suficientes muestras 81.- Distribución formada por la suma de los cuadrados de v variables normales a. Poisson b. Normal c. Chi-cuadrada d. T-student 82.- —El experimento consta de una secuencia de n experimentos mas pequeños llamados ensayos donde n se fija antes del experimento. — Cada ensayo puede dar por resultado uno de los mismos dos resultados posibles (ensayos dicotómicos), los cuales se denominan como éxito E y falla C. —Los ensayos son independientes, de modo que el resultado en cualquier ensayo en particular no influye en el resultado de otro ensayo. —La probabilidad de éxito es constante de un ensayo a otro, esta probabilidad se denota por p. a. Distribución normal b. Binomial negativa c. Hipergeométrica d. Binomial Teoría 2do parcial HIPÓTESIS Hipótesis: Afirmación sobre un parámetro poblacional que se somete a una prueba. Prueba de hipótesis: Método para determinar si una hipótesis es razonable con base en una muestra y teoría de probabilidad. Hipótesis nula (H0): Hipótesis que se desea probar. Hipótesis Alternativa (H1): Hipótesis que se acepta cuando la hipótesis nula es rechazada. Nivel de significancia (alpha): Probabilidad de rechazar la hipótesis nula cuando es verdadera, comúnmente es del 5% o 1% Error tipo I (alpha): Rechazo de una hipótesis verdadera. Error tipo II (ß): Aceptación de una hipótesis falsa. Estadístico de prueba: Valor utilizado para comparar con el valor crítico determinado por el nivel de significancia. PRUEBAS (definiciones) Prueba de Chi-Cuadrada: Evalúa la independencia entre dos variables categóricas. Prueba exacta de Fisher: Útil para tablas de 2x2 con muestras pequeñas. Prueba de Krushal-Wallis: Compara distribuciones de una variable ordinal en tres o más grupos. Prueba de Mann-Whitney U: Compara dos grupos independientes. ANOVA: Compara medias de una variable continua en tres o más grupos. Prueba T de Student: Compara medias entre dos grupos independientes. Prueba T de una muestra: Evalúa si la media de un grupo difiere de un valor constante. Prueba T de muestras independientes: Evalúa la diferencia entre dos grupos. Prueba de Wilcoxon: Compara dos grupos de datos relacionados, es útil para datos ordinales o continuos no normales. Prueba de Kolnogorov-Smirnov y Shapiro-Wilk: Verifica la normalidad de los datos Prueba de significación: Determina la probabilidad de que los resultados observados se deban al azar. Prueba de Shapiro: Para evaluar la normalidad en muestras menores a 50. Prueba de Kolmogorov-Smirnov: Para evaluar la normalidad en muestras mayores a 50. PRUEBAS (clasificaciones) Pruebas estadísticas que usan variables categóricas: Prueba de Chi-Cuadrada y Prueba Exacta de Fisher Pruebas estadísticas que usan variables ordinales: Prueba de Kruskal-Wallis, la Mann-Whitney U, ANOVA y t de Student. Pruebas no paramétricas: Wilcoxon y la de Kolmogorov-Smirnov o Shapiro-Wilk. Estadístico de prueba: Valor utilizado para tomar decisiones en pruebas de hipótesis, comparado contra un valor crítico determinado por el nivel de significancia. P-Valor: Indica la probabilidad de obtener resultados iguales o más extremos que los observados, si la hipótesis nula fuera verdadera. Si p es menor que alpha, se rechaza la hipótesis nula. TABLAS DE CONTINGENCIA Definición: Herramienta para analizar la relación entre dos variables categóricas. Gráfico más utilizado: Gráfico de barras. Frecuencia absoluta: Número de observaciones en cada celda. Número esperado: Valor teórico para cada celda si no hubiera relación entre variables. OTRAS DEFINICIONES Intervalo de confianza: Rango probable que contiene el parámetro poblacional en un cierto nivel de confianza. Regresión Lineal Objetivo: Predecir o estimar el valor de una variable dependiente (Y) en función de una independiente (X). Coeficiente de Spearman: Evalúa la correlacion entre variables ordinales o continuas no normales. Análisis de regresión: Método estadístico para modelar la relación entre una variable dependiente y una o más independientes. Regresión Lineal simple: Predice una variable Y en función de una sola variable X. Ecuación de la regresión: Y= a+bX donde b es la pendiente y a es la intersección con el eje Y. PRUEBAS T Prueba t de muestras dependientes: Compara las medias de dos grupos relacionados o de muestras emparejadas. Prueba t de muestras independientes: Compara medias entre dos grupos independientes, asumiendo normalidad y homogeneidad de varianza. Prueba T de una muestra: Evalúa si la media de un grupo difiere de un valor constante (ej. Promedio nacional) PASOS DE LA PRUEBA DE HIPÓTESIS 1. Formular hipótesis nula y alternativa. 2. Seleccionar el nivel de significancia. 3. Identificar el estadístico de prueba. 4. Formular una regla de decisión. 5. Tomar una muestra y llegar a una conclusión sobre aceptar o rechazar la hipótesis nula. MUESTRAS Muestras pequeñas (n

Use Quizgecko on...
Browser
Browser