Estadística y Análisis de Datos

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

Los gráficos de probabilidad normal se conocen como ______.

QQplots

La prueba de hipótesis de normalidad se realiza a través de la prueba de ______.

Shapiro-Wilk

Si el valor p es menor que α, se ______ la hipótesis nula.

rechaza

En la prueba de diferencia de proporciones, se utiliza para evaluar muestras ______.

<p>independientes</p> Signup and view all the answers

Una variable cualitativa nominal es aquella que clasifica datos sin un orden ______.

<p>específico</p> Signup and view all the answers

La infección con EBV puede dar lugar al desarrollo de __________.

<p>esclerosis múltiple</p> Signup and view all the answers

La __________ son características que pueden variar de elemento a elemento, como peso o edad.

<p>variables</p> Signup and view all the answers

Las variables cualitativas que no expresan orden se clasifican como variables __________.

<p>nominales</p> Signup and view all the answers

Las escalas de dolor y nivel de satisfacción son ejemplos de variables cualitativas __________.

<p>ordinales</p> Signup and view all the answers

Un ejemplo de variable cuantitativa __________ es el número de hijos.

<p>discreta</p> Signup and view all the answers

La __________ son conjuntos de elementos con características de interés definidos por parámetros.

<p>población</p> Signup and view all the answers

La bioestadística es la rama de la estadística encargada de la _________, análisis e ________ de datos _______.

<p>bioestadística</p> Signup and view all the answers

Una ______ es porción representativa de una población, definida por estimadores.

<p>muestra</p> Signup and view all the answers

Los conceptos de bioestadística se dividen en bioestadística descriptiva e ______.

<p>inferencial</p> Signup and view all the answers

Los conjuntos de elementos con características de interés se conocen como ______.

<p>población</p> Signup and view all the answers

Para llevar adelante un proyecto de investigación se sigue el ______ científico.

<p>método</p> Signup and view all the answers

Los ______ son números que describen las características de una población.

<p>parámetros</p> Signup and view all the answers

La ______ se utiliza para describir y sintetizar datos.

<p>bioestadística descriptiva</p> Signup and view all the answers

Las ______ son medidas utilizadas para evaluar la relación entre dos conjuntos de datos.

<p>medidas de correlación</p> Signup and view all the answers

La hipótesis nula define que el nivel promedio de Ac contra GlialCAM entre los pacientes ctrl y MS es el _____

<p>mismo</p> Signup and view all the answers

Si el p value es menor que α, se _____ la hipótesis nula.

<p>rechaza</p> Signup and view all the answers

Para el análisis de dos grupos experimentales con distribución normal, se utiliza la Prueba _____ de diferencia de medias.

<p>t</p> Signup and view all the answers

Si la variable dependiente es cuantitativa y los grupos son independientes, se utilizan muestras _____

<p>independientes</p> Signup and view all the answers

La prueba utilizada para muestras dependientes con distribución distinta a la normal es la Prueba _____ - Wilcox.

<p>Mann</p> Signup and view all the answers

Un valor de p = 0.01 indica que hay evidencia _____ para rechazar la hipótesis nula.

<p>suficiente</p> Signup and view all the answers

La Prueba F se utiliza para analizar la igualdad de _____ entre dos o más grupos.

<p>varianzas</p> Signup and view all the answers

La prueba de ______ establece que existe una distribución normal.

<p>Shapiro-Wilk</p> Signup and view all the answers

Si el valor de p es mayor o igual que α, entonces ______ H0.

<p>NO SE RECHAZA</p> Signup and view all the answers

Si p value es menor que α, se ______ H0.

<p>SE RECHAZA</p> Signup and view all the answers

Las especies setosa y virginica no tienen el mismo largo de ______.

<p>sépalo</p> Signup and view all the answers

El análisis multiparamétrico ayuda a explicar la ______ observada en un dado PC.

<p>variabilidad</p> Signup and view all the answers

Un vector tiene ______ y magnitud.

<p>dirección</p> Signup and view all the answers

A mayor magnitud del vector, más importante es su ______ para explicar los datos.

<p>contribución</p> Signup and view all the answers

La variable debe tener distribución ______ para utilizar la prueba t.

<p>normal</p> Signup and view all the answers

La hipótesis nula define que el coeficiente de correlación es igual a ______.

<p>cero</p> Signup and view all the answers

El coeficiente de correlación de Pearson se aplica cuando las variables tienen distribución ______.

<p>normal</p> Signup and view all the answers

El coeficiente de correlación de Spearman se utiliza cuando las variables tienen una distribución distinta a la ______.

<p>normal</p> Signup and view all the answers

Para rechazar la hipótesis nula, el valor p debe ser menor que ______.

<p>0.05</p> Signup and view all the answers

Si X < 0.05, se rechaza H0 y el coeficiente de correlación es ______ de cero.

<p>distinto</p> Signup and view all the answers

Al aplicar pruebas de correlación, obtenemos el coeficiente de correlación y un valor ______.

<p>p</p> Signup and view all the answers

Un valor p mayor que 0.05 indica que no se ______ la hipótesis nula.

<p>rechaza</p> Signup and view all the answers

La correlación positiva entre IL6 y glucemia sugiere menos ______ porque la glucemia está cerca del origen.

<p>variabilidad</p> Signup and view all the answers

Flashcards

Bioestadística

Rama de la estadística que analiza datos biológicos o de salud, incluyendo recolección, análisis e interpretación.

Población

Conjunto completo de elementos con características de interés, descritos por parámetros.

Muestra

Parte representativa de una población, descrita por estimadores.

Parámetros

Características que describen una población.

Signup and view all the flashcards

Estimadores

Características que describen una muestra y se usan para estimar los parámetros de la población.

Signup and view all the flashcards

Bioestadística descriptiva

Análisis estadístico que resume y describe los datos de una muestra.

Signup and view all the flashcards

Bioestadística inferencial

Análisis estadístico que usa datos de una muestra para sacar conclusiones sobre la población.

Signup and view all the flashcards

Método Científico

Procedimiento sistemático para llevar adelante un proyecto de investigación.

Signup and view all the flashcards

Estudio Longitudinal

Un estudio que sigue a un grupo de personas a lo largo del tiempo para observar cambios en su salud o comportamiento.

Signup and view all the flashcards

Estudio Analítico

Un estudio que busca determinar la relación entre dos o más variables.

Signup and view all the flashcards

Estudio Observacional

Un estudio donde el investigador observa a los participantes sin intervenir.

Signup and view all the flashcards

Estudio Prospectivo

Un estudio que comienza con un grupo de personas y las sigue a lo largo del tiempo para ver qué sucede.

Signup and view all the flashcards

Estudio Prolectivo

Un estudio que busca determinar si una exposición o factor de riesgo predice un resultado futuro.

Signup and view all the flashcards

Variable Cualitativa

Una característica que describe una cualidad o atributo.

Signup and view all the flashcards

Variable Cuantitativa

Una característica que se puede medir numéricamente.

Signup and view all the flashcards

Hipótesis Nula (H0)

Afirma que NO hay diferencia significativa entre los grupos que se comparan.

Signup and view all the flashcards

Hipótesis Alternativa (H1)

Afirma que SÍ hay diferencia significativa entre los grupos que se comparan.

Signup and view all the flashcards

Valor p

Probabilidad de obtener los resultados observados, asumiendo que la hipótesis nula es cierta. Cuanto más pequeño es el valor p, más evidencia hay en contra de la hipótesis nula.

Signup and view all the flashcards

Nivel de Significancia (α)

Umbral establecido para rechazar la hipótesis nula. Se usa para determinar qué tan fuerte debe ser la evidencia para rechazar H0.

Signup and view all the flashcards

Rechazar H0

Concluir que hay evidencia suficiente para rechazar la hipótesis nula. Significa que hay una diferencia significativa entre los grupos.

Signup and view all the flashcards

No Rechazar H0

Concluir que NO hay evidencia suficiente para rechazar la hipótesis nula. Significa que no se encontró una diferencia significativa entre los grupos.

Signup and view all the flashcards

Prueba de Hipótesis

Procedimiento estadístico para evaluar si hay evidencia suficiente para rechazar la hipótesis nula.

Signup and view all the flashcards

Variable Dependiente Cuantitativa

Variable que se mide numéricamente y se analiza para determinar si hay diferencias entre los grupos.

Signup and view all the flashcards

QQplots

Gráficos que comparan los percentiles de los datos con los percentiles esperados de una distribución normal estándar. Si los puntos se ajustan a la recta de 45°, indica distribución normal.

Signup and view all the flashcards

Prueba de Shapiro-Wilk

Una prueba estadística para comprobar si los datos siguen una distribución normal. La hipótesis nula (H0) afirma que existe una distribución normal, mientras que la hipótesis alternativa (H1) afirma que la distribución es diferente.

Signup and view all the flashcards

Prueba de diferencia de proporciones

Una prueba estadística utilizada para comparar proporciones de dos grupos independientes de una variable cualitativa nominal.

Signup and view all the flashcards

Prueba de diferencia de rangos

Una prueba estadística utilizada para comparar dos grupos independientes de una variable cualitativa ordinal.

Signup and view all the flashcards

p value < α → SE RECHAZA H0

Significa que la probabilidad de obtener los resultados observados si la hipótesis nula es verdadera es muy baja.

Signup and view all the flashcards

Hipótesis nula (H0) para correlación

La hipótesis nula establece que no existe correlación lineal entre las variables, es decir, el coeficiente de correlación es igual a cero.

Signup and view all the flashcards

Hipótesis alternativa (H1) para correlación

La hipótesis alternativa afirma que sí existe correlación lineal entre las variables, es decir, el coeficiente de correlación es distinto de cero.

Signup and view all the flashcards

Coeficiente de correlación de Pearson

Mide la fuerza y la dirección de la relación lineal entre dos variables que tienen distribución normal y varianzas homogéneas.

Signup and view all the flashcards

Coeficiente de correlación de Spearman

Mide la fuerza y la dirección de la relación lineal entre dos variables que no siguen una distribución normal o no tienen varianzas homogéneas.

Signup and view all the flashcards

Valor p en pruebas de correlación

Probabilidad de obtener los resultados observados si realmente no hay correlación entre las variables.

Signup and view all the flashcards

Correlación positiva

Cuando el valor del coeficiente de correlación es positivo, indica que las variables se relacionan de forma que al aumentar una, la otra también tiende a aumentar.

Signup and view all the flashcards

Correlación negativa

Cuando el valor del coeficiente de correlación es negativo, indica que las variables se relacionan de forma que al aumentar una, la otra tiende a disminuir.

Signup and view all the flashcards

Interpretación de p < 0.05 en correlación

Si el valor p es menor que 0.05, se rechaza la hipótesis nula, lo que significa que existe evidencia estadísticamente significativa para concluir que hay correlación lineal entre las variables.

Signup and view all the flashcards

Prueba t de diferencia de medias (para grupos independientes)

Se utiliza para comparar las medias de dos grupos independientes cuando los datos tienen una distribución normal y las varianzas son iguales.

Signup and view all the flashcards

Prueba F de igualdad de varianzas

Se utiliza para verificar si las varianzas de dos grupos independientes son iguales. Es un requisito para usar la prueba t de diferencia de medias cuando los grupos son independientes.

Signup and view all the flashcards

Análisis Multiparamétrico

Analiza la relación entre múltiples variables, utilizando técnicas como el análisis de componentes principales (PCA). Ayuda a identificar las variables más influyentes.

Signup and view all the flashcards

Study Notes

Bioinformática II - 2024

  • Curso dictado por la Lic. Martina Liz Ceballos, [email protected], de la Universidad Católica de Córdoba.
  • El curso se divide en módulos.
  • El Módulo 0 se centra en programación en R.
  • El Módulo 1 cubre bioestadística aplicada a datos en salud, incluyendo conceptos de bioestadística, herramientas de análisis multiparamétrico y medidas de correlación.
  • El Módulo 2 trata el análisis e interpretación de datos I.
  • El Módulo 3 cubre el análisis e interpretación de datos II.
  • El Módulo 4 profundiza en métodos de inferencia biológica.

Conceptos de Bioestadística

  • Población: Conjunto de elementos con características de interés. Se define por parámetros.
  • Muestra: Porción representativa de una población. Se define por estimadores.
  • Bioestadística: Rama de la estadística que se encarga de la recolección, análisis e interpretación de datos biológicos o de salud.
  • Método Científico: Pasos para llevar a cabo un proyecto de investigación: Observar, plantear hipótesis, experimentar, analizar resultados, sacar conclusiones.

Clasificación del diseño metodológico

  • Según el número de mediciones: Transversal (evaluación del fenómeno una vez), Longitudinal (evaluación del fenómeno más de una vez).
  • Según el número de grupos de estudio: Descriptivo (un grupo), Analítico o Comparativo (dos o más grupos).
  • Según la posibilidad de intervención: Observacional (no hay intervención) o Experimental (el investigador aplica una intervención).
  • Según el momento del estudio: Prospectivo (de la causa al efecto) o Retrospectivo (del efecto a la causa).
  • Según la forma de recolección de datos: Prolectivo (información al iniciar el estudio) o Retrospectivo (información de fuentes secundarias).

Variables

  • Variables: Características que pueden variar de un elemento a otro (peso, edad, glucemia, niveles de cortisol, etc.).
  • Cualitativas: Expresan una cualidad.
    • Nominales: No expresan orden (género, color de ojos).
    • Ordinales: Expresan un orden (escala de dolor, nivel de satisfacción).
  • Cuantitativas: Expresan una cantidad, métrica o número.
    • Discretas: Números enteros (número de hijos).
    • Continuas: Infinitos valores entre los enteros (altura).

Bioestadística Inferencial

  • Hipótesis: Una conjetura sobre cómo funciona un sistema. Puede ser falsa.
  • Hipótesis nula (H0): Afirmación que se somete a prueba y se pretende refutar.
  • Hipótesis alternativa (H1): Afirmación contraria a la hipótesis nula.
  • Errores tipo I (α) y tipo II (β): Posibles errores al rechazar o no rechazar una hipótesis. Se busca minimizar la probabilidad de cometer estos errores, por ej. con un 95% de confianza
  • Valor p (p-value): Probabilidad de obtener un resultado similar al observado, asumiendo que la hipótesis nula es verdadera. Es importante para la toma de decisiones en relación a rechazar o no la hipótesis nula.

Herramientas de Análisis Multiparamétrico

  • PCA (Principal Component Analysis): Técnica para reducir la dimensionalidad de los datos, identificando las principales variables que explican la variabilidad en un conjunto.
  • t-SNE (t-Distributed Stochastic Neighbor Embedding): Técnica de reducción de dimensionalidad no lineal para visualizar datos complejos.
  • UMAP (Uniform Manifold Approximation and Projection): Técnica de reducción de dimensionalidad no lineal similar a t-SNE pero más eficiente para conjuntos de datos grandes.
  • Métodos de Clusterización (Clustering): Técnicas para agrupar las observaciones similares en un conjunto de datos.
    • Jerárquico: Genera una jerarquía de clústeres.
    • K-Means: Agrupa las observaciones en un número predefinido de clústeres.
  • Medidas de distancia: Euclidiana (distancia más corta), Manhattan (suma de las diferencias absolutas).

Medidas de correlación

  • Medida estadística que indica el grado de relación entre variables cuantitativas.
  • Pearson: Variables normales y heterogeneidad de varianzas.
  • Spearman: Variables con distribución distinta a la normal y/o sin homogeneidad en las varianzas.

Práctico - Módulo 1

  • Prácticas de estadística descriptiva y análisis multiparamétrico (R). Se incluye el análisis de datos con el dataset Iris. Se analizan los métodos gráficos (histogramas, boxplots) y numéricos (media, mediana, etc.).

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Statistical Analysis with IBM SPSS
5 questions

Statistical Analysis with IBM SPSS

SteadfastPerception6132 avatar
SteadfastPerception6132
Statistical Analysis Overview
8 questions

Statistical Analysis Overview

PreferableNonagon3509 avatar
PreferableNonagon3509
Statistics: Types of Variables and Testing
18 questions
Use Quizgecko on...
Browser
Browser