Estadística y Análisis de Datos
42 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Los gráficos de probabilidad normal se conocen como ______.

QQplots

La prueba de hipótesis de normalidad se realiza a través de la prueba de ______.

Shapiro-Wilk

Si el valor p es menor que α, se ______ la hipótesis nula.

rechaza

En la prueba de diferencia de proporciones, se utiliza para evaluar muestras ______.

<p>independientes</p> Signup and view all the answers

Una variable cualitativa nominal es aquella que clasifica datos sin un orden ______.

<p>específico</p> Signup and view all the answers

La infección con EBV puede dar lugar al desarrollo de __________.

<p>esclerosis múltiple</p> Signup and view all the answers

La __________ son características que pueden variar de elemento a elemento, como peso o edad.

<p>variables</p> Signup and view all the answers

Las variables cualitativas que no expresan orden se clasifican como variables __________.

<p>nominales</p> Signup and view all the answers

Las escalas de dolor y nivel de satisfacción son ejemplos de variables cualitativas __________.

<p>ordinales</p> Signup and view all the answers

Un ejemplo de variable cuantitativa __________ es el número de hijos.

<p>discreta</p> Signup and view all the answers

La __________ son conjuntos de elementos con características de interés definidos por parámetros.

<p>población</p> Signup and view all the answers

La bioestadística es la rama de la estadística encargada de la _________, análisis e ________ de datos _______.

<p>bioestadística</p> Signup and view all the answers

Una ______ es porción representativa de una población, definida por estimadores.

<p>muestra</p> Signup and view all the answers

Los conceptos de bioestadística se dividen en bioestadística descriptiva e ______.

<p>inferencial</p> Signup and view all the answers

Los conjuntos de elementos con características de interés se conocen como ______.

<p>población</p> Signup and view all the answers

Para llevar adelante un proyecto de investigación se sigue el ______ científico.

<p>método</p> Signup and view all the answers

Los ______ son números que describen las características de una población.

<p>parámetros</p> Signup and view all the answers

La ______ se utiliza para describir y sintetizar datos.

<p>bioestadística descriptiva</p> Signup and view all the answers

Las ______ son medidas utilizadas para evaluar la relación entre dos conjuntos de datos.

<p>medidas de correlación</p> Signup and view all the answers

La hipótesis nula define que el nivel promedio de Ac contra GlialCAM entre los pacientes ctrl y MS es el _____

<p>mismo</p> Signup and view all the answers

Si el p value es menor que α, se _____ la hipótesis nula.

<p>rechaza</p> Signup and view all the answers

Para el análisis de dos grupos experimentales con distribución normal, se utiliza la Prueba _____ de diferencia de medias.

<p>t</p> Signup and view all the answers

Si la variable dependiente es cuantitativa y los grupos son independientes, se utilizan muestras _____

<p>independientes</p> Signup and view all the answers

La prueba utilizada para muestras dependientes con distribución distinta a la normal es la Prueba _____ - Wilcox.

<p>Mann</p> Signup and view all the answers

Un valor de p = 0.01 indica que hay evidencia _____ para rechazar la hipótesis nula.

<p>suficiente</p> Signup and view all the answers

La Prueba F se utiliza para analizar la igualdad de _____ entre dos o más grupos.

<p>varianzas</p> Signup and view all the answers

La prueba de ______ establece que existe una distribución normal.

<p>Shapiro-Wilk</p> Signup and view all the answers

Si el valor de p es mayor o igual que α, entonces ______ H0.

<p>NO SE RECHAZA</p> Signup and view all the answers

Si p value es menor que α, se ______ H0.

<p>SE RECHAZA</p> Signup and view all the answers

Las especies setosa y virginica no tienen el mismo largo de ______.

<p>sépalo</p> Signup and view all the answers

El análisis multiparamétrico ayuda a explicar la ______ observada en un dado PC.

<p>variabilidad</p> Signup and view all the answers

Un vector tiene ______ y magnitud.

<p>dirección</p> Signup and view all the answers

A mayor magnitud del vector, más importante es su ______ para explicar los datos.

<p>contribución</p> Signup and view all the answers

La variable debe tener distribución ______ para utilizar la prueba t.

<p>normal</p> Signup and view all the answers

La hipótesis nula define que el coeficiente de correlación es igual a ______.

<p>cero</p> Signup and view all the answers

El coeficiente de correlación de Pearson se aplica cuando las variables tienen distribución ______.

<p>normal</p> Signup and view all the answers

El coeficiente de correlación de Spearman se utiliza cuando las variables tienen una distribución distinta a la ______.

<p>normal</p> Signup and view all the answers

Para rechazar la hipótesis nula, el valor p debe ser menor que ______.

<p>0.05</p> Signup and view all the answers

Si X < 0.05, se rechaza H0 y el coeficiente de correlación es ______ de cero.

<p>distinto</p> Signup and view all the answers

Al aplicar pruebas de correlación, obtenemos el coeficiente de correlación y un valor ______.

<p>p</p> Signup and view all the answers

Un valor p mayor que 0.05 indica que no se ______ la hipótesis nula.

<p>rechaza</p> Signup and view all the answers

La correlación positiva entre IL6 y glucemia sugiere menos ______ porque la glucemia está cerca del origen.

<p>variabilidad</p> Signup and view all the answers

Study Notes

Bioinformática II - 2024

  • Curso dictado por la Lic. Martina Liz Ceballos, [email protected], de la Universidad Católica de Córdoba.
  • El curso se divide en módulos.
  • El Módulo 0 se centra en programación en R.
  • El Módulo 1 cubre bioestadística aplicada a datos en salud, incluyendo conceptos de bioestadística, herramientas de análisis multiparamétrico y medidas de correlación.
  • El Módulo 2 trata el análisis e interpretación de datos I.
  • El Módulo 3 cubre el análisis e interpretación de datos II.
  • El Módulo 4 profundiza en métodos de inferencia biológica.

Conceptos de Bioestadística

  • Población: Conjunto de elementos con características de interés. Se define por parámetros.
  • Muestra: Porción representativa de una población. Se define por estimadores.
  • Bioestadística: Rama de la estadística que se encarga de la recolección, análisis e interpretación de datos biológicos o de salud.
  • Método Científico: Pasos para llevar a cabo un proyecto de investigación: Observar, plantear hipótesis, experimentar, analizar resultados, sacar conclusiones.

Clasificación del diseño metodológico

  • Según el número de mediciones: Transversal (evaluación del fenómeno una vez), Longitudinal (evaluación del fenómeno más de una vez).
  • Según el número de grupos de estudio: Descriptivo (un grupo), Analítico o Comparativo (dos o más grupos).
  • Según la posibilidad de intervención: Observacional (no hay intervención) o Experimental (el investigador aplica una intervención).
  • Según el momento del estudio: Prospectivo (de la causa al efecto) o Retrospectivo (del efecto a la causa).
  • Según la forma de recolección de datos: Prolectivo (información al iniciar el estudio) o Retrospectivo (información de fuentes secundarias).

Variables

  • Variables: Características que pueden variar de un elemento a otro (peso, edad, glucemia, niveles de cortisol, etc.).
  • Cualitativas: Expresan una cualidad.
    • Nominales: No expresan orden (género, color de ojos).
    • Ordinales: Expresan un orden (escala de dolor, nivel de satisfacción).
  • Cuantitativas: Expresan una cantidad, métrica o número.
    • Discretas: Números enteros (número de hijos).
    • Continuas: Infinitos valores entre los enteros (altura).

Bioestadística Inferencial

  • Hipótesis: Una conjetura sobre cómo funciona un sistema. Puede ser falsa.
  • Hipótesis nula (H0): Afirmación que se somete a prueba y se pretende refutar.
  • Hipótesis alternativa (H1): Afirmación contraria a la hipótesis nula.
  • Errores tipo I (α) y tipo II (β): Posibles errores al rechazar o no rechazar una hipótesis. Se busca minimizar la probabilidad de cometer estos errores, por ej. con un 95% de confianza
  • Valor p (p-value): Probabilidad de obtener un resultado similar al observado, asumiendo que la hipótesis nula es verdadera. Es importante para la toma de decisiones en relación a rechazar o no la hipótesis nula.

Herramientas de Análisis Multiparamétrico

  • PCA (Principal Component Analysis): Técnica para reducir la dimensionalidad de los datos, identificando las principales variables que explican la variabilidad en un conjunto.
  • t-SNE (t-Distributed Stochastic Neighbor Embedding): Técnica de reducción de dimensionalidad no lineal para visualizar datos complejos.
  • UMAP (Uniform Manifold Approximation and Projection): Técnica de reducción de dimensionalidad no lineal similar a t-SNE pero más eficiente para conjuntos de datos grandes.
  • Métodos de Clusterización (Clustering): Técnicas para agrupar las observaciones similares en un conjunto de datos.
    • Jerárquico: Genera una jerarquía de clústeres.
    • K-Means: Agrupa las observaciones en un número predefinido de clústeres.
  • Medidas de distancia: Euclidiana (distancia más corta), Manhattan (suma de las diferencias absolutas).

Medidas de correlación

  • Medida estadística que indica el grado de relación entre variables cuantitativas.
  • Pearson: Variables normales y heterogeneidad de varianzas.
  • Spearman: Variables con distribución distinta a la normal y/o sin homogeneidad en las varianzas.

Práctico - Módulo 1

  • Prácticas de estadística descriptiva y análisis multiparamétrico (R). Se incluye el análisis de datos con el dataset Iris. Se analizan los métodos gráficos (histogramas, boxplots) y numéricos (media, mediana, etc.).

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Description

Pon a prueba tus conocimientos en estadística y análisis de datos a través de este cuestionario. Incluye preguntas sobre gráficos de probabilidad, pruebas de hipótesis y tipos de variables. Ideal para estudiantes de niveles intermedios que quieren profundizar en el tema.

More Like This

Statistical Analysis with IBM SPSS
5 questions

Statistical Analysis with IBM SPSS

SteadfastPerception6132 avatar
SteadfastPerception6132
Statistics and Hypothesis Testing
24 questions
Statistical Analysis Overview
8 questions

Statistical Analysis Overview

PreferableNonagon3509 avatar
PreferableNonagon3509
Statistics: Types of Variables and Testing
18 questions
Use Quizgecko on...
Browser
Browser