Estadística Descriptiva y Variables

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

¿Qué es la estadística descriptiva?

  • Un sistema para realizar proyecciones futuras.
  • Una herramienta para organizar y resumir información. (correct)
  • Un método para realizar análisis de inferencias.
  • Un proceso para verificar hipótesis estadísticas.

¿Cuál de las siguientes variables es cualitativa ordinal?

  • Edad del paciente.
  • Número de hijos.
  • Grado de satisfacción. (correct)
  • Grupo sanguíneo.

En la clasificación de variables, ¿qué caracteriza a las variables cuantitativas continuas?

  • Solo pueden tomar valores enteros.
  • Pueden ser contadas indefinidamente.
  • No se pueden utilizar en operaciones algebraicas.
  • Pueden tomar infinitos valores intermedios. (correct)

En el estudio de los factores de riesgo del infarto agudo de miocardio, ¿cómo se clasifica la variable 'SEXO'?

<p>Cualitativa nominal. (C)</p> Signup and view all the answers

¿Qué significado tiene un valor de '1' en la variable 'TIPO' en el análisis de pacientes?

<p>El paciente es enfermo. (A)</p> Signup and view all the answers

¿Cuál de las siguientes no es una característica de la estadística descriptiva?

<p>Análisis predictivo de datos futuros. (B)</p> Signup and view all the answers

¿Cuál de las siguientes variables es un ejemplo de variable cuantitativa discreta?

<p>El número de cigarrillos fumados. (A)</p> Signup and view all the answers

En el contexto del análisis de pacientes, ¿qué indica un '0' en la variable 'SEVE'?

<p>El paciente no tiene enfermedad severa. (B)</p> Signup and view all the answers

¿Qué representa un valor atípico en un conjunto de datos?

<p>Valores que se encuentran lejos de la tendencia general del grupo. (B)</p> Signup and view all the answers

¿Cómo se calcula el límite inferior (LI) para determinar valores atípicos?

<p>LI = Q1 - 1.5(Q3 - Q1) (C)</p> Signup and view all the answers

¿Cuál es el valor de la mediana en el conjunto de niveles de Hb proporcionado?

<p>148.5 (B)</p> Signup and view all the answers

¿Qué medida representa la media aritmética?

<p>La suma de todos los valores dividida por el número total de valores. (C)</p> Signup and view all the answers

¿Qué se entiende por medidas de centralización?

<p>Son posiciones que describen donde los datos tienden a agruparse. (A)</p> Signup and view all the answers

¿Qué se debe tener en cuenta al utilizar la media como medida de tendencia central?

<p>Es sensible a valores extremos que pueden distorsionar el resultado. (A)</p> Signup and view all the answers

¿Cuál es el valor máximo dado en los datos de niveles de Hb?

<p>179 (B)</p> Signup and view all the answers

¿Qué indica el cuartil Q1 en un conjunto de datos?

<p>Representa el 25% inferior de los datos. (D)</p> Signup and view all the answers

¿Cuál de las siguientes transformaciones comprime la escala de los valores altos y expande los bajos?

<p>$ rac{1}{X}$ (A), $ln X$ (B), $X$ (D)</p> Signup and view all the answers

¿Cuál es el resultado del Riesgo Relativo (RR) y el Odds Ratio (OR) cuando no existe asociación?

<p>RR = 1 y OR = 1 (A)</p> Signup and view all the answers

En un diagrama de dispersión, cada punto representa:

<p>Un caso en la intersección de ambas variables (C)</p> Signup and view all the answers

Según la fórmula del Odds Ratio (O.R), ¿cómo se calculan los elementos de la tabla?

<p>O.R = $[n11/n21]/[n12/n22]$ (D)</p> Signup and view all the answers

¿Qué ocurre cuando RR > 1 y OR > 1?

<p>Se establece una asociación positiva entre las variables (C)</p> Signup and view all the answers

¿Qué representación gráfica se utiliza para describir el comportamiento conjunto de dos variables cuantitativas?

<p>Diagrama de dispersión (C)</p> Signup and view all the answers

¿Cómo afecta la transformación $X^2$ a los valores?

<p>Comprime la escala para valores pequeños y la expande para altos (B)</p> Signup and view all the answers

Al analizar tablas de contingencia, ¿qué variables se pueden añadir para categorizar los datos?

<p>Cualquier tipo de variable cualitativa (B)</p> Signup and view all the answers

¿Cuál de las siguientes afirmaciones describe mejor la mediana?

<p>Es el valor que divide a las observaciones en dos grupos con el mismo número de individuos. (A)</p> Signup and view all the answers

¿Qué propiedad caracteriza especialmente a la media respecto a la mediana en distribuciones asimétricas?

<p>La media se desplaza hacia el extremo del mayor número. (B)</p> Signup and view all the answers

¿Qué descripción se aplica a la moda en un conjunto de datos?

<p>Es el valor donde la distribución de frecuencia alcanza un máximo. (B)</p> Signup and view all the answers

¿Cuál de las siguientes medidas de dispersión es más sensible a valores extremos?

<p>Amplitud o rango. (B)</p> Signup and view all the answers

Si se tiene una distribución simétrica, ¿qué relación existe entre la media y la mediana?

<p>La media y la mediana son iguales. (A)</p> Signup and view all the answers

¿Qué fórmula corresponde a la varianza?

<p>$S^2 = rac{∑(x_i - ar{x})^2}{n - 1}$ (A)</p> Signup and view all the answers

¿Cuál es el propósito del rango intercuartílico?

<p>Eliminar las observaciones más extremas para estudiar la dispersión central. (B)</p> Signup and view all the answers

¿Qué unidad tiene la varianza en relación a la variable que mide?

<p>Cuadrado de las unidades de la variable. (D)</p> Signup and view all the answers

¿Qué mide el coeficiente de variación?

<p>La razón entre la desviación típica y la media. (C)</p> Signup and view all the answers

¿En qué casos no debe usarse el coeficiente de variación?

<p>Cuando la variable presenta valores negativos. (B)</p> Signup and view all the answers

¿Qué porcentaje de los valores muestrales se encuentra dentro de dos desviaciones típicas de la media según la desigualdad de Chebyshev?

<p>Al menos el 75%. (B)</p> Signup and view all the answers

¿Qué tipo de distribuciones tiene una curtosis mayor a 0?

<p>Leptocúrtica. (A)</p> Signup and view all the answers

¿Cuál de las siguientes afirmaciones sobre la curtosis es correcta?

<p>La curtosis es adimensional. (B)</p> Signup and view all the answers

Si la media es 80 y la desviación típica es 20, ¿cuál es el coeficiente de variación en porcentaje?

<p>25%. (B)</p> Signup and view all the answers

¿Qué significa un coeficiente de variación de 30% en comparación con un coeficiente de 10%?

<p>La variable con 30% tiene más dispersión. (C)</p> Signup and view all the answers

¿Qué se entiende por mesocúrtica en términos de curtosis?

<p>Distribuciones con curtosis igual a 0. (B)</p> Signup and view all the answers

¿Cuál es el percentil que representa la mediana en un conjunto de datos?

<p>Percentil 50 (B)</p> Signup and view all the answers

¿Qué representa el cuartil Q1 en términos de percentiles?

<p>Percentil 25 (A)</p> Signup and view all the answers

¿Cómo se clasifica un valor como atípico en un diagrama de cajas?

<p>Si es mayor que LS o menor que LI (C)</p> Signup and view all the answers

¿Cuál es la fórmula correcta para calcular el percentil Pk cuando Nk es entero?

<p>Pk = (x(Nk) + x(Nk+1)) / 2 (A)</p> Signup and view all the answers

¿Qué caracteriza un diagrama de cajas en estadística descriptiva?

<p>Proporciona información sobre localización, dispersión y forma. (A)</p> Signup and view all the answers

¿Cuál es el valor de P25 en una muestra de 100 observaciones?

<p>el 25% de las observaciones están por debajo de P25 (D)</p> Signup and view all the answers

¿Qué se debe hacer primero al calcular los percentiles?

<p>Ordenar las observaciones. (D)</p> Signup and view all the answers

¿Qué cálculo se utiliza para determinar los límites admisibles en un diagrama de cajas?

<p>LI = Q1 - 1.5(Q3 - Q1) (C)</p> Signup and view all the answers

Flashcards

Estadística Descriptiva

La estadística descriptiva es una rama de la estadística que se encarga de organizar, resumir y presentar información de un conjunto de datos.

Variables Cualitativas

Las variables cualitativas, también llamadas categóricas, representan características que no pueden ser medidas numéricamente, sino que se expresan a través de categorías.

Variable Nominal

Una variable nominal es una variable cualitativa cuyos valores no tienen un orden específico.

Variable Ordinal

Una variable ordinal es una variable cualitativa cuyos valores se pueden ordenar, pero la diferencia entre dos categorías no se puede cuantificar.

Signup and view all the flashcards

Variables Cuantitativas

Las variables cuantitativas representan características que se pueden medir numéricamente.

Signup and view all the flashcards

Variable Discreta

Una variable discreta es una variable cuantitativa que solo puede tomar valores enteros.

Signup and view all the flashcards

Variable Continua

Una variable continua es una variable cuantitativa que puede tomar cualquier valor dentro de un rango determinado.

Signup and view all the flashcards

Paciente Enfermo (IM)

En este contexto, un paciente se considera enfermo si tiene un estrechamiento mayor del 75% en al menos una de sus arterias coronarias principales.

Signup and view all the flashcards

Percentil

Un valor que divide una distribución en 100 partes iguales. El percentil k representa el valor que deja el k% de las observaciones por debajo.

Signup and view all the flashcards

Cuartil

Un valor que divide una distribución en 4 partes iguales. Los cuartiles marcan el 25%, 50% y 75% de los datos.

Signup and view all the flashcards

Mediana

El valor que ocupa la posición central en un conjunto de datos ordenado. Divide la distribución en dos partes iguales. También se conoce como el percentil 50.

Signup and view all the flashcards

Diagrama en cajas

Un diagrama que representa gráficamente la distribución de una variable numérica, mostrando la mediana, los cuartiles, los valores mínimos y máximos, y los valores atípicos.

Signup and view all the flashcards

Valor atípico

Un valor que se encuentra significativamente lejos del resto de los datos en un conjunto ordenado.

Signup and view all the flashcards

Decil

Un valor que divide una distribución en 10 partes iguales. Cada decil representa el 10% de los datos.

Signup and view all the flashcards

Quintil

Un valor que divide una distribución en 5 partes iguales. Cada quintil representa el 20% de los datos.

Signup and view all the flashcards

Desviación típica

Una medida de dispersión que representa la desviación promedio de los datos respecto a la media. Se calcula como la raíz cuadrada de la varianza.

Signup and view all the flashcards

Diagrama de Caja

Las líneas centrales del diagrama de caja representan: Q1 (el primer cuartil), la mediana y Q3 (el tercer cuartil). La caja central encierra el 50% central de los datos.

Signup and view all the flashcards

Límites del diagrama de Caja

En un diagrama de caja, las "barbas" o líneas que se extienden desde la caja central hacia el mínimo y el máximo valor no atípicos representan el rango intercuartílico (IQR) multiplicado por 1.5. Cualquier dato fuera de este rango se considera un valor atípico.

Signup and view all the flashcards

Sensibilidad de la Media

La media es una medida sensible a valores extremos. Si hay valores atípicos, la media puede ser un indicador poco preciso de la tendencia central.

Signup and view all the flashcards

Rango Intercuartílico

El rango intercuartílico (IQR) es la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1). Representa la dispersión del 50% central de los datos.

Signup and view all the flashcards

Valores Atípicos con IQR

El IQR se utiliza para identificar valores atípicos. Cualquier valor que se encuentre en un rango mayor a 1.5 veces el IQR desde Q1 o Q3 se considera un valor atípico.

Signup and view all the flashcards

Media Ponderada

Es la suma de los productos de cada observación (xi) por su peso correspondiente (wi), dividido por la suma de los pesos.

Signup and view all the flashcards

Moda

Es el valor o valores que más se repiten en un conjunto de datos. Puede no existir o no ser único, y en variables continuas se habla de intervalo modal.

Signup and view all the flashcards

Medidas de Dispersión

Describe la dispersión o variabilidad de los datos. Mide qué tan dispersos están los valores alrededor de la media.

Signup and view all the flashcards

Amplitud o Rango

Es la diferencia entre el valor máximo y el mínimo de un conjunto de datos. Es muy sensible a valores extremos.

Signup and view all the flashcards

Varianza

Mide el promedio de las desviaciones cuadradas de cada observación respecto a la media. Es sensible a valores extremos.

Signup and view all the flashcards

Coeficiente de variación (CV)

Es la medida de la dispersión de los datos en relación a la media.

Signup and view all the flashcards

Interpretación del CV

Cuanto mayor es el CV, más dispersión presentan los datos.

Signup and view all the flashcards

Variabilidad relativa

Es una medida de la variabilidad relativa.

Signup and view all the flashcards

Desigualdad de Chebyshev

Indica la proporción de observaciones que se encuentran dentro de un determinado rango de valores.

Signup and view all the flashcards

Dos desviaciones típicas

A dos desviaciones estándar de la media, al menos el 75% de los valores se encuentran dentro de ese rango.

Signup and view all the flashcards

Apuntamiento o curtosis

Mide el grado de apuntamiento de una distribución con respecto a la distribución normal.

Signup and view all the flashcards

Distribución Leptocúrtica

La distribución tiene un pico pronunciado y las colas son largas.

Signup and view all the flashcards

Distribución Platicúrtica

La distribución tiene un pico bajo y las colas son cortas.

Signup and view all the flashcards

Tablas de Contingencia para Variables Cualitativas

Las tablas de contingencia son una herramienta fundamental para analizar la relación entre dos variables cualitativas. Permiten visualizar la frecuencia conjunta de las categorías de cada variable y conocer la probabilidad de que ocurra una categoría en función de la otra.

Signup and view all the flashcards

Riesgo Relativo en Tablas de Contingencia

El Riesgo Relativo (RR) es una medida que indica cuántas veces más probable es que ocurra un evento en un grupo en comparación con otro. Permite evaluar si existe una asociación significativa entre dos variables cualitativas en una tabla de contingencia.

Signup and view all the flashcards

Odds Ratio en Tablas de Contingencia

El Odds Ratio (OR) es una medida que representa la probabilidad de que un individuo pertenezca a un grupo en comparación con la probabilidad de pertenecer al otro grupo. Se utiliza para analizar la asociación entre dos variables cualitativas.

Signup and view all the flashcards

Diagrama de Dispersión para Variables Cuantitativas

Se utiliza para analizar la relación entre dos variables cuantitativas, explorando gráficamente la tendencia que se genera al variar ambas variables.

Signup and view all the flashcards

Creación de Variables Binarias para Categorías Múltiples

Cuando se crea una variable de categorías múltiples, es necesario crear una variable binaria para cada categoría. Esta variable binaria codifica como 1 la presencia de la característica en un individuo y 0 si no la posee.

Signup and view all the flashcards

Study Notes

Bioestadística - Tema 2: Estadística Descriptiva

  • La estadística descriptiva organiza y resume la información de un conjunto de observaciones utilizando métodos gráficos, tablas y métodos numéricos.
  • Es una herramienta para comprender fenómenos colectivos complejos debido a su extensión, diversidad e inconstancia.
  • Las variables pueden ser cualitativas (categóricas) o cuantitativas (numéricas).
    • Variables cualitativas:
      • Nominales: No se pueden ordenar (ej: sexo, grupo sanguíneo).
      • Ordinales: Se pueden ordenar (ej: mejoría tras un tratamiento).
    • Variables cuantitativas:
      • Discretas: Sólo toman valores enteros (ej: número de hijos).
      • Continuas: Pueden tomar cualquier valor en un intervalo (ej: altura, peso).
  • Se utilizan tablas de frecuencia para resumir datos, clasificando las observaciones en categorías y mostrando frecuencias absolutas (número de casos) y relativas (proporción en porcentaje).
  • Las tablas de frecuencias acumulan las ocurrencias de una categoría y todas las anteriores.
  • Se utilizan diferentes métodos de representación, gráficos como diagramas de barras, de sectores y pictogramas.
  • Se codifican todas las variables en números.
  • Es fundamental conocer el tipo real de variables y usar etiquetas para su mejor comprensión en cálculos estadísticos.
  • No todas las operaciones matemáticas o gráficos son adecuados para todo tipo de variables.
  • Se presentan ejemplos de análisis con datos reales recogidos por facultativos.
  • El análisis de ejemplos incluye las variables utilizadas en cada caso especifico.
  • Se discuten las variables categóricas, deben ser exhaustivas (incluyen todos los posibles valores) y mutuamente excluyentes (un individuo sólo puede presentarse en una sola).
  • Se incluye nomenclatura: n (tamaño de la muestra), n₁ (frecuencias absolutas), f₁ (frecuencias relativas), A₁ (frecuencias acumuladas absolutas), F₁ (frecuencias acumuladas relativas), p₁ ó % (porcentajes), k (número de categorías).
  • Se presentan ejemplos de tablas de frecuencias para variables como sexo, edad categorizada, síntomas de enfermedad coronaria (dolor en el pecho).
  • Se incluyen ejemplos sobre el análisis de los efectos secundarios de la dosis 2 de la vacuna COVID.
  • En un ejemplo, se muestra un análisis de los datos obtenidos en una encuesta a estudiantes.
  • La información recogida inicialmente en papel, posteriormente es posteriormente procesada electrónicamente.
  • Se incluyen ejemplos de variables cuantitativas discretas como el numero de cigarrillos por día, ejemplos numéricos como la hemoglobina en 60 adultos normales.
  • Se explican cómo se representan las variables numéricas, ya sean continuas o discretas, incluyendo diagramas de puntos, diagramas tronco-hojas e histogramas.
  • Se discuten diagramas de cajas y cómo estos representan cinco números clave de un conjunto de datos.
  • Se explican los tipos de variable contínua. Se indica que el número de clases que se va a usar dependerá del tamaño de la muestra y del problema.
  • Se explican las propiedades de las clases, indicando que los intervalos deben ser exhaustivos y mutuamente excluyentes, indicando que la primera clase debe contener la observación mínima y la última contenga la máxima.
  • Se explican medidas de posición, centralización, dispersión y forma.
  • Se detallan los diferentes estadísticos de posición como percentiles, cuartiles y la mediana.
  • Se define la varianza y desviación típica como medida de dispersión
  • Se describieron diferentes métodos de transformación de variables para lograr una distribución más simétrica.
  • Se presentan ejemplos de diagramas de dispersión con pares de variables diferentes, incluyendo el nivel de Hemoglobina y el peso.
  • Se explican las variables categóricas y cuantitativas con ejemplos.
  • Se explican y definen las medidas de dispersión, incluyendo el rango, el rango intercuartílico, la varianza y la desviación típica.
  • Se define el coeficiente de variación y su utilidad en la comparación de variables.
  • Se describen ejemplos de casos donde se aplican las medidas de centralización y dispersión.
  • Se explican la desigualdad de Chebyshev y cómo se aplica.
  • Se explican las medidas de apuntamiento, indicando la relación con un gráfico normal.
  • Se presentan tablas para el análisis bivariante tanto de variables cualitativas como cuantitativas.
  • Se explican los diagramas de cajas, cómo se construyen y su interpretación.
  • Se incluyen ejemplos de análisis bivariantes de variables cuantitativas, mostrando la relación entre variables numéricas y creando diagramas de dispersión.
  • Se muestra como una correlación se puede utilizar para entender las relaciones entre variables numéricas.
  • Se muestran ejemplos de datos simulados donde se muestran datos de alturas de padres e hijos para un análisis de regresión lineal.
  • Se presenta el modelo de regresión lineal simple, explicando los coeficientes (b0 y b1).
  • Se discuten ejemplos y métodos adicionales de análisis bivariante de tipos numéricos y gráficos.
  • Se discuten diferentes tipos de análisis descriptivos para datos de diferentes variables.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser