Introducción a la Investigación - Tema 10 (PDF)
Document Details
Uploaded by RelaxedGrace
Tags
Summary
Este documento resume el tema 10 de introducción a la investigación sobre estadística descriptiva, los tipos de variables y su uso en la investigación. Describe la diferencia entre la estadística descriptiva e inferencial y explica qué son las variables observables y las latentes.
Full Transcript
TEMA 10 ESTADÍSTICA DESCRIPTIVA: TIPOS DE VARIABLES DIFERENCIA ENTRE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL La estadística descriptiva (también llamada “deductiva”) es la técnica matemática que obtiene, organiza, presenta y describe un conjunto de datos con el propósito de visualizar y facilitar su u...
TEMA 10 ESTADÍSTICA DESCRIPTIVA: TIPOS DE VARIABLES DIFERENCIA ENTRE ESTADÍSTICA DESCRIPTIVA E INFERENCIAL La estadística descriptiva (también llamada “deductiva”) es la técnica matemática que obtiene, organiza, presenta y describe un conjunto de datos con el propósito de visualizar y facilitar su uso; habitualmente se vale de tablas, medidas numéricas o gráficas. La estadística descriptiva trabaja en el tiempo presente, estructurando datos y revelando cómo se comporta la muestra en un determinado momento. Estas técnicas son utilizadas habitualmente el inicio del análisis de los datos durante el proceso de investigación. La estadística descriptiva se apoya en las medidas de tendencia central y las de variabilidad. La primera utiliza la media, mediana y moda para obtener los resultados. Mientras que la segunda, usa la varianza, la desviación estándar, el rango y la frecuencia. La estadística inferencial (o estadística inductiva) se basa en analizar los datos de una población o muestra, para poder realizar predicciones o conclusiones, que están relacionadas con el posible comportamiento de un fenómeno en particular. La estadística inferencial trabaja considerando el futuro, mediante sus inferencias y estimaciones. La estadística inferencial es una disciplina que se enfoca en las probabilidades. Es decir, en sacar conclusiones sobre una determinada muestra, teniendo en cuenta el análisis de sus datos. Para llegar a estas conclusiones, la estadística inferencial deberá: o Interpretar datos. o Plantear hipótesis. o Comparar la información. o Realizar pruebas en base a los argumentos planteados. o Elaborar sus predicciones. TIPOS DE VARIABLES Variables observables: son aquellas que se pueden medir directa o indirectamente. Ej: peso, distancia, volumen, etc. Variables latentes (no observables o constructo): son entidades aleatorias no observadas, que no presentan una unidad de medida específica y, por lo tanto, cualquier estimación está sujeta a un error asociado. Por ejemplo, la depresión es una variable latente pues no es posible medirla directamente, la asignación de cualquier valor tendría ineludiblemente un margen de error asociado y su unidad de medida podría variar entre estudios, porque no hay consenso en su parámetro de comparación. ¿Como se pueden medir las variables latentes? Se recurre a grupos de variables, o indicadores, que puedan ser obtenidos directamente y que, a su vez, estén asociados teóricamente a la variable latente de interés. Ej. preguntas de un cuestionario para depresión. Así puede modelarse la probabilidad de responder a un set de preguntas o indicadores observados dado cierto nivel en el rasgo latente. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9943051 Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. SEGÚN SU TIPO: No ordenados o nominal: datos no métricos, categóricos nominales y NO ordenados por lo cual solo se pueden establecer relaciones de igualdad y desigualdad entre las variables ej: Hombre/mujer, color de pelo; país de nacimiento; raza; religión Ordenados u ordinal: son datos no métricos, categóricos y ordenados. Se pueden establecer relaciones de igualdad- desigualdad y relaciones de orden entre las categóricos de la variable ej: escala severidad de la enfermedad periodontal, escala de trauma máxilo-facial (Lefort) Variables cuantitativas o de escala: son datos en los cuales existe una unidad de básica de medida. Continuos: entre dos valores continuos; siempre puede haber un valor. ej. altura, peso Discretos: no es posible incluir un nuevo valor entre dos continuos ej: número de hijos, número de automóviles Los números pueden “etiquetarse” y utilizarse como variables ordinales o nominales sin que sean de escala. SEGÚN SU FUNCIÓN Variable dependiente: Se trata de la variable que se ve modificada, o influenciada, por una variable independiente. Es una variable inestable pues cambiara su condición dependiendo del efecto de las variables independientes y es la variable que el investigador pretende predecir. Variable independiente: Son las variables que el investigador mide (u observar) y van a influir a la variable dependiente. En otras palabras, son características, condiciones, cualidades o hechos que tienen la potencialidad de alterar otras variables dependientes. Una característica importante es que la variable independiente no se ve afectada durante el periodo de experimentación u observación. En cambio, la dependiente es la variable inestable susceptible de ser modificada. Ejemplo 1: se desea predecir los factores que influyen en el hundimiento de un barco. Variable dependiente: hundimiento del barco. Es una variable “inestable” pues el barco puede hundirse o no dependiendo del efecto de otras variables, que denominaremos independientes. Variables independientes: severidad del mar, antigüedad de la embarcación, pericia del capitán, etc. Estas variables son “estables”, es decir se hunda o no el barco la severidad de la marca o la pericia del capitán será la misma. Por otro lado, son el efecto de estas variables lo que determinará si el barco se hunde o no. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9943051 MSI Raider GE78 HX: Tan rápido como tú saliendo de clase si falta el profesor ¡Descúbrelo aquí! Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. Variables cualitativas: Ejemplo 2: se desea predecir los factores que influyen la aparición del cáncer de pulmón. Variable dependiente: cáncer de pulmón. Es una variable “inestable” pues el paciente puede tener o no un cáncer de pulmón dependiendo del efecto de otras variables, que denominaremos independientes. Variables independientes: edad, sexo, si fuma o no, antecedente familiares, presencia de mutaciones, etc. Estas variables son “estables”, es decir, el paciente tenga cáncer o no, cada variable será la misma. Por otro lado, son el efecto de estas variables lo que determinará si el paciente tiene cáncer o no. Tipo Función observable o cualitativa ▪ ordinal ▪ nominal o cuantitativa ▪ discreta ▪ continua no observable o latente dependiente independiente VARIABLE CUALITATIVA: MEDIDAS DE FRECUENCIA NÚMERO O FRECUENCIA; es el número de veces que se repite una determinada característica en una muestra o población Absoluta: número de veces que aparece cada uno de los valores. Se representa como n Relativa: número de veces que aparece cada valor dividido el tamaño muestral. Se expresa como fi Relativa porcentual: frecuencia relativa multiplicada por 100 Absoluta acumulada: suma de las frecuencias absolutas de los valores menores a los mayores Relativa acumulada: suma de las frecuencias relativas Relativa acumulada porcentual: relativa acumulada por 100 Ejemplo: en una muestra de 150 pacientes ingresados en la unidad de cuidados intensivos por una infección, se desea conocer las frecuencias de cada foco infeccioso utilizando una TABLA DE FRECUENCIAS a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9943051 MSI Raider GE78 HX: Tan rápido como tú saliendo de clase si falta el profesor ¡Descúbrelo aquí! Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. Para decidir el número de clases, una regla habitualmente aceptada es la fórmula SQRT de n (número entero más próximo a la raíz cuadrad de n). Ejemplo: en una nuestra de 150 pacientes, se desea transformar la variable proteína C reactiva de cuantitativa continua a cualitativa ordinal. La raíz cuadrada de 150 es 12,2 por ende se deciden hacer 12 categorías. Rango: Diferencia entre el máximo y el mínimo valor de una variable. Marca de clase: Punto medio de cualquier intervalo. Representante de un intervalo, y corresponde al promedio entre los extremos de éste. Tamaño de un intervalo: Es el cociente entre el valor del rango y la cantidad de intervalos que se desea obtener. Se recomienda tomar como longitud de los intervalos un valor entero que sea mayor o igual al cociente obtenido. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9943051 MSI Raider GE78 HX: Tan rápido como tú saliendo de clase si falta el profesor ¡Descúbrelo aquí! Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. Distribución agrupada: cuando la variable es cuantitativa y el tamaño de la muestra lo permite es posible agrupar las observaciones en clases (intervalos continuos y habitualmente de la misma amplitud). El mayor inconveniente de una distribución agrupada de frecuencias es la pérdida de información en el sentido de que un lector no puede saber cuántos individuos presentan un valor dado dentro de un intervalo determinado. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9943051 Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. RAZÓN: cuando el numerador y el denominador se refieren a cosas distintas; es decir, cuando ninguna de las cantidades contiene a la otra.Cociente entre dos frecuencias absolutas en el que el numerador no está incluido en el denominador. Con frecuencia, un índice, que es una medida de resumen utilizada para comparar dos o más fenómenos, se expresa como una razón: Peso: 90 kg Altura: 1,70 mts Índice de Masa corporal (razón): 31,1 kg/mts2 Presión parcial de 0xigeno: 95mmhg Fracción inspiratoria de oxígeno: 0,45 % Pa02Fi02 (razón): 211 TASA: es la magnitud de cambio de un parámetro por unidad de cambio del otro. Es la medida de frecuencia que da cuenta de la velocidad de cambio en la población Es un tipo especial de razón o de proporción que incluye una medida de tiempo en el denominador Número de nacimientos en 1 año: 3440 Población total en 1 año: 75600 Tasa de nacimiento al año: 0,04 nacimientos por año VARIABLE CUANTITATIVAS Tendencia central: indican respecto a qué valores se agrupan los datos. Ejemplo media, mediana y moda. Dispersión: indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Ejemplo rango, rango interquartil, desvío medio, varianza, desviación estándar, error estándar de la media. Forma: asimetría y curtosis. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9943051 MSI Raider GE78 HX: Tan rápido como tú saliendo de clase si falta el profesor ¡Descúbrelo aquí! Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. PROPORCIÓN: Es el número de observaciones con una característica en particular entre la población de referencia. Cociente entre dos frecuencias absolutas en el que el numerador está incluido en el denominador. Se expresa en porcentaje. Ej. Proporción de muertos: Muertos: 45 personas Total de personas: 450 personas Proporción de muertos: 45/450: 0,10 personas Posición: dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. Ejemplo percentiles, cuartiles, deciles, etc. Medidas de asociación: covarianza, coeficiente lineal de Pearson, coeficiente de correlación de Spearmann y coeficiente Tau B de Kendall. TENDENCIA CENTRAL es intuitiva, fácil de calcular y ampliamente conocida por todos muy influida por valores extremos si la distribución no es normal no coincide con la mediana es posible que su valor no se corresponda con ninguno de la muestra Media recortada al 5%: es la media aritmética calculada con todos los valores excepto el 5% de cada extremo. Es una medida menos sensible a los valores atípicos. Mediana: cuando los datos se encuentran ordenados, es el valor que divide a grupo de observaciones en 2 subgrupos iguales. Si el número de observaciones es “impar”; es el número que divide en 2 grupos iguales; si es par, se considera el promedio de los 2 números centrales. es intuitiva poco influida por valores extremos si la distribución no es normal no coincide con la media Moda: es el valor de mayor frecuencia absoluta dentro de la muestra DISPERSIÓN Rango; diferencia entre el máximo y el mínimo valor. La limitación es que no brinda información respecto a la distribución y está muy influido por los “outiliers”. Rango interquartil (RQ); habitualmente se refiere a la diferencia entre el tercer cuartil y el primer cuartil de una distribución. Tiene la ventaja de estar muy poco influido por los valores extremos y representar a la muestra aceptablemente cuando su distribución es NO normal. Desvío medio; es el promedio de las diferencias entre el valor absolutos de cada caso y el valor absoluto medio de la muestra. Varianza; es el promedio del cuadrado de las diferencias entre cada valor y la media poblacional; se eleva al cuadrado para que todos los valores sean positivos. A mayor varianza, mayor dispersión de los datos; contrariamente a menor varianza menor dispersión (ósea mayor, homogeneidad en los datos). Si bien habitualmente no se reporta, tiene gran relevancia en el cálculo de varios estadísticos. Desviación estándar/ desviación típica; es la raíz cuadrada de la varianza y por ende tiene un comportamiento similar. Sus virtudes son: mismas unidades que la variable original si la distribución es normal, permite conocer cuanta observación hay dos puntos (+-1 DS 68,3%; +- 2DS 95,4%; +- 3SD 99,3%). Error estándar de la media; es el cociente entre la desviación estándar de la población y la raíz cuadrada del tamaño de la muestra. Mide la precisión con que se estima la media aritmética, es decir, es el valor que cuantifica cuánto se apartan los valores de la media de la población. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9943051 MSI Raider GE78 HX: Tan rápido como tú saliendo de clase si falta el profesor ¡Descúbrelo aquí! Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. Media: sumatorio de todos los valores dividido por el número de elementos. FORMA Curtosis (apuntamiento) hace referencia qué tan aplanada o puntiaguda es la curva. Es decir, la curtosis indica qué tan próximos se encuentran los datos recogidos de una variable a su valor medio. (g2= curtosis). ORDEN Definición de “n tiles” Para dar nombre a los valores que permiten dividir una distribución en un determinado número de partes iguales, habitualmente formados en inglés con la terminación –tile (o –cile en el caso especial de decile), los científicos de habla hispana dudan entre la terminación –til y la terminación –tilo. Ambas pueden considerarse correctas, pero en el uso predomina claramente la primera. 9 - 5 - 9 - 4 – 6 - 4 - 2 -4 -2 - 12 – 15 – 9- 10 Ordenados 2 – 2 - 4 - 4 - 4 – 5 - 6 - 9 - 9 - 9 – 10 - 12 – 15 a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9943051 MSI Raider GE78 HX: Tan rápido como tú saliendo de clase si falta el profesor ¡Descúbrelo aquí! Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. Skew (asimetría), hace referencia a que tan simétrica es la curva. La dirección del skew (sesgo) hacer referencia a la cola de los datos y no a donde se localizan la mayor cantidad de datos (asimetría a la dcha + / a la izq -) Cuartiles: son cada uno de los 3 valores que dividen a la muestra en 4 partes iguales y ordenadas Deciles: son cada uno de los 9 valores que dividen a la muestra en 10 partes iguales y ordenadas Percentiles: son cada uno de los 99 valores que dividen a la muestra en 100 partes iguales y ordenadas. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9943051 Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.