Manual de Introducción a Jamovi PDF
Document Details
Uploaded by AdorableAlder2175
Universitat Autònoma de Barcelona
2021
Llorenç Badiella, Anabel Blasco, Ester Boixadera, Oliver Valero, Ana Vázquez
Tags
Summary
This manual provides an introduction to Jamovi, a graphical user interface for R. It covers topics like introducing Jamovi, creating and opening files, saving data, data management, descriptive analysis, and tables of contingency.
Full Transcript
Manual de Introducción a Jamovi: una interfaz gráfica para usuarios de R Llorenç Badiella. Director del Servei d’Estadística Aplicada Anabel Blasco. Asesora estadística del Servei d’Estadística Aplicada Ester Boixadera. Asesora estadística del Servei d’Estadística Aplicada Oliver Valero....
Manual de Introducción a Jamovi: una interfaz gráfica para usuarios de R Llorenç Badiella. Director del Servei d’Estadística Aplicada Anabel Blasco. Asesora estadística del Servei d’Estadística Aplicada Ester Boixadera. Asesora estadística del Servei d’Estadística Aplicada Oliver Valero. Asesor estadístico del Servei d’Estadística Aplicada Ana Vázquez. Asesora estadística del Servei d’Estadística Aplicada Manual de Introducción a Jamovi _______________________________________________________________ ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 2 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Manual de Introducción a Jamovi Servei d’Estadística Aplicada Universitat Autònoma de Barcelona Campus UAB - Edifici CM7 08193 Cerdanyola del Vallès (Barcelona) Tel. 93.581.13.47 [email protected] http://serveis.uab.cat/estadistica ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 3 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Publicado por el Servei d’Estadística Aplicada de la UAB 1ª edición, Abril 2021 Este documento puede ser copiado y libremente distribuido, siempre y cuando sea preservada su integridad, referenciado su origen y comunicado su uso al Servei d’Estadística Aplicada de la UAB. No está permitido añadir, borrar o cambiar ninguna de sus partes, o extraer páginas para su uso en otros documentos. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 4 de 66 Manual de Introducción a Jamovi _______________________________________________________________ ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 5 de 66 Manual de Introducción a Jamovi _______________________________________________________________ CONTENIDOS 1 PRESENTACIÓN............................................................................................... 8 2 INTRODUCCIÓN A JAMOVI........................................................................... 9 2.1 Las ventanas de Jamovi....................................................................................................... 9 2.2 Crear y abrir ficheros......................................................................................................... 11 2.2.1 CREAR UNA NUEVA BASE DE DATOS.......................................................... 11 2.2.2 IMPORTAR BASES DE DATOS........................................................................... 13 2.3 Guardar bases de datos..................................................................................................... 14 3 GESTIÓN DE BASES DE DATOS...................................................................15 3.1 Crear nuevas variables....................................................................................................... 15 3.2 Recodificar variables......................................................................................................... 16 3.3 Editar factores.................................................................................................................... 17 3.4 Filtrar casos......................................................................................................................... 19 4 VALIDACIÓN DE LA BASE DE DATOS....................................................... 20 5 ANÁLISIS DESCRIPTIVO................................................................................21 5.1 Introducción....................................................................................................................... 21 5.2 Estadísticos resumen......................................................................................................... 21 5.2.1 VARIABLES CUALITATIVAS............................................................................... 21 5.2.2 VARIABLES CUANTITATIVAS........................................................................... 23 5.3 La representación gráfica más adecuada........................................................................ 25 5.3.1 VARIABLES CUALITATIVAS............................................................................... 25 5.3.2 VARIABLES CUANTITATIVAS........................................................................... 26 5.4 Medidas de asociación...................................................................................................... 28 5.4.1 UNA VARIABLE CUANTITATIVA Y UNA CUALITATIVA....................... 29 5.4.2 DOS VARIABLES CUANTITATIVAS................................................................. 30 5.4.3 DOS VARIABLES CUALITATIVAS..................................................................... 34 6 INFERENCIA PARA UNA POBLACIÓN...................................................... 37 6.1 Introducción....................................................................................................................... 37 6.2 Variables aleatorias............................................................................................................ 38 6.3 Estimación de parámetros................................................................................................ 39 6.3.1 ESTIMACIÓN PUNTUAL...................................................................................... 40 6.3.2 INTERVALOS DE CONFIANZA......................................................................... 41 6.4 Pruebas de hipótesis.......................................................................................................... 44 6.4.1 CONTRASTE DE HIPÓTESIS PARA UNA MEDIA...................................... 45 6.4.2 CONTRASTE DE HIPÓTESIS PARA UNA MEDIANA................................ 46 6.4.3 CONTRASTE DE HIPÓTESIS PARA UNA PROPORCIÓN........................ 46 6.4.4 RELACIÓN ENTRE IC Y TEST DE HIPÓTESIS............................................ 47 6.4.5 PRUEBAS DE NORMALIDAD............................................................................. 47 6.4.6 LA SUMISIÓN DE LOS INVESTIGADORES AL P-VALOR....................... 48 7 INFERENCIA PARA DOS POBLACIONES.................................................. 50 ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 6 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 7.1 Introducción....................................................................................................................... 50 7.2 Muestras independientes.................................................................................................. 50 7.2.1 COMPARAR MEDIAS.............................................................................................. 50 7.2.2 PRUEBA DE IGUALDAD DE VARIANZAS.................................................... 52 7.2.3 COMPARAR MEDIANAS....................................................................................... 53 7.3 Muestras relacionadas....................................................................................................... 53 8 INFERENCIA PARA K POBLACIONES........................................................ 55 8.1 Introducción....................................................................................................................... 55 8.2 Variables cuantitativas: comparar medias...................................................................... 55 8.2.1 MUESTRAS INDEPENDIENTES: PRUEBA ANOVA................................... 55 8.2.2 COMPARACIONES MÚLTIPLES 2 A 2.............................................................. 58 8.2.3 INFERENCIA NO PARAMÉTRICA: PRUEBA DE KRUSKAL-WALLIS.. 60 9 TABLAS DE CONTINGENCIA...................................................................... 62 10 RESUMEN METODOLÓGICO...................................................................... 64 11 BIBLIOGRAFÍA................................................................................................ 66 ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 7 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 1 PRESENTACIÓN Este manual de introducción a Jamovi pretende ser una primera aproximación al uso del programa Jamovi para aquellas personas que deseen adquirir conocimientos de Estadística, y que deseen introducirse en el uso de este software para aplicarlo en su área de conocimiento y trabajo. Jamovi es una Interfaz Gráfica de Usuario (GUI en inglés), creada por Jonathon Love, Damian Dropmann y Ravi Selker, que permite acceder a muchas capacidades del entorno estadístico R sin que el usuario tenga que conocer el lenguaje de comandos propio de este entorno. Algunas ventajas de la interfaz Jamovi son: o Es sencilla de usar. o Permite el acceso a las funciones y gráficos estadísticos más comunes. o Facilita la realización de tareas más complejas. o Es multisistema y multiplataforma. o Versión demo que permite trabajar directamente desde la nube. o Es fácilmente extensible y personalizable. o Ofrece la posibilidad de incluir código R. Para ver más detalles sobre el programa consultar la página web: www.jamovi.org ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 8 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 2 INTRODUCCIÓN A JAMOVI 2.1 Las ventanas de Jamovi Jamovi es una nueva hoja de cálculo estadístico de “tercera generación”. En la cuadrícula de la izquierda podremos introducir datos manualmente o bien importar ficheros con extensión “.csv”, “.txt” o “.xlsx” entre otros. En la ventana de la derecha se irán guardando los resultados generados, y estos se actualizarán automáticamente si se modifica la base de datos. Desde el menú principal podremos abrir una nueva hoja de datos, abrir una base de datos ya creada en Jamovi (extensión “.omv”) o importar una base de datos de texto, Excel, SPSS, R, Stata, o SAS. También podremos exportar una base de datos a CSV, R, SPSS, SAS o Stata, y los resultados a un documento pdf o html. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 9 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Desde el menú Data podremos realizar operaciones en la base de datos: - Clipboard: Permite pegar, cortar o copiar observaciones. - Edit: Permite deshacer/rehacer una acción. - Variables: Permite definir las propiedades de las variables (Setup), crear nuevas variables (Compute), transformar o recodificar variables (Transform) o añadir o eliminar variables (Add/Delete). - Rows: Permite aplicar filtros y añadir o eliminar observaciones. En el menú Analyses podremos realizar operaciones en la base de datos: - Exploration: Realiza tablas de resumen y gráficos. - T-Tests: Incorpora pruebas paramétricas y no paramétricas para comparar medias/medianas de 1 población, 2 muestras independientes y 2 muestras relacionadas. - ANOVA: Para realizar ANOVA de 1 factor, de varios factores, ANCOVA, MANCOVA, medidas repetidas y pruebas no paramétricas. - Regression: Permite calcular correlaciones, ajustar modelos de regresión lineal y modelos de regresión logística (binaria, ordinal y multinomial). - Frequencies: Tablas de contingencia, test de Chi-cuadrado y test de McNemar. - Factor: Análisis de fiabilidad, análisis de componentes principales y análisis factorial. Desde se pueden incorporar módulos adicionales que incorporan técnicas estadísticas más avanzadas. Algunos de estos módulos son: - surveymv: Genera gráficos de resumen para múltiples variables. - jpower: Análisis de potencia para los diseños de investigación más comunes. - deathwatch: Análisis de supervivencia. - jsq: Incorpora métodos estadísticos bayesianos. - gamlj: Para la estimación de modelos lineales, como el modelo lineal general, el modelo lineal mixto, los modelos lineales generalizados y los modelos mixtos generalizados. - Rj: Proporciona un editor que permite insertar código R y analizar los datos usando R dentro de Jamovi. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 10 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 2.2 Crear y abrir ficheros Para analizar datos lo primero es crear o abrir un archivo de trabajo. Se pueden introducir datos creando una nueva base de datos e introduciendo los datos manualmente, abriendo un fichero de Jamovi existente, o importando un fichero procedente de otra aplicación. 2.2.1 Crear una nueva base de datos La base de datos está dividida en filas y columnas dando lugar a celdas o casillas donde se recogen los datos. Cada columna tiene asignado un nombre de variable, ya sea especificado por el usuario o bien por el propio programa. Las filas, a su vez, están numeradas de forma correlativa. A partir de las pestañas “Add column” y “Add row” se pueden añadir filas y columnas respectivamente. Para introducir datos se pueden crear nuevas filas y columnas e introducir datos manualmente, o bien copiar datos de otras aplicaciones y pegarlos en la tabla. En la primera fila podremos definir los nombres de las variables. Para acceder a las propiedades de las variables podemos utilizar el menú Data Setup o bien hacer doble clic en una variable. Se abrirá el editor de variables: Para minimizar esta ventana y volver a la base de datos podemos utilizar la flecha , y para acceder a las propiedades de otras variables utilizaremos las flechas laterales. Observación: Los nombres de las variables pueden tener acentos y espacios, pero no es aconsejable si más adelante queremos incorporar código de R. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 11 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Tipos de variables Las variables, tal y como hemos dicho, definen las columnas del fichero de datos y son características de los individuos. Pueden ser diferenciadas según: o Cualitativas o Categóricas: etiquetas que representan el grupo o categoría a la cual pertenece un individuo. Se puede diferenciar entre nominales (por ejemplo, el sexo) y ordinales (nivel de estudios). o Cuantitativas: valores numéricos para los que tiene sentido realizar aritmética. Se puede diferenciar entre continuas (índice de masa corporal) y discretas (número de hijos). Pueden ser valores enteros o con decimales. Observación: En Jamovi el separador de decimales es el punto. o ID: este tipo de variable es específico de Jamovi. Está destinado a variables que contienen identificadores que casi nunca se analizan, como los nombres o el número de historia clínica. Valores faltantes (missings) Los valores faltantes se indican dejando la casilla en blanco. Adicionalmente, desde la casilla “Missing values” se podrían indicar otros valores para ser tratados como missings, como por ejemplo el 99: ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 12 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Ejercicio: Crear una base de datos con la siguiente información: 2.2.2 Importar bases de datos Podemos abrir una base de datos utilizando el menú Open. Con esta opción podemos abrir datos que se encuentren en formato de Jamovi (extensión “.omv”), en formato texto, u otros tipos de formato como por ejemplo Excel o SPSS. Estos son los formatos compatibles con Jamovi: Observación: El menú Import también permite abrir una base de datos externa, pero no se recomienda utilizarlo si ya tenemos una base de datos abierta. Desde el menú Open seleccionamos la opción e indicamos dónde se encuentra la base de datos que deseamos abrir. Una vez abierta deberemos revisar que el tipo de variables se ha definido correctamente, así como el orden de los niveles de las variables cualitativas. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 13 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 2.3 Guardar bases de datos Las bases de datos pueden ser guardadas en formato Jamovi (extensión “.omv”) desde el menú Save as, o bien ser exportadas a otro formato desde Export. Las opciones disponibles son: Ejercicio: Abrir los ficheros ADL.xlsx, ADL.txt y ADL.sav. Comparar las propiedades de las variables de las 3 bases de datos. Realizar las correcciones oportunas en el fichero importado desde Excel y guardar la base de datos en formato “.jmv”. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 14 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 3 GESTIÓN DE BASES DE DATOS El menú “Data” permite gestionar las bases de datos. En particular permite calcular nuevas variables a partir de las ya existentes, aplicar alguna transformación, recodificar variables, editar los factores de las variables categóricas, o seleccionar un subconjunto de datos. 3.1 Crear nuevas variables El menú Data Compute variable permite crear nuevas variables: También se pueden aplicar transformaciones a las variables utilizando funciones ya implementadas: ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 15 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Algunas funciones de interés son: o LN(x): Devuelve el logaritmo neperiano (para valores mayores que 0). o ABS(x): Devuelve el valor absoluto. o Z: Reescala las variables para que tengan media 0 y desviación estándar 1 (variable estandarizada). o RANK: Reemplaza los valores por su rango. Ejercicio: Calcular una nueva variable ‘Factores.Riesgo’ como la suma de los factores de riesgo (obesidad, fumador, diabetes y HTA). Observación: Las variables calculadas a partir de una fórmula pasan a ser automáticamente variables numéricas. En el caso de la variable ‘Factores.Riesgo’, si quisiéramos tratarla también como categórica, deberíamos crear una variable nueva, copiar los datos de la variable numérica, y definirla como ordinal. 3.2 Recodificar variables Recodificar una variable consiste en asignar una nueva codificación a sus valores originales, o agrupar rangos de valores existentes en nuevos valores, de manera que se modifica su codificación original. Existen varias situaciones donde nos puede interesar recodificar los valores de una variable: cuando queremos pasar de una variable continua a una variable categórica, como por ejemplo el IMC o la edad, o cuando queremos agrupar categorías de una variable categórica como por ejemplo el número de factores de riesgo o la valoración de salud. Para recodificar una variable, al hacer clic con el botón derecho seleccionaremos la opción “Transform”. Una vez definido el nombre de la nueva variable debemos crear una nueva transformación: ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 16 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Esta transformación podría ser empleada posteriormente en otras variables. Tras indicar el nombre de la transformación, podemos añadir condiciones desde : Al definir las condiciones, $source hace referencia a los valores de la variable original. Los valores de las categorías de la nueva variable deberán indicarse entre comillas (pueden ser dobles o simples). Ejercicio: Recodificar la variable ‘Factores.Riesgo’ en una nueva variable agrupando los valores de 2 a 4 en una misma categoría. A continuación, recodificar las variables ‘Edad’ y ‘Valoración’ en tres categorías cada una. 3.3 Editar factores Los niveles de las variables categóricas (factores) se muestran en la pestaña “Levels” (se accede a través del menú Data Setup, o bien haciendo doble clic en el nombre de una variable). Por defecto de ordenan alfabéticamente, pero se puede modificar el orden desplazando los niveles hacia arriba y hacia abajo: ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 17 de 66 Manual de Introducción a Jamovi _______________________________________________________________ También es posible modificar los nombres de los niveles, simplemente sobrescribiendo los valores: Observación: Al cambiar los valores de los factores de riesgo habrá que cambiar también los valores en la fórmula para calcular los factores de riesgo: Ejercicio: Revisar los niveles de las variables categóricas de la base de datos. Ordenar los niveles que corresponda y modificar las etiquetas de las variables binarias (Sí/No). Guardar la base de datos resultante como “ADL_Final.omv”. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 18 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 3.4 Filtrar casos En ocasiones podemos estar interesados en estudiar un subconjunto de registros de la base de datos. El menú Data Filters permite aplicar filtros a la base de datos seleccionando únicamente los registros que cumplan una determinada condición. Para crear una base de datos con los pacientes de sexo masculino utilizaremos la siguiente instrucción: Observación: Para las variables categóricas el valor de la categoría debe ir entre comillas. El programa distingue entre mayúsculas y minúsculas. Ejercicio: Seleccionar los pacientes mayores de 60 años que tengan hipertensión. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 19 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 4 VALIDACIÓN DE LA BASE DE DATOS Antes de realizar cualquier análisis debe hacerse un ejercicio de validación de la base de datos. Detectar posibles errores en las variables, esto quiere decir encontrar rangos de valores y algunos estadísticos descriptivos para las variables cuantitativas, y tablas de frecuencias para las variables cualitativas. Validar la consistencia interna de los datos. Así, por ejemplo, en datos de encuesta es validar la congruencia de las respuestas en el sentido que, si un individuo responde una determinada opción en una pregunta, entonces sólo puede responder unas opciones concretas de otras. Para poder llevar a cabo este proceso hace falta conocer bien de donde provienen los datos. Una herramienta útil para validar las variables es a partir del módulo extra ‘surveymv’. Este módulo se instala desde la pestaña Jamovi library install. Tras su instalación aparecerá un submenú adicional dentro de Analyses Exploration. Podríamos seleccionar todas las variables y graficarlas según el grupo: ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 20 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 5 ANÁLISIS DESCRIPTIVO 5.1 Introducción Plantearse algunas preguntas preliminares puede ayudar a distinguir qué tiene sentido y qué no: Conocer la fuente de dónde provienen los datos nos puede informar de su calidad. Saber si la información de que disponemos es completa en el sentido que sea posible extraer conclusiones y no sólo impresiones. Plantear qué pueden ilustrar los datos. La ESTADÍSTICA DESCRIPTIVA es un conjunto de métodos e ideas para organizar y describir los datos mediante gráficos y medidas de resumen numéricas. 5.2 Estadísticos resumen Como hemos visto en los apartados previos, las variables pueden ser diferenciadas según: o CUALITATIVAS o CATEGÓRICAS o CUANTITATIVAS Las variables también las clasificamos en función del rol que tienen en el análisis: o Variable RESPUESTA (variable de interés, Y). Mide el resultado del estudio. o Variables EXPLICATIVAS (X). Variables de control que contribuyen a explicar su comportamiento. 5.2.1 Variables cualitativas Para resumir una variable cualitativa o cuantitativa de valores enteros utilizaremos las Tablas de Frecuencias. El número de veces que se repite un valor en una variable es la frecuencia absoluta, fa. Si n es el total de individuos, entonces fa/n es su frecuencia relativa. La frecuencia acumulada es la suma de frecuencias absolutas hasta un determinado valor una vez ordenados de forma creciente los valores de la variable (ordinal o cuantitativa con valores enteros). ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 21 de 66 Manual de Introducción a Jamovi _______________________________________________________________ La distribución de una variable es el conjunto de valores juntamente con sus frecuencias (absolutas o relativas). En Jamovi podemos obtener las frecuencias a través del menú Analyses Exploration Descriptives, y marcaremos la casilla “Frequency tables”: Para seleccionar más de una variable a la vez, utilizar la tecla ‘Control’. Tras seleccionar las variables automáticamente aparecerán las tablas de resultados en la ventana de la derecha. Para finalizar podemos hacer clic en la flecha: Frequencies of Hospital Frequencies of Sexo Levels Counts % of Total Cumulative % % of Cumulative Levels Counts Total % A 111 34.2 % 34.2 % Hombre 162 49.8 % 49.8 % B 214 65.8 % 100.0 % Mujer 163 50.2 % 100.0 % Para cada variable seleccionada obtenemos la tabla de frecuencias con las frecuencias absolutas (Counts) y relativas (% of Total) de las distintas categorías. Observación: Estos resultados se pueden copiar y pegar en un documento Word haciendo clic con el botón derecho. También se pueden añadir comentarios (Add note). ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 22 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 5.2.2 Variables cuantitativas Para las variables cuantitativas, en las que puede haber un gran número de valores observados distintos, se debe optar por un método de análisis distinto, respondiendo a las siguientes preguntas: 1. ¿Alrededor de qué valor se agrupan los datos? 2. Supuesto que se agrupan alrededor de un número, ¿cómo lo hacen? ¿muy concentrados? ¿muy dispersos? 5.2.2.1 Medidas de localización Se utilizan para resumir las características más relevantes de los datos. Podemos utilizar: o Media ( X ): centro de masas o Mediana: punto medio o Moda: el valor más repetido La media se sitúa en el punto de equilibrio del histograma de una variable cuantitativa: La Media y la Mediana coinciden si la distribución es simétrica. Si no coinciden, es preferible la mediana (es menos sensible a datos extremos). Otras medidas de resumen son los Cuartiles (Q1, Q2 y Q3), también llamados Percentiles (P25, P50, P75). Estos tres valores dividen la distribución en cuatro partes iguales. 5.2.2.2 Medidas de dispersión Sirven para resumir la dispersión. Las más habituales son: o Rango = max – min o Rango Intercuartil (IQR) = Q3 – Q1 o Varianza (S2): una medida de la dispersión entorno de la media o Desviación estándar (S) o Error estándar de la media = 𝑆/√𝑛 ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 23 de 66 Manual de Introducción a Jamovi _______________________________________________________________ En Jamovi podemos obtener los estadísticos de resumen a través del menú Analyses Exploration Descriptives, y seleccionaremos variables cuantitativas: El desplegable ‘Statistics’ podemos seleccionar los estadísticos: Descriptives Días Edad IMC Factores.Riesgo N 325 325 325 325 Missing 0 0 0 0 Mean 19.9 52.2 26.3 0.868 Median 20 52 26.0 1 Standard deviation 7.46 8.30 1.88 0.823 Minimum 2 34 20.8 0 Maximum 41 76 32.4 4 Observación: Haciendo doble clic en una tabla de resultados se vuelve a abrir el menú donde podemos seleccionar otros estadísticos. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 24 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 5.3 La representación gráfica más adecuada En el mismo menú de exploración encontramos un desplegable “Plots”, donde podemos seleccionar los siguientes gráficos: 5.3.1 Variables cualitativas Se representan las frecuencias o porcentajes de las diferentes categorías. Se pueden utilizar diagramas de barras o gráficos de sectores. 5.3.1.1 Diagrama de barras El gráfico de barras (“Bar Plots”) es la única opción disponible por el momento en Jamovi para representar variables cualitativas. Al marcar la casilla automáticamente nos añade en la ventana de resultados los gráficos para las variables seleccionadas. El gráfico de barras para la variable ‘Valoración’ es el siguiente: Observación: Los gráficos se pueden exportar a pdf, png o eps. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 25 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 5.3.1.2 Gráficos de sectores Si bien este tipo de gráfico no se podría obtener directamente desde los menús de Jamovi, se podría obtener mediante el módulo extra que permite introducir código de R: El gráfico obtenido tras compilar el código ( ) es el siguiente: Observación: El módulo Rj Editor se puede añadir desde la pestaña Jamovi library install. 5.3.2 Variables cuantitativas Para las variables cuantitativas se describe el patrón general de la distribución de las variables y permiten detectar outliers. 5.3.2.1 Histograma El histograma permite representar variables cuantitativas una vez agrupados los valores en clases. Representa las frecuencias y las clases de una variable cuantitativa. Las clases deben formar un sistema exhaustivo y excluyente. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 26 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Al seleccionar la opción “Histogram” del menú “Plots” obtenemos la siguiente representación de la variable edad: Al seleccionar la opción “Density” se añade al histograma la curva de densidad. 5.3.2.2 Diagrama de caja Un diagrama de caja es un gráfico (“Box plot”) basado en los valores mínimo, máximo y los cuartiles (Q1, Q2 o mediana y Q3). Informa sobre la existencia de valores atípicos y la simetría de la distribución: Máximo Q3 Mediana Q1 Mínimo Al seleccionar la opción “Mean” se añade al gráfico el valor de la media. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 27 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 5.3.2.3 Gráfico de barras Al seleccionar la opción “Bar Plot” obtenemos la representación de un gráfico de barras que corresponde a la media, y un intervalo de confianza que corresponde a una desviación estándar de la media: Ejercicio: Realizar un resumen descriptivo de cada una de las variables de la base de datos. 5.4 Medidas de asociación El principal objetivo cuando se tienen dos o más variables está en medir la posible asociación entre ellas. La relación Causa-Efecto Muchas veces es fuente de interpretaciones erróneas de los resultados. En estadística, generalmente, se busca analizar si ciertos factores presentan un efecto sobre una determinada variable respuesta. No siempre se puede asegurar que la causa de este efecto sea el factor. Establecer una relación causal no es nada simple. Raramente A es la causa de B. Fumar, por ejemplo, es sólo una causa que contribuye a desarrollar cáncer de pulmón; es una de las causas que aumenta la probabilidad de cáncer. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 28 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 5.4.1 Una variable cuantitativa y una cualitativa Para estudiar la relación entre una variable CUALITATIVA y una CUALITATIVA podemos calcular los estadísticos de resumen para cada una de las categorías de la variable cualitativa. Ejemplo: Relación entre las variables cuantitativas ‘Días’, ‘Edad’, ‘IMC’, ‘FR’ y el ‘Grupo’. En el recuadro “Split by” del menú Analyses Exploration Descriptives podemos indicar una variable categórica para obtener los estadísticos de resumen para cada una de las categorías de esta variable: Descriptives Grupo Días Edad IMC Factores.Riesgo N Control 162 162 162 162 Tratamiento 163 163 163 163 Mean Control 21.9 52.8 26.5 0.907 Tratamiento 17.9 51.6 26.0 0.828 Median Control 22.0 54.0 26.2 1.00 Tratamiento 18 52 25.8 1 Standard deviation Control 7.62 8.57 1.80 0.876 Tratamiento 6.74 8.01 1.94 0.767 Minimum Control 4 34 21.5 0 Tratamiento 2 36 20.8 0 Maximum Control 41 76 31.9 3 Tratamiento 34 74 32.4 4 ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 29 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Representación gráfica: Diagrama de caja agrupado. 5.4.2 Dos variables cuantitativas Para variables CUALITATIVAS la asociación entre ellas se analiza a partir del Coeficiente de correlación (menú Regression Correlation Matrix). Ejemplo: Relación entre la ‘Talla’ y el ‘Peso.Ingreso’. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 30 de 66 Manual de Introducción a Jamovi _______________________________________________________________ El estadístico que aparece seleccionado por defecto es el coeficiente de correlación de Pearson (), que sirve para medir la asociación lineal entre las variables: S XY SX SX donde 𝑆𝑥𝑦 es la covarianza entre las variables. Cuando las variables son discretas ordinales, podemos utilizar el coeficiente de correlación de Spearman. Este coeficiente se basa en los rangos, por lo que es un estadístico no paramétrico. Permite medir la relación monótona entre dos variables, y no se ve afectado por outliers. Se calcula como: 6 Di2 1 n(n 2 1) donde D es la diferencia de rangos de los valores de X e Y, y n el tamaño muestral. Correlation Matrix Talla Peso.Ingreso Pearson's r 0.485 Spearman's rho 0.528 Gráficamente se pueden representar mediante el Diagrama de dispersión, que se obtiene seleccionando la casilla “Correlation Matrix” en “Plot”: Observación: En el gráfico de dispersión la variable respuesta debe ir en el eje vertical (Y) y la variable explicativa en el eje horizontal (X). ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 31 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Al seleccionar las opciones “Density” y “Statistics” se añaden los gráficos de densidad de cada variable y los estadísticos. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 32 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Relación entre los valores del coeficiente de correlación y el gráfico de dispersión de las variables: R=0 R = 0,20 3 3 2 2 1 1 0 0 -1 -1 -2 -2 -3 -3 -4 -4 Y Y 7 8 9 10 11 12 13 7 8 9 10 11 12 13 X1 X3 R = 0,50 R = 0,90 3 3 2 2 1 1 0 0 -1 -1 -2 -2 -3 -3 -4 -4 Y Y 6 8 10 12 14 0 10 20 X4 X5 R = 0,99 R = 0,01 3 3 2 2 1 1 0 0 -1 -1 -2 -2 -3 -3 -4 -4 Y Y -30 -20 -10 0 10 20 30 40 8 10 12 14 16 18 20 22 X6 X8 ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 33 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 5.4.3 Dos variables cualitativas Para variables CUALITATIVAS la asociación entre ellas se analiza a partir de la Tabla de Contingencia (menú Frequencies Independent samples). Ejemplo: Relación entre las variables IMC (categórica) y la hipertensión arterial. Observación: La opción “Counts” permitiría obtener la tabla de contingencia a partir de datos agregados. La opción “Layers” permitiría segmentar los resultados en función de una tercera variable, por ejemplo grupo de tratamiento. Contingency Tables HTA IMC.cat No Sí Total Normal 71 11 82 Sobrepeso 111 118 229 Obesidad 0 14 14 Total 182 143 325 A partir de las frecuencias observadas se definen los perfiles fila y columna: o Frecuencia relativa conjunta = nij / n o Perfil fila i = {nij / ni. para j=1,..J} o Perfil columna j = {nij / n.j para i=1,..I} ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 34 de 66 Manual de Introducción a Jamovi _______________________________________________________________ En la pestaña “Cells” podemos seleccionar los perfiles fila (“Row”) o columna (“Column”): En este caso seleccionaremos los perfiles fila, para poder comparar el porcentaje de hipertensos según las categorías de IMC: Contingency Tables HTA IMC.cat No Sí Total Normal Observed 71 11 82 % within row 86.6 % 13.4 % 100.0 % Sobrepeso Observed 111 118 229 % within row 48.5 % 51.5 % 100.0 % Obesidad Observed 0 14 14 % within row 0.0 % 100.0 % 100.0 % Total Observed 182 143 325 % within row 56.0 % 44.0 % 100.0 % Representación gráfica: gráfico de barras agrupado (“Bar Plot”, seleccionando la variable de agrupación en la pestaña “Plots”): ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 35 de 66 Manual de Introducción a Jamovi _______________________________________________________________ En el eje Y se recomienda utilizar los mismos porcentajes seleccionados en la tabla de contingencia: Ejercicio: Realizar un análisis descriptivo entre la variable ‘IMC.cat’ y el resto de factores de riesgo. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 36 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 6 INFERENCIA PARA UNA POBLACIÓN 6.1 Introducción Después de llevar a cabo un análisis descriptivo de los datos el objetivo es poder generalizar los resultados para conjuntos más grandes de individuos, así como poder sacar conclusiones a partir de los datos. La PROBABILIDAD permite calibrar el poder de nuestras conclusiones. Población: Conjunto completo de individuos para los cuales se desea obtener información. Muestra: Subconjunto de individuos de la población para los cuales realmente se obtiene la información de interés. De una misma población se pueden obtener varias muestras diferentes, de tamaño n: OBSERVACIÓN: La población está definida a partir de nuestro deseo de conocimiento. Los resultados obtenidos en una muestra serán extrapolables a la población de referencia si la muestra cumple dos características fundamentales: Fiabilidad (precisión): La fiabilidad de una muestra está vinculada a la precisión de sus resultados, es decir, al tamaño de muestra. Validez (sesgo): La validez de una muestra se refiere a que la muestra no presente sesgos, es decir errores de medida sistemáticos atribuibles a otra causa distinta del azar. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 37 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Un buen diseño del experimento permitirá controlar las posibles fuentes de sesgo y asegurar la validez del estudio. o Una muestra representativa debe ser fiable y válida. o No confundir muestra significativa con muestra representativa. o Una muestra de 20.000 individuos no tiene por qué ser representativa de nada a no ser que se compruebe su validez, aunque seguramente sea suficientemente fiable. o En una muestra de 10 individuos los resultados serán poco fiables, aunque seguramente la muestra sea suficientemente válida. La Estadística es una herramienta que permite describir y cuantificar las evidencias observadas en una muestra intentando diferenciar entre lo que podría haber sucedido por azar y lo que podría atribuirse a otras causas (de interés). Inferir significa sacar conclusiones de los datos teniendo en cuenta la variación debida al azar. 6.2 Variables aleatorias Los datos que habitualmente se analizan provienen de un experimento aleatorio: Un experimento aleatorio o estocástico es aquel que bajo las mismas condiciones puede producir resultados diferentes, pero con una distribución regular de resultados para un número grande de repeticiones. Un ejemplo de experimento aleatorio es el lanzamiento de un dado. Un experimento es no aleatorio o determinista si bajo las mismas condiciones siempre conduce a un mismo resultado. Un ejemplo son las fórmulas físicas: Fuerza = Masa * Aceleración. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 38 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Las variables aleatorias son aplicaciones que transforman los resultados de un experimento aleatorio en números con el fin de poder realizar las operaciones más usuales, luego todos los resultados de un experimento aleatorio quedan recogidos en una variable aleatoria. Antes de realizar cualquier inferencia estadística es necesario identificar la distribución de probabilidad (la forma) de la variable aleatoria que se pretende analizar. Algunos instrumentos para ello son: o Histograma, diagrama de caja, QQ Plot. o Pruebas de ajuste a una distribución (Test de Shapiro Wilk). 6.3 Estimación de parámetros Un parámetro es un número que describe una característica de la población. En la práctica los valores de los parámetros son desconocidos. Un estadístico es un número que se calcula a partir de los datos de una muestra de la población. En la práctica se utilizan los estadísticos para estimar los parámetros de la población. Un estimador es cualquier función de una muestra, esto es, un estadístico es un estimador puntual. Debemos observar que un estimador es una variable aleatoria mientras que una estimación es un valor concreto del estimador. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 39 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 6.3.1 Estimación puntual Una estimación puntual es el valor del estimador dada una muestra concreta. Los estimadores puntuales más frecuentemente utilizados son: n Xi o Media muestral: X i 1 n X n 2 o Variancia muestral: i X i 1 S2 n 1 o Proporción: p̂ A los estimadores básicamente se les requiere dos propiedades: sin sesgo, es decir que no se encuentren muy alejados del valor real del parámetro que estiman, y de mínima varianza posible, es decir que las distintas estimaciones estén próximas entre sí. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 40 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 6.3.2 Intervalos de confianza En inferencia estadística uno de los instrumentos más comunes para estimar el valor de un parámetro de la población son los intervalos de confianza. Un intervalo de confianza del C% para un parámetro es un intervalo de valores calculado a partir de los datos de la muestra utilizando un método que tiene una probabilidad C de que dicho intervalo contenga el verdadero valor del parámetro. El parámetro poblacional pertenece al intervalo calculado con una confianza del C%. La media muestral y la desviación estándar son buenos estimadores puntuales de la media y la desviación estándar de la población. Dado que los datos son las observaciones de una variable aleatoria, estos estimadores son a la vez variables aleatorias. Por lo tanto, tienen una determinada distribución que en el caso de la media es la distribución Normal. Para realizar inferencia estadística debemos interpretar los intervalos de confianza para un parámetro a partir del siguiente gráfico: Si repetimos el experimento 100 veces o tomamos 100 muestras, en 95 ocasiones el parámetro pertenecerá al intervalo de confianza del 95% y en 5 ocasiones caerá fuera del intervalo. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 41 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Para una mejor comprensión de estos conceptos de la inferencia estadística básica se recomienda consultar los siguientes statistical applets, basados en el texto de Moore (2010): https://www.macmillanlearning.com/studentresources/highschool/hsbridgepage/tps5e.ht ml#anchor5 6.3.2.1Intervalos de confianza para una media Para obtener intervalos de confianza en Jamovi debemos seleccionar el menú Analyses T-Tests One Sample T-Test y seleccionar la opción “Confidence interval”: One Sample T-Test 95% Confidence Interval Mean difference Lower Upper Días Student’s t 19.9 19.1 20.7 Desde el recuadro “Confidence Level” podemos indicar el nivel de confianza deseado. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 42 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 6.3.2.1Intervalos de confianza para una mediana Para variables que no sigan una distribución normal (ver apartado 6.4.5) podemos obtener un intervalo de confianza para la mediana seleccionando el test Wilcoxon rank: One Sample T-Test 95% Confidence Interval Mean difference Lower Upper Días Wilcoxon W 20.0 19.0 20.5 Observación: En la tabla aparece “Mean difference” pero corresponde a la mediana. 6.3.2.1Intervalos de confianza para una proporción Para obtener intervalos de confianza para una proporción seleccionaremos el menú Analyses Frequencies 2 Outcomes. Ejercicio: Calcular los intervalos de confianza para las variables ‘IMC.cat’, ‘Fumador’, ‘Diabetes’, ‘HTA’ y ‘Reingreso’. ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 43 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 6.4 Pruebas de hipótesis Un segundo bloque de instrumentos para la inferencia estadística son las pruebas de hipótesis. Estas evalúan la evidencia de una afirmación sobre la población. En estadística una afirmación sobre la población se plantea en forma de hipótesis de trabajo. Las dos hipótesis complementarias se llaman: Hipótesis nula (H0) Hipótesis alternativa o de investigación (H1) La hipótesis nula corresponde a la hipótesis que creemos cierta por defecto y la alternativa corresponde a la hipótesis que se desea probar. Las hipótesis hacen siempre referencia a los parámetros de la población. Una prueba de hipótesis es un procedimiento que especifica: 1. Para qué valores muestrales la decisión será no rechazar la hipótesis nula. 2. Para qué valores muestrales la hipótesis nula será rechazada a favor de la alternativa. P-valor: Probabilidad que, bajo H0, el estadístico de contraste tome un valor al menos tan alejado como el realmente obtenido. Cuanto más pequeño sea el p-valor mayor es la evidencia en contra de H0. Se rechazará la hipótesis nula si el p-valor es menor que el nivel de significación adoptado (en general 0,05). En un contraste de hipótesis, debemos rechazar o no la hipótesis nula a favor de la alternativa. Deseamos que nuestra decisión sea correcta, pero a veces no lo será. Hay dos tipos de decisiones incorrectas: Rechazar H0 cuando de hecho es cierta: error de tipo I. NO rechazar H0 cuando realmente es cierta H1: error de tipo II. Observación: El error de tipo I = nivel de significación = . En siguiente cuadro resume los tipos de errores que se pueden cometer en un contraste de hipótesis: ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 44 de 66 Manual de Introducción a Jamovi _______________________________________________________________ Verdad acerca de la población Decisión basada H0 cierta H1 cierta en la muestra Rechazo de H0 Error de tipo I Decisión correcta No rechazo de H0 Decisión correcta Error de tipo II El error de Tipo I es más grave que el error de Tipo II. 6.4.1 Contraste de hipótesis para una media La hipótesis que se contrasta es: H0: µ = 𝜇0 H1: µ ≠ 𝜇0 Para llevar a cabo un contraste de hipótesis para la media debemos volver al menú anterior y definir como valor de prueba el valor que deseamos contrastar: One Sample T-Test Statistic df p Días Student's t -2.57 324 0.011 Note. Hₐ population mean ≠ 21 Seleccionando la opción “Effect size” obtenemos el tamaño del efecto, una medida sobre la diferencia estandarizada entre el promedio de cada grupo: 𝜇 − 𝜇0 𝛿= 𝜎 One Sample T-Test Effect Size Días Cohen's d -0.143 Observación: Se considera un efecto pequeño a partir de 0,1, mediano a partir de 0,3 y grande a partir de 0,5 (en valor absoluto). ______________________________________________________________________ Servei d’Estadística Aplicada, Universitat Autònoma de Barcelona Página 45 de 66 Manual de Introducción a Jamovi _______________________________________________________________ 6.4.2 Contraste de hipótesis para una mediana La hipótesis que se contrasta es: H0: mediana = 𝑚𝑒𝑑𝑖𝑎𝑛𝑎0 H1: mediana ≠ 𝑚𝑒𝑑𝑖𝑎𝑛𝑎0 Para llevar a cabo un contraste de hipótesis para la mediana debemos seleccionar la opción Wilcoxon y definir como valor de prueba el valor que deseamos contrastar en la pestaña “Test value”: One Sample T-Test Statistic p Edad Wilcoxon W 31658