Métodos y Técnicas de Investigación Social PDF
Document Details
Uploaded by FaithfulAndradite8012
Universidad de Sevilla
Tags
Summary
This document discusses methods and techniques of social research, focusing on analyzing data from surveys. It covers univariate and bivariate analysis and the use of Excel to perform these analyses.
Full Transcript
TEMA-5.3.pdf quierollorar Métodos y Técnicas de Investigación Social 2º Grado en Publicidad y Relaciones Públicas Facultad de Comunicación Universidad de Sevilla Reservados todos los derechos. No se permite la exp...
TEMA-5.3.pdf quierollorar Métodos y Técnicas de Investigación Social 2º Grado en Publicidad y Relaciones Públicas Facultad de Comunicación Universidad de Sevilla Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9271210 TEMA 5.3. EL ANÁLISIS DE DATOS. PRINCIPIOS GENERALES Y APLICACIÓN A LA ENCUESTA 1. EL ANÁLISIS DE DATOS DE LA ENCUESTA 2. EVALUACIÓN DE LA ASOCIACIÓN ENTRE DOS VARIABLES Con este epígrafe terminamos el tema de la Encuesta. Es una introducción al análisis de datos obtenidos por encuesta, aunque también puede servir para datos obtenidos por otros procedimientos. Comenzaremos con el Análisis pregunta a pregunta o Univariable. Lo importante será catalogar el tipo de pregunta (VARIABLE) y en base a ello saber que tipo de pruebas, análisis o descriptores podremos utilizar. La interpretación adecuada es más importante que los procesos técnicos. La segunda parte hace referencia al análisis relacional (de relaciones o asociaciones) entre preguntas (variables). Haremos una introducción al análisis bivariable (entre dos variables o preguntas). Aquí serán importantes las tablas de contingencia (cruce de variables), los porcentajes verticales y horizontales y especialmente las pruebas de asociación (Chi-cuadrado) o de relación (correlaciones). El conocimiento de su interpretación será también fundamental. Con los ejemplos y prácticas podremos seguir los procesos e interpretaciones. Trabajaremos también teórica y prácticamente en la utilización de la herramienta Excel. Un manejo adecuado y la comprensión de sus lógicas son imprescindibles en la formación universitaria de las/os graduados en Publicidad y RRPP. 1. EL ANÁLISIS DE DATOS DE LA ENCUESTA. 1.1. Análisis Univariable. Este análisis se hace pregunta a pregunta, variable a variable, sin relacionarlas. Dependiendo del tipo de pregunta, es decir, de las características de los datos o las variables, podremos establecer: las frecuencias, los porcentajes de respuestas, los recorridos o variaciones, las medidas centrales, la dispersión o concentración de los datos, etc. Las variables consideradas individual y aisladamente son características observables de algo que pueden adoptar distintos valores o de ser expresadas en varias categorías: Variable → el color. /// Categorías → Blanco, negro, azul. Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9271210 TIPOS DE VARIABLES Según el carácter de las escalas o conjuntos que forman los elementos que comprenden las variables: De Escala Nominal: Distinguen diversas categorías sin implicar orden. Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. Ejemplo: sexo, estado civil, tipo de revistas compradas... De Escala Ordinal: Implican orden, pero no grados de distancia igual. Ejemplo: nivel de instrucción, grado de generosidad, rango de prestigio, escalas de actitud... Intervalo: Orden + Distancia igual. No tienen origen natural sino convencional. Ejemplo: coeficiente de inteligencia, temperatura… Razón: Implican todos los aspectos, Distinción + Orden + Distancia Igual + Origen único natural. Ejemplo: Edad, peso, ingresos, no de revistas compradas... NIVEL DE MEDICIÓN Y POSIBILIDAD DE ANÁLISIS Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9271210 (Ejemplo de análisis univariable) Con un ejemplo realizado con una pequeña encuesta de cuatro preguntas planteadas a 10 alumnas/os de RRLL realizamos un modelo de los análisis UNIVARIABLE, es decir, pregunta a pregunta. Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. Dependiendo del tipo de pregunta y su escala de respuestas podremos hacer unos análisis u otros. Con las preguntas de carácter nominal y ordinal podremos hacer pocos análisis (frecuencias, porcentajes), con las cuantitativas (o de intervalo o razón) podremos hacer más (máximos, mínimos, media-promedio, cuartiles, mediana, desviación, variación) Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9271210 Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9271210 1.2. Análisis Bivariable. Este análisis nos permite relacionar varias preguntas entre sí, estableciendo una conexión entre unas y otras variables. Si no se consideran de forma aislada (Preferentemente en estudios explicativos, Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. relacionales, de búsqueda de motivos y razones) las variables son características observables de algo, ligadas entre sí en su variación con una relación determinada: covariación, asociación, dependencia, influencia o casualidad. Para desarrollar el apartado, seguiremos con los datos (respuestas) de la pequeña encuesta realizada a 10 estudiantes. Preguntas bivariables: ¿los que proceden de Sevilla prefieren en mayor medida algún campo profesional? ¿hay alguna relación entre la procedencia y el campo profesional?... EL ANÁLISIS DE DATOS DE ENCUESTA. (ver pre-práctica). Partimos de datos obtenidos mediante un cuestionario, y apuntamos los resultados del cuestionario, en base a sus códigos de pregunta y de respuesta, en una tabla que recoge todos los datos, todas las respuestas. TABLAS DE CONTINGENCIA Lo primero que podremos hacer en el análisis bivariable es cruzar los datos de dos preguntas. Las TABLAS DE CONTINGENCIA son unas tablas que recogen las frecuencia relacionadas de dos variables. Primero se realiza la tabla de frecuencias absolutas. Partiendo de la tabla de frecuencias absolutas (o en base a ella) realizaremos la tabla de porcentajes Verticales y la de Porcentajes Horizontales Seguimos con el ejemplo basado en el pequeño cuestionario realizado a 10 alumnos Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9271210 Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin. Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9271210 Para poder ver si dos variables (preguntas) están asociadas (tienen relación), lo primero que podemos hacer es utilizar el test CHI-cuadrado. Si son variables o preguntas cuantitativas podremos realizar y analizar las correlaciones. 2. EVALUACIÓN DE LA ASOCIACIÓN ENTRE DOS VARIABLES. TEST DE “JI-CUADRADO (CHI CUADRADO)” Se utiliza para análisis en los que se comparan dos variables y en los que se trata de comprobar si están estadísticamente relacionadas y si su variación es fruto o no de la casualidad/azar. Es responder a la pregunta ¿son INDEPENDIENTES entre sí LAS dos VARIABLES o preguntas ? Fórmula: Sumatorio de (frecuencias observada de cada casilla - la frecuencia esperada)^2 / Frecuencia esperada de dicha casilla El test no puede aplicarse si alguna casilla posee valores menores de 5 y N (no total de casos) es menor de 50. En esos casos se debe emplear el test Kolomogorov-Smirnov o Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9271210 Corrección de Yates, que resta 0,5 a las respectivas diferencias entre las frecuencias observadas y las teóricas. SIRVE PARA DEDUCIR la SIGNIFICATIVIDAD estadística de la relación observada entre las variables PRUEBA LA EXISTENCIA DE ASOCIACIÓN. Manifiesta si existe o no una variación significativa entre frecuencias o entre variables con un margen de error muy bajo Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. (5%) El test del Chi-cuadrado sugiere dos posibilidades (o procedimientos) que permiten validar la existencia de asociación entre variables (A y B): A. Cuando el valor de Chi-cuadrado obtenido es superior al teórico de las tablas (vale que supere el de un error menor del 5%) B. Cuando el error de la “prueba.chi” (obtenido con Excel) es menor de 5% Si se da A o B se deduce la significatividad estadística de la relación observada entre las variables→ HAY ASOCIACIÓN. En caso contrario, es decir, si no se da una de estas condiciones, se desestima la relación bivariable, por lo que, la relación es meramente por casualidad (las variaciones son pequeñas y/o se deben a la casualidad). A. Cuando es superior al teórico de las tablas podremos decir que hay una variación significativa entre frecuencias o entre variables con un margen de error muy bajo(Grados de libertad= (columnas-1)*(filas-1); (2-1)*(2-1)=1 El Chi-cuadrado obtenido (4) es mayor que el teórico de las tablas-→HAY ASOCIACIÓN entre Fumar y el género. Cuando en la tabla de contingencia el no de filas es igual al no de columnas, C puede compararse con el coeficiente máximo, cuya fórmula es: Cmax=Raíz cuadrada de (no de categorías de una de las variables – 1 / no de categorías). La raíz cuadrada de C / Cmax se puede interpretar como r de Pearson, ya que, nos dice la intensidad y grado de la asociación entre las variables. Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9271210 MEDIDAS DE ASOCIACIÓN PARA VARIABLES ORDINALES RHO DE SPEARMAN Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. Nos permite conocer la relación entre las variables de carácter ordinal: su fórmula es: Fórmula: 1- (6*Sumatorio de distancias^2 / nº de categorías x (nº de categorías^2-1). Para considerar este test significativo hay que observar si su valor es superior al de las tablas correspondientes. Es un test poco fiable y para denotar asociación entre las variables con menos de 7 categorías, es necesario que el resultado sea superior a 0,82. Ejemplo: C.Contingencia y C.Máximo, ver datos diapositiva 21, género y fumar ASOCIACIÓN BIVARIABLE. VARIABLES DE INTERVALO (cuantitativas puras) COEFICIENTE DE CORRELACIÓN DE PEARSON Sirve para analizar la posible asociación lineal entre dos variables de intervalo (cuantitativas). Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9271210 En el caso de datos cuantitativos, implica conocer si los valores de una de las variables tienden a ser mayores (o menores) a medida que aumentan los valores de la otra, o si no tienen nada que ver entre sí. El grado de asociación entre dos variables numéricas puede cuantificarse mediante el cálculo de un coeficiente de correlación. El coeficiente de correlación no proporciona necesariamente una medida de la causalidad entre ambas variables (es decir, no indica que una variable causa la otra) sino tan sólo del grado de relación entre las mismas. Entre +1 y -1. Si es positivo relación directa, si es negativo relación inversa El coeficiente de Pearson mide el grado de asociación lineal entre dos variables cualesquiera. Para un conjunto de datos, el valor r de este coeficiente puede tomar cualquier valor entre –1 y +1. El valor de r será positivo si existe una relación directa entre ambas variables, esto es, si las dos aumentan al mismo tiempo (a mayor uso del transporte público → mayor valoración del mismo). Será negativo si la relación es inversa, es decir, cuando una variable disminuye a medida que la otra aumenta (a mayor uso del transporte público → menor valoración del mismo). Un valor de +1 ó –1 indicará una relación lineal perfecta entre ambas variables, mientras que un valor 0 indicará que no existe relación lineal entre ellas. Hay que tener en consideración que un valor de cero no indica necesariamente que no exista correlación, ya que las variables pueden presentar una relación no lineal. Según Guilford, las correlaciones de Pearson tienen la siguiente interpretación (valor numérico no importa el signo): SIGNIFICADO DEL COEFICIENTE DE CORRELACIÓN Para un conjunto de datos cualquiera, y una vez calculado el coeficiente de correlación entre un par de variables, puede realizarse una sencilla prueba para valorar la Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9271210 significación del coeficiente de correlación y confirmar si existe o no una asociación estadísticamente significativa entre ambas características. Estudiar la significación estadística del coeficiente de correlación es determinar si r es estadísticamente diferente de cero (Que aunque hayamos obtenido un coef de corr es de 0,6 si me pedían de un 0,7 realmente ese 0,6 es como si fuera 0, porque no supera ese 0,7) Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. - La significación del 0’05 supone un riesgo de equivocarnos de un 5%, - La significación de 0’01 un riesgo de equivocarnos del 1%. (vale y es suficiente, superar el error del 5%). Seguimos con el ejemplo y los datos de la pequeña encuesta a 10 estudiantes. Preguntas 3 y 4. Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9271210 Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad. COEFICIENTE DE DETERMINACIÓN Coeficiente de determinación, = (Coeficiente de correlación^2) Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin. a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9271210 Tiene interés la interpretación del coeficiente de correlación en términos de proporción de variabilidad compartida o explicada. El coeficiente de determinación se define como el cuadrado del coeficiente de correlación. Por ejemplo, si la correlación entre inteligencia y rendimiento académico es de 0.8, significa que 0.8(al cuadrado) = 0.64 es la proporción de varianza compartida entre ambas variables. Puede interpretarse como que un 64% del rendimiento académico es debido a la inteligencia -variabilidad explicada-, o bien, y esto es más exacto si hemos de ser estrictos, que inteligencia y rendimiento académico comparten un 64% de elementos, o lo que es lo mismo, tanto la inteligencia como el rendimiento ponen en juego un 64% de habilidades comunes. Ejemplo: DEL ANÁLISIS DE DATOS DE ENCUESTA AL INFORME Ver 2.2. (Medir en CCSS) Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.