Diseño y Análisis de Datos I - Universidad Loyola - PDF
Document Details
Uploaded by RealizableRomanesque
Universidad Loyola
Tags
Summary
This document provides notes on data analysis and research methods, specifically focused on sampling procedures, population, and sample size. It details different types of sampling techniques, including probabilistic and non-probabilistic methods. The notes are organized for a psychology research context.
Full Transcript
Diseño y Análisis de Datos I BLOQUE 1 FUNDAMENTOS METODOLÓGICOS PARA LA INVESTIGACIÓN EN PSICOLOGÍA 1 Tema 3 Procedimientos de selección de la muestra 2 Índice 1. Población y muestra...
Diseño y Análisis de Datos I BLOQUE 1 FUNDAMENTOS METODOLÓGICOS PARA LA INVESTIGACIÓN EN PSICOLOGÍA 1 Tema 3 Procedimientos de selección de la muestra 2 Índice 1. Población y muestra 2. Muestreo 3. Tipos de muestreo o 3.1. Muestreo probabilístico M. Aleatorio simple M. Aleatorio sistemático M. Aleatorio estratificado M. aleatorio por conglomerados o 3.2. Muestreo no probabilístico M. Intencional M. de conveniencia M. Accidental o por cuotas M. de bola de nieve Las fases de una investigación 1. Seleccionar el 2. Revisar la 3. Plantear el 4. Plantear los problema de literatura relevante problema de objetivos de investigación sobre el problema investigación investigación 5. Establecer las 6. Operacionalización 7. Considerar el 8. Selección de los hipótesis de y medición de las método más variables adecuado sujetos investigación 10. Análisis 12. Redacción del 9. Recolección de estadístico de los 11. Conclusiones informe de datos resultados investigación ¿Y qué hacemos con los sujetos? Ajuste en la recogida de datos 5 1. Población y muestra Población: Conjunto de todos los elementos que cumplen una o varias características. Colectivo de referencia. 1. Población y muestra Población: Conjunto de todos los elementos que comparten una o varias características. 1. Población y muestra TAMAÑO conocido y La POBLACIÓN puede Mayor no excesivo en el nº ser estudiada en su representatividad de elementos totalidad EJEMPLO Se quiere estudiar si la ocurrencia de la conducta de llanto de un bebé a la hora de acostarse por las noches varía en función de la presencia de la madre (presencia/ausencia); y ello en dos días en los que la madre va a estar fuera por motivos de trabajo y dos días en los que está presente. POBLACIÓN: Compuesta por un único sujeto, 2 valores en cada variable de la relación estudiada (presencia/ausencia) y en un contexto temporal de 4 días. 1. Población y muestra El primer aspecto que influye en el logro de ajuste o representatividad de la recogida de datos es el TAMAÑO de las poblaciones. Es el número de sus respectivas unidades EJEMPLOS El número de alumnos/as que interese estudiar constituirá el tamaño de esa población de personas. El número de días de un curso escolar en el que se quiera conocer el comportamiento de los alumnado determinará el tamaño de esa población de tiempo. La cantidad de espacios de la escuela donde dicho alumnado pasa la jornada escolar constituirá el tamaño de esa población de espacios. … 1. Población y muestra PERO… Identificar el TAMAÑO de una población no es siempre posible y/o puede ser dificultoso: 1. Tamaño puede ser desconocido. 2. Tamaño puede considerarse infinito. 3. Tamaño puede considerarse excesivamente grande. 1. Población y muestra EJEMPLOS 1. TAMAÑO DESCONOCIDO: Población de personas con el virus del VIH en países en los que no se lleve tal control. 2. TAMAÑO INFINITO: Población formada por el conjunto de todos los número positivos. 3. TAMAÑO EXCESIVAMNETE GRANDE: Población formada por todas las noches durante un año de la vida de un bebe o todas las noches de su infancia o conjunto muy numeroso de niños residentes en todas las localidades de un país. 1. Población y muestra Cuando el tamaño de las poblaciones es considerable o no conocido, éstas no pueden ser estudiadas en su totalidad. Existen dos alternativas: Si no se tienen recursos para estudiar un determinado comportamiento en la Renunciar a la población población española, podría estudiarse solo planteada y sustituirla por otra en los habitantes de una determinada de menor tamaño localidad de pequeño tamaño, o en estudiantes de una facultad universitaria. Si al margen de que se reduzcan Estudiar porciones o muestras que o no las poblaciones, estas faciliten su representatividad respecto a continúan implicando determinadas poblaciones delimitadas. poblaciones excesivamente amplias para las posibilidades de quien hace el estudio 1. Población y muestra Muestra: Subconjunto de los elementos de una población. Debe ser representativa de su correspondiente población. Colectivo con el que se trabaja. 1. Población y muestra Población: Conjunto de todos los elementos que comparten una o varias características. Muestra: Subconjunto o parte de los elementos que conforman la población y que son representativos de la misma. 1. Población y muestra POBLACIÓN Estadística inferencial INFERENCIA 30 12 12 20 20 ESTADÍSTICA 12 40 30 30 40 12 20 30 20 MUESTRA Estadística 12 40 descriptiva 12 12 1. Población y muestra MUESTRA: Subconjunto de los Estadística inferencial perros de la ciudad de Córdoba 16 POBLACIÓN: Todos los perros que viven en la ciudad de Córdoba 2. Muestreo Muestreo Procedimiento de extracción de la muestra procedente de una población. El tipo de muestreo dependerá del objetivo de la investigación. 3. Tipos de muestreo Dos grandes tipos de muestreo: MUESTREO PROBABILÍSTICO SÍ ¿DESEO GENERALIZAR? NO MUESTREO NO PROBABILÍSTICO 3. Tipos de muestreo MUESTREO SÍ PROBABILÍSTICO El muestreo probabilístico es una técnica de muestreo en ¿DESEO virtud de la cual las muestras son recogidas en un proceso GENERALIZAR? que brinda a todos los individuos de la población las mismas oportunidades de ser seleccionados. El investigador debe garantizar que cada individuo tenga las mismas oportunidades de ser seleccionado y esto se puede lograr si el investigador utiliza la aleatorización. Se conoce la probabilidad de que un individuo sea elegido para la muestra. Si la selección aleatoria se hace correctamente, la muestra será representativa de toda la población. 3. Tipos de muestreo MUESTREO NO NO PROBABILÍSTICO El muestreo no probabilístico es una técnica de muestreo donde las ¿DESEO muestras se recogen en un proceso que no brinda a todos los individuos de la población iguales oportunidades de ser GENERALIZAR? seleccionados. La mayoría de los investigadores tienen limitaciones (temporales, monetarias y de mano de obra), que hace casi imposible tomar una muestra aleatoria de toda la población. Se eligen muestras simplemente con el criterio de que pueda accederse a ellas, de que estén disponibles. En principio no se pueden extrapolar o generalizar los resultados a la población. No son representativas de ninguna población salvo de ellas mismas. Son muestreos que seguramente esconden sesgos. 3. Tipos de muestreo MUESTREO NO PROBABILÍSTICO Se hace así cuando, por ejemplo: - se estudia una muestra de personas que se ofrecen voluntariamente como sujetos de la recogida de datos a realizar. - se estudia a esos sujetos en una muestra de días en los que están disponibles. - se eligen los valores de la VI que resulten más asequibles. - si hacemos una encuesta telefónica por la mañana (las personas que no tienen teléfono o que están trabajando, no podrán formar parte de la muestra). 3. Tipos de muestreo 1) Muestreo aleatorio simple MUESTREO 2) Muestreo aleatorio sistemático SÍ PROBABILÍSTICO 3) M. aleatorio estratificado 4) M. aleatorio por conglomerados ¿DESEO (Dependiendo de la complejidad de la población) GENERALIZAR? 1. Muestreo intencional MUESTREO NO 2. Muestreo de conveniencia NO PROBABILÍSTICO 3. Muestreo accidental o por cuotas 4. Muestreo de bola de nieve (Dependiendo de la complejidad de la localización de la población) 3.1. Muestreo probabilístico MUESTREO ALEATORIO SIMPLE Se eligen individuos de la población de estudio, de manera que todos tienen la misma probabilidad de ser seleccionados, hasta alcanzar el tamaño muestral deseado. La selección de la muestra puede realizarse a través de cualquier mecanismo probabilístico en el que todos los elementos tengan las mismas opciones de salir. Normalmente, su aplicación tiene un coste bastante alto. EJEMPLO Se puede realizar partiendo de listas de individuos de la población (censos) y eligiendo individuos aleatoriamente con un ordenador. 3.1. Muestreo probabilístico Todos tienen la misma probabilidad de ser seleccionados. Un colegio tiene 120 alumnos de bachillerato, y se quiere extraer una muestra de 30 alumnos. Sería aleatorio si: 1. Se numeran los alumnos de 1 al 120 2. Posteriormente se sortean 30 números de entre los 120. 3.1. Muestreo probabilístico MUESTREO ALEATORIO SISTEMÁTICO Es un tipo de muestreo aleatorio simple en el que los elementos se seleccionan según un patrón que se inicia con una elección aleatoria. Es decir, se elige la primera unidad al azar y el resto mediante una regla intencional fijada de antemano. Se tiene una lista de los individuos de la población de estudio. Si queremos una muestra de un tamaño dado, elegimos individuos igualmente espaciados de la lista, donde el primero ha sido elegido al azar. ¡CUIDADO!: Si en la lista existen periodicidades, obtendremos una muestra sesgada. Un caso real: Se eligió una de cada cinco casas para un estudio de salud pública en una ciudad donde las casas se distribuyen en manzanas de cinco casas. Salieron con mucha frecuencia las de las esquinas, que reciben más sol, están mejor ventiladas,… 3.1. Muestreo probabilístico Los elementos se seleccionan según un patrón que se inicia con una elección aleatoria. EJEMPLO Un colegio tiene 120 alumnos de bachillerato, y se quiere extraer una muestra de 30 alumnos. Sería aleatorio sistemático si: 1. Se numeran los alumnos de 1 al 120; 2. Se calcula un intervalo constante entre cada individuo (población/muestra=120/30=4). 3. Sorteamos un número del 1 al 4 (supongamos que sale el 3). 4. El primer alumno seleccionado para la muestra sería el número 3; los siguientes alumnos se obtendrían sumando 4 hasta llegar a tener 30 alumnos. 5. Los alumnos seleccionados serían: 3, 7, 11, 15, 19, 23, etc. 3.1. Muestreo probabilístico MUESTREO ALEATORIO ESTRATIFICADO Se aplica cuando sabemos que hay ciertos factores (variables, subpoblaciones o estratos) que pueden influir en el estudio y queremos asegurarnos de tener cierta cantidad mínima de individuos de cada tipo: Listado Listado – Hábitat rural y urbano personas - personas - hábitat rural hábitat urbano – Hombres y mujeres, – Jóvenes, adultos y ancianos… -Juan Pérez -Rafael Morego -Ana López - Lucía Pérez Se realiza entonces un muestreo -Pepe Martínez -Antonio Sánchez -Encarna Sánchez -Pedro Moreno aleatorio simple de los individuos de -… -… cada uno de los estratos: Al extrapolar los resultados a la 100 personas 300 personas población hay que tener en cuenta el tamaño relativo del estrato con Total: 400 personas respecto al total de la población: 3.1. Muestreo probabilístico MUESTREO ALEATORIO ESTRATIFICADO Procedimiento: 1. El investigador divide a toda la población en diferentes subgrupos o estratos. 2. Selecciona aleatoriamente a los sujetos finales de los diferentes estratos en forma proporcional. EJEMPLO Imaginemos que queremos extraer una muestra de una población en la que sabemos que existe un 60% de hombres, y 40% de mujeres. Podríamos, para estar seguros que respetamos las proporciones, coger en nuestra muestra al 60% de hombres y el 40% de mujeres. Supongamos que estamos haciendo un estudio de la vista de la población de una ciudad. Suponemos que el 30% de la población lleva gafas y el 70% no. Mediante este método se escogería el 30% de la muestra de personas que lleven gafas y el 70% de los que no. 3.1. Muestreo probabilístico MUESTREO POR CONGLOMERADOS Se aplica cuando es difícil tener una lista de todos los individuos que forman parte de la población de estudio, pero sin embargo sabemos que se encuentran agrupados naturalmente en grupos. Se realiza: o 1. Eligiendo varios de esos grupos al azar o 2. Una vez elegidos algunos podemos: A) Estudiar a todos los individuos de los grupos seleccionados B) Seguir aplicando dentro de ellos más muestreos por grupos, por estratos, aleatorios simples,… Ejemplo: Para estudiar a los enfermos de cáncer en Andalucía, ¿tenemos un listado de enfermos de cáncer en Andalucía? No, entonces podemos elegir varios hospitales de Andalucía y seleccionarlos dentro de esos hospitales. Al extrapolar los resultados a la población hay que tener en cuenta el tamaño relativo de unos grupos con respecto a otros. 3.1. Muestreo probabilístico EJEMPLO Objetivo: Se desea estudiar el rendimiento académico de los estudiantes de secundaria de España. 1. Se divide a toda la población (población de España) en diferentes conglomerados (ciudades). 2. El investigador selecciona una serie de conglomerados en función de su investigación, a través de un muestreo aleatorio simple o sistemático. 3. De los conglomerados seleccionados (ciudades seleccionadas al azar) el investigador puede incluir a todos los estudiantes como sujetos o seleccionar un número de sujetos de cada conglomerado a través de un muestreo aleatorio simple o sistemático. Lo importante sobre esta técnica de muestreo es dar a todos los conglomerados iguales posibilidades de ser seleccionados. 3.1. Muestreo probabilístico El muestreo por conglomerados puede hacerse en una o más etapas, quedando conformada cada etapa por la delimitación de estratos, por tanto puede ser: A) Monoetápico Muestra por conglomerados en una etapa: Cuando el investigador incluye como muestra a todos los estudiantes de todos los conglomerados (previamente seleccionados aleatoriamente. B) Polietápico Muestra por conglomerados en dos etapas: Cuando el investigador sólo selecciona un número de estudiantes de cada conglomerado mediante muestreo aleatorio simple o sistemático. 3.1. Muestreo probabilístico EJEMPLO Imaginemos que queremos trabajar con los colegios públicos de Madrid. El problema es que no podemos coger todos los colegios, por lo que decidimos dividir Madrid en distritos (conglomerados), y elegir aleatoriamente algunos de ellos, centrándonos únicamente en los colegios de los distritos elegidos. Si optamos por un muestreo polietápico, dividiríamos esos distritos en manzanas, por ejemplo, y escogeríamos sólo algunas manzanas para centrarnos en los colegios de dichas manzanas. 3.1. Muestreo probabilístico Diferencias entre muestreo estratificado y por conglomerados La diferencia principal es la inclusión de conglomerados o estratos. Muestreo aleatorio estratificado: El investigador realiza el muestreo en todos los estratos de la población. Muestreo por conglomerados: El investigador sólo selecciona aleatoriamente un número de conglomerados de la colección de conglomerados de toda la población. Por lo tanto, sólo se realiza una muestra sobre una cantidad de conglomerados. Los demás quedan sin representación. 3.1. Muestreo probabilístico Muestreo aleatorio simple Muestreo sistemático Muestreo estratificado Muestreo por conglomerados 3.2. Muestreo no probabilístico 1. Muestreo aleatorio simple MUESTREO 2. Muestreo sistemático SÍ PROBABILÍSTICO 3. M. aleatorio estratificado 4. M. aleatorio por conglomerados ¿DESEO (Dependiendo de la complejidad de la población) GENERALIZAR? 1. Muestreo intencional MUESTREO NO NO 2. Muestreo de conveniencia PROBABILÍSTICO 3. Muestreo accidental o por cuotas 4. Muestreo de bola de nieve (Dependiendo de la complejidad de la localización de la población) 3.2. Muestreo no probabilístico MUESTREO INTENCIONAL Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. En este caso, los elementos son escogidos en base a criterios o juicios preestablecidos por el investigador. 3.2. Muestreo no probabilístico EJEMPLO En un estudio sobre el efecto del ghosting en la autoestima en población universitaria, previamente se establecen como criterios de selección de la muestra los siguientes: i. Ser estudiante universitario. ii. Tener más de 18 años. iii. Tener móvil. Criterios previos de selección 3.2. Muestreo no probabilístico MUESTREO DE CONVENIENCIA O INCIDENTAL Los sujetos de una investigación específica, son seleccionados para el estudio sólo porque son más fáciles de reclutar y el investigador no está considerando las características de inclusión de los sujetos que los hace representativos de toda la población. En todas las formas de investigación, sería ideal generalizar los resultados a la totalidad de la población, pero en la mayoría de los casos, la población es demasiado grande y resulta imposible incluir cada individuo. Esta es la razón por la cual la mayoría de los investigadores utilizan técnicas de muestreo, como el muestreo de conveniencia, la más común de todas las técnicas de muestreo. Muchos investigadores prefieren esta técnica de muestreo, ya que es rápida, barata, fácil y sobre todo, los sujetos están disponibles. 3.2. Muestreo no probabilístico EJEMPLOS Uno de los ejemplos más comunes de muestreo de conveniencia se realiza utilizando estudiantes voluntarios como sujetos de la investigación. Uso de sujetos que se han seleccionado de una clínica, una clase o una institución ya que para el investigador es de fácil el acceso a estas instituciones. Selección de cinco personas de una clase o incluso la selección de los cinco primeros nombres de la lista de pacientes de una lista en una institución medica. SIN criterios previos de selección 3.2. Muestreo no probabilístico MUESTREO ACCIDENTAL O POR CUOTAS Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas“, que consisten en un número de individuos que reúnen unas determinadas condiciones. Estas cuotas son como estratos, la diferencia es que una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión. 3.2. Muestreo no probabilístico EJEMPLO Si la base de la cuota es el curso en la universidad y el investigador necesita una representación igual, con un tamaño de muestra de 100, debe seleccionar 25 estudiantes de 1º año, 25 de 2° año, 25 de 3º año y 25 de 4º año. Las bases de la cuota generalmente son la edad, el género, la educación, la etnia, la religión y el nivel socioeconómico. Se diferencia del muestreo estratificado en que una vez determinada la cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de cada estrato (los elige intencionalmente, sin azar). 3.2. Muestreo no probabilístico MUESTREO DE BOLA DE NIEVE Suele utilizarse en estudios en donde los sujetos son difíciles de encontrar. Consiste en identificar sujetos que se incluirán en la muestra a partir de los propios entrevistados. Partiendo de una pequeña cantidad de individuos que cumplen los requisitos necesarios, servirán como localizadores de otros con características análogas (funciona en cadena). Luego, el investigador observa a los sujetos designados y sigue de la misma manera hasta obtener el número suficiente de sujetos. En la medida que sus datos se asemejen suficientemente entre sí, o saturen en el sentido de no aportar novedades, serán cada vez más amplias las poblaciones a las que pueda generalizarse lo encontrado en dichas replicaciones. 3.2. Muestreo no probabilístico EJEMPLO Se quiere analizar una enfermedad rara. El investigador puede elegir utilizar el muestreo de bola de nieve, ya que será difícil obtener sujetos. También es posible que los pacientes con la misma enfermedad tengan un grupo de apoyo, y si uno de sus miembros es tu primer sujeto, lo más probable es que allí encuentres más sujetos para el estudio. 3.2. Muestreo no probabilístico Muestreo intencional Muestreo de conveniencia Muestreo de bola de nieve Muestreo accidental o por cuotas 45