Estadística: Funciones y Métodos de Investigación Social PDF
Document Details
![MomentousLogarithm7491](https://quizgecko.com/images/avatars/avatar-10.webp)
Uploaded by MomentousLogarithm7491
Tags
Related
- Introducción a la Investigación - Tema 10 (PDF)
- Estadística Aplicada a la Educación PDF
- Estadística Aplicada a la Educación - PDF
- Examen De Métodos De Investigación (Español)
- Introduccion a la Criminologia - Notas de Clase T2 PDF
- Programación Lineal - Investigación Operativa I - 2º Grado Estadística PDF
Summary
Este documento explora las funciones de la estadística en la investigación social, centrándose en la transformación de datos crudos en medidas significativas. Se analizan distribuciones de frecuencia, la comparación de datos, y métodos gráficos para la visualización de patrones. El texto también aborda los métodos de muestreo aleatorio y no aleatorio, esenciales para la inferencia y la generalización de resultados.
Full Transcript
DISTRIBUCIONES DE FRECUENCIA DE DATOS NOMINALES El carpintero transforma la madera en muebles; el cocinero convierte los alimentos crudos en los platos más apetitosos que se sirven a la mesa. Mediante un proceso similar, el investigador social, auxiliado por “recetas” —llamadas fórmulas y técn...
DISTRIBUCIONES DE FRECUENCIA DE DATOS NOMINALES El carpintero transforma la madera en muebles; el cocinero convierte los alimentos crudos en los platos más apetitosos que se sirven a la mesa. Mediante un proceso similar, el investigador social, auxiliado por “recetas” —llamadas fórmulas y técni- cas- intenta transformar sus datos crudos* en un conjunto de medidas significativas y organizadas que puedan utilizarse para probar su hipótesis inicial. ¿Qué puede hacer el investigador social para organizar los números desordena- dos que recoge de sus entrevistados? ¿Cómo se las arregla para transformar esta masa de datos en un resumen fácil de entender? El primer paso sería construir una distribución de frecuencia en forma de tabla. TABLA 2.1 Estudiantes de ambos sexos concurrentes Sexo del estudiante Frecuencia (f) a una manifestación Masculino 80 política de izquierda Femenino 20 Total 100 * N. del E. crudo significa “no procesados”. 15 16 Descripción Examinemos la distribución de frecuencia en la Tabla 2.1. Nótese primero que la Tabla está encabezada por un número (2.1) y un titulo que da al lector una idea sobre la naturaleza de los datos presentados —“Estudiantes de ambos sexos concurrentes a una manifestación política de izquierda.” Este es el arreglo estándar; toda tabla debe estar claramente titulada y, cuando se presente dentro de una serie, también debe estar marcada con un número. Las distribuciones de frecuencia de los datos nominales consisten de dos columnas. Así, en la Tabla 2.1, la columna de la izquierda indica qué característica está siendo presentada (sexo del estudiante) y contiene las categorías de análisis (masculino y femenino). Una columna adyacente con el encabezado de “frecuencia” o “/ ” , indica el número de casos en cada categoría (80 y 20 respectivamente), así como el número total de casos (A=100). Una rápida mirada a la distribución de frecuencia, en dicha Tabla, revela claramente que a la manifestación de izquierda concurrieron muchos más hombres que mujeres —80 de los 100 estudiantes que asistieron eran hombres. COMPARACION DE LAS DISTRIBUCIONES Supongamos, sin embargo, que deseamos comparar los asistentes a la manifestación izquierdista con estudiantes similares en una manifestación derechista. La compara- ción entre distribuciones de frecuencia es un procedimiento que se utiliza a menudo para aclarar resultados y agregar información. La comparación particular que haga el investigador está determinada por la pregunta que busca contestar. Volviendo a nuestra hipotética manifestación política, podríamos preguntar: ¿es probable que participen más estudiantes del sexo masculino, que del sexo femenino en manifestaciones tanto izquierdistas como derechistas? Para encontrar una res- puesta podríamos comparar los 100 estudiantes asistentes a la manifestación izquier- dista con otros 100 estudiantes de la misma universidad asistentes a una manifesta- ción derechista. Imaginemos que obtenemos los datos mostrados en la Tabla 2.2. Como se muestra en la tabla, 30 de 100 estudiantes en la manifestación derechista, pero sólo 20 de 100 estudiantes en la manifestación izquierdista, eran mujeres. Esto nos da considerablemente más información que la sola distribución de frecuencia con que empezamos (ver Tabla 2.1). Así, podemos afirmar ahora que los. TABLA 2.2 Estudiantes de ambos sexos asistentes Asistencia a las manifestaciones a manifestaciones políticas De izquierda De derecha de derecha e izquierda Sexo del estudiante f f Masculino 80 70 Femenino 20 30 Total 100 100 Organización de datos 1 7 hombres, en esta universidad, participaron más que su contraparte femenina tanto en las manifestaciones izquierdistas como derechistas. Podemos afirmar también que, cuando las mujeres asistieron, tendieron a participar algo más en las manifestaciones derechistas que en las izquierdistas. Proporciones y porcentajes Cuando el investigador estudia distribuciones de igual tamaño total, los datos de frecuencia pueden utilizarse para hacer comparaciones entre los grupos. Así, el número de hombres asistentes a manifestaciones, de derecha y de izquierda, puede ser comparado directamente, ya que sabemos que había exactamente 100 estudiantes en cada manifestación. Sin embargo, generalmente no es posible estudiar distribuciones que tengan exactamente el mismo número de casos. Por ejemplo, ¿cómo podemos asegurarnos de que precisamente 100 estudiantes asistirán a ambas clases de manifes- taciones políticas? Para aclarar tales resultados, necesitamos un método para estan- darizar distribuciones de frecuencia por tamaño —una forma de comparar grupos a pesar de las diferencias en las frecuencias totales. Dos de los métodos más populares y útiles para estandarizar por tamaño y comparar distribuciones son la proporción y el porcentaje. La proporción compara el número de casos en una categoría dada con el tamaño total de la distribución. Podemos convertir cualquier frecuencia en una proporción P, dividiendo el número de casos en cualquier categoría dada / por el número total de casos en la distribución N. Por consiguiente, 10 hombres entre 40 estudiantes asistentes a una manifesta- ción pueden expresarse en la proporción P = — = 0,25 A pesar de la utilidad de la proporción, mucha gente prefiere indicar el tamaño relativo de una serie de número en términos del porcentaje, la frecuencia de ocurrencia de una categoría por cada 100 casos. Para calcular un porcentaje, simple- mente multiplicamos cualquier proporción dada por 100. Por fórmula, % = (100) ^ Por consiguiente, 10 hombres de entre los 40 asistentes a una manifestación pueden expresarse en la proporción P = 0,25 o como un porcentaje % = (100) — = 25 por ciento. 40 Así, el 25 por ciento de este grupo de 40 estudiantes son del sexo masculino. Para ilustrar la utilidad de los porcentajes al hacer comparaciones entre distribucio- 18 Descripción nes, examinemos la participación en manifestaciones políticas en una universidad predominantemente izquierdista. Supongamos, por ejemplo, que la manifestación izquierdista atrajo a un gran número de estudiantes, digamos 1 352 mientras que la manifestación derechista atrajo a un número mucho más pequeño, digamos 183. La Tabla 2.3 nos indica tanto las frecuencias como los porcentajes de asistencia a estas manifestaciones. Nótese la dificultad que existe para determinar rápidamente las diferencias de sexo en la asistencia sólo con los datos de frecuencia. En contraste, los porcentajes revelan claramente que las mujeres estuvieron igualmente representadas en las manifestaciones tanto de derecha como de izquierda. Específicamente, el 20% de los estudiantes asistentes a la manifestación izquierdista eran mujeres; el 20% de los estudiantes asistentes a la manifestación derechista eran mujeres. TABLA 2.3 Estudiantes de ambos sexos asistentes a manifestado íes políticas de derecha e izquierda Masculino 1082 (80) 146 (81 Femenino 270 (20) 37 (2( Total 1352 (100) 183 (1« Asistencia a las manifestaciones De izquierda De derecha Sexo del estudiante Razones * Un método menos común, utilizado para estandarizar por tamaño, es la razón, que compara directamente el número de casos que caen dentro de una categoría (por ejemplo, hombres) con el número de casos que caen dentro de otra categoría (por ejemplo, mujeres). Así, puede obtenerse una razón de la siguiente manera, donde /, es igual a la frecuencia en cualquier categoría y f 2 es igual a la frecuencia en cualquier otra categoría: razón =— f2 Si estuviéramos interesados en determinar la razón que haya de negros a blancos, podríamos comparar el número de negros entrevistados i f = 150) con el número de blancos entrevistados (f = 100) como Cancelando los factores comunes en el numerador y el denominador, es posible reducir la razón a su forma más simple, por ejemplo = (había 3 entrevistados negros por cada 2 blancos). * N. del I.. hite término también se conoce como “cociente”. El estudiante encontrará que en la práctica de campo se utilizan indistintamente. Organización de datos 19 El investigador podría aumentar la claridad de su razón dando la base (el denominador) de alguna forma comprensible. Por ejemplo, la razón de sexo a menudo empleada por los demógrafos, que buscan comparar el número de hombres y mujeres en cualquier población dada, se da generalmente como el número de hombres por cada 100 mujeres. Para ilustrar, si la razón de hombres a mujeres es — debería haber 150 hombres por cada 50 mujeres (o reduciendo, 3 hombres por cada mujer). Para obtener la terminología convencional de la razón de sexo, multiplicaríamos la razón por 100. Entonces. d - a í i nn\ f hombres (100) 150 onn Razón de sexo = (100) ------------= - » ------ = 300 / mujeres jo Resulta entonces que había 300 hombres en la población dada, por cada 100 mujeres. Las razones ya no se usan extensamente en la investigación social, quizás por los siguientes motivos: 1. Se necesita un gran número de razones para describir distribuciones que tienen muchas categorías de análisis. 2. Puede ser difícil comparar razones basadas en números muy grandes. 3. Algunos investigadores sociales prefieren evitar las fracciones o decimales que generan las razones. Tasas Otra clase de razón, que tiende a ser utilizada más ampliamente por los investi- gadores sociales, se conoce como tasa. Los sociólogos analizan a menudo a las poblaciones en cuanto a las tasas, de reproducción, muerte, crimen, divorcio, matri- monio, y otros. Sin embargo, mientras que la mayoría de las demás razones comparan el número de casos en cualquier subgrupo (categoría) con el número de casos en cualquier otro subgrupo (categoría), las tasas indican comparaciones entre el número de casos reales y el número de casos potenciales. Por ejemplo, para determinar la tasa de nacimientos para una determinada población, podríamos mostrar el número de nacimientos vivos reales, entre las mujeres en edad de concebir (aquellos miembros de la población que están expuestos al riesgo de concebir y que' por lo tanto representan casos potenciales). De modo similar, para encontrar la tasa de divorcios, podríamos comparar el número real de divorcios con el número de matrimonios que ocurren durante algún periodo de tiempo (por ejemplo 1 año). Las tasas suelen darse en términos de una base de 1 000 casos potenciales. Así, las tasas de nacimiento se dan como el número de nacimientos por cada 1 000 mujeres; las tasas de divorcio podrían expresarse en términos del número de divorcios por cada 1 000 matrimonios. De este modo, si ocurren 500 nacimientos entre 4 000 mujeres en edad de concebir, resulta que hubo 125 nacimientos por cada 1 000 mujeres en edad de concebir. 20 Descripción >-p ,.. , ,, nnn. / casos reales (1 000)500 , Tasa de nacimiento = (1 000)------------------------- = - ------- ------= 125 f casos potenciales 4 000 Hasta ahora hemos discutido tasas que podrían ser útiles para hacer compara- ciones entre diferentes poblaciones. Por ejemplo, podríamos buscar comparar tasas de nacimiento entre blancos y negros, entre mujeres de clase media y de clase baja, entre grupos religiosos o sociedades enteras, etc. Otra clase de tasa, la tasa de cambio, puede utilizarse para comparar la misma población en dos puntos a un tiempo. Al computar la tasa de cambio comparamos el cambio real entre el tiempo 1 y el tiempo 2, sirviendo como base el tamaño del periodo del tiempo 1. Así, una población que aumenta de 20 000 a 30 000 entre 1960 y 1970 experimentaría una tasa de cambio: (100) tiempo 2f — tiempo 1/ _ (100) 30 000 — 20 000 _ tiempo 1/ 20 000 En otras palabras, hubo un aumento de población del 50 por ciento en el periodo de 1960 a 1970. Nótese que una tasa de cambio puede ser negativa si indica un crecimiento en tamaño en cualquier periodo dado. Por ejemplo, si una población cambia de 15 000 a 5 000 en un periodo de tiempo, la tasa de cambio sería: (100)5 000 - 15 000 _ _ 67% 15 000 DISTRIBUCIONES DE FRECUENCIA SIMPLES DE DATOS ORDINALES Y POR INTERVALOS Dado que los datos nominales son colocados más bien dentro de una clasificación que dentro de una escala, las categorías de las distribuciones de nivel nominal no tienen que enlistarse en ningún orden en particular. Así, los datos sobre preferencias religiosas mostrados en la Tabla 2.4 se presentan de 3 formas diferentes, aunque igualmente aceptables. TABLA 2.4 Distribución de preferencias religiosas mostrada de 3 maneras Religión / Religión / Religión / Protestante 3U Católica 20 Judía 10 Católica 20 Judía 10 Protestante 30 Judía 10 Protestante 30 Católica 20 Total 60 Total 60 Total 60. GRAFICAS DE SECTORES Uno de los métodos gráficos más simples es el de la gráfica de sectores, una gráfica circular cuyos segmentos suman 100 por ciento. Las gráficas de sectores son particularmente útiles para visualizar las diferencias en frecuencia entre algunas categorías de nivel nominal. Para ilustrar. La Figura 3.1 presenta una población de 2 000 estudiantes universitarios de extracción urbana, suburbana o rural. Nótese que FIGURA 3.1 Población de 2 000 estudiantes universitarios de extracción urbana, suburbana y rural 33 34 Descripción el 70% de estos estudiantes proviene de áreas suburbanas, mientras que sólo el 18% proviene de áreas rurales. GRAFICAS DE BARRA La gráfica de barra nos proporciona una ilustración sencilla y rápida de datos que pueden dividirse en unas cuantas categorías. Por comparación, la gráfica de barra (o histograma) puede acomodar cualquier número de categorías a cualquier nivel de medición y, por lo tanto, se utiliza más ampliamente en la investigación social. Examinemos la gráfica de barra de la Figura 3.2 que ilustra una distribución de frecuencia de clases sociales. Esta gráfica de barra se construye siguiendo el orden estándar: una línea de base horizontal (o eje x) a lo largo de la cual se marcan los valores de los puntajes o categorías (en este ejemplo, las clases sociales) y una línea vertical (eje y ) a lo largo del costado de la figura que representa las frecuencias por cada puntaje o categoría. (En el caso de los datos agrupados, los puntos medios de los intervalos de clase se ordenan a lo largo de la línea base horizontal.) Nótese que las barras rectangulares dan las frecuencias para la amplitud de los valores de los porcentajes. Mientras más alta es la barra, mayor es la frecuencia de ocurrencia. En la Figura 3.2, las barras rectangulares de la gráfica se han unido para enfatizar los distintos grados de estatus social representados por diferencias de clases sociales. Además, las clases sociales se han trazado sobre la línea de base en orden ascendente de baja-baja a alta-alta. Este es el orden convencional para construir gráficas de barra de nivel ordinal y por intervalos. Sin embargo, al dibujar una gráfica de barra de puntajes nominales, las barras deben estar separadas, y no unidas, para evitar implicar continuidad entre las cate- gorías. Es más, las categorías de nivel nominal se pueden ordenar en cualquier forma a lo largo de la línea base horizontal. La Figura 3.3 ilustra tales características de las gráficas de barra de nivel nominal. FIGURA 3.2 Gráfica de barra de una d is t r ib u c ió n _____________ de clases sociales Clase social f Alta-alta 5 Alta-baja 14 Media alta 23 Media baja 45 Baja-alta 38 Baja-baja 25 Total 150 Clase social del entrevistado Gráficas 35 FIGURA 3. 3 Gráfica de barra de una distribución ___________ _ ocupacional O cupación f Artesanos 52 Mano de obra no calificada 65 Ejecutivo 29 Empleados 34 Total 180 Artesanos Mano de obra Ejecutivo Empleados no calificada Ocupación del entrevistado POLIGONOS DE FRECUENCIA Otro método gráfico que se emplea comúnmente es el polígono de frecuencia. Aunque el polígono de frecuencia puede acomodar una amplia variedad de catego- rías, tiende a enfatizar la continuidad, a lo largo de una escala, más que las diferencias y es, por tanto, particularmente útil para representar puntajes ordinales y por intervalos. Esto se debe a que las frecuencias se indican por medio de una serie de puntos colocados sobre los valores de los puntajes o los puntos medios de cada intervalo de clase. Los puntos adyacentes se conectan mediante una línea recta que cae sobre la línea base en uno y otro extremo. Como lo muestra la Figura 3.4, la altura de cada punto indica la frecuencia de ocurrencia. Para graficar frecuencias acumuladas (o porcentajes acumulados), puede cons- truirse un polígono de frecuencia acumulada. * Como se ve en la Figura 3.5, las frecuencias acumuladas se ordenan a lo largo de la línea vertical de la gráfica y están indicadas por la altura de los puntos, sobre la línea base horizontal. Sin embargo, a diferencia de un polígono de frecuencia FIGURA 3.4 Polígono de Intervalo frecuencia de una de clase f distribución de puntajes 136-145 11 de coeficiente intelectual 126-135 16 116-125 29 106-115 40 96-105 44 86-95 25 76-85 13 Total 178 Coeficiente intelectual del entrevistado (puntos medios) N. del R. También se suele llamar ojiva. 36 Descripción FIGURA 3.5 Polígono de 350 frecuencia acumulada para los datos de la tabla 2.8 300 250 200 Intervalo de clase f fa 751-800 6 336 ,3 150 701-750 25 330 6^1-700 601-650 31 30 305 274 100 - 551-600 35 244 501-550 55 209 50 451-500 61 154 401-450 48 93 351-400 33 45 1 » 1 1 1 1 1 1 1 1 1 301-350 12 12 u> O 4*. en C/i O en en Os O as en -J O en 00 o N = 336 p O O O O o p O p o ún I n C/i Cn l/i e n en en en én Limite superior del intervalo de clase común, la línea recta que conecta todos los puntos del polígono de frecuencia acumulada no tiene que tocar otra vez la línea base horizontal, ya que las frecuen- cias acumuladas que se están representando son el producto de sumas sucesivas. Ninguna frecuencia acumulada es menor (generalmente es mayor) que la anterior. También, a diferencia de un polígono de frecuencia común, los puntos de una gráfica acumulada se trazan sobre los límites superiores de los intervalos de clase en lugar de sobre los puntos medios. Esto se debe a que la frecuencia acumulada representa el número total de casos tanto dentro como por debajo de un intervalo de clase en particular. CONSTRUCCION DE GRAFICAS DE BARRA Y POLIGONOS DE FRECUENCIA Las siguientes reglas y procedimientos pueden aplicarse a la construcción de gráficas de barra y polígonos de frecuencia: 1. Como una cuestión de tradición, y para evitar confusiones, el investigador siempre ordena los porcentajes a lo largo de la línea base horizontal y las frecuencias (o el porcentaje de casos) a lo largo de la línea vertical. 2. Toda gráfica debe ir completamente rotulada. La línea base horizontal debe rotularse en relación con las características (por ej., edad del entrevista- do), la línea vertical debe rotularse de acuerdo con lo que se está represen- tando (ya sean “frecuencias” o “porcentajes”) y los valores numéricos de los puntos a lo largo de la escala. Además, la gráfica debe titularse indicando la naturaleza de los puntajes que se están ilustrando. 3. Al construir una gráfica, la longitud de la línea vertical debe ser como de un 75%de la longitud de la línea base horizontal. Este arreglo representa una manera relativamente estándar de dibujar gráficas y minimiza una fuente de confusión potencial. Gráficas 3 7 FIGURA 3.6 Algunas variaciones de la curtosis entre las distribuciones simétricas (a) Leptocúrticas (b) Platocúrticas (c) Mesocúrticas 4. El primer punto sobre la línea vertical —aquel punto en el cual se cruza con la línea horizontal— debe empezar siempre en cero, ya que cualquier otro orden podría dar una visión distorsionada de los puntajes. FORMA DE UNA DISTRIBUCION DE FRECUENCIA Los métodos gráficos pueden ayudarnos a visualizar la variedad de formas que toman las distribuciones de frecuencia. Algunas distribuciones son simétricas; al doblar la curva por el centro se crean dos mitades idénticas. Por lo tanto, tales distribuciones contienen el mismo número de valores extremos en ambas direcciones, alta y baja. Se dice que otras distribuciones están sesgadas y tienen más casos extremos en una dirección que en otra. Existen variaciones considerables entre las distribuciones simétricas. Por ejem- plo, pueden diferir marcadamente en términos de su “puntiagudez” (o curtosis). Algunas distribuciones simétricas, como en la Figura 3.6(a), son bastante picudas o altas (llamadas leptocúrticas)\ otras, como en la Figura 3.6(b), son bastante planas (llamadas platocúrticas) y, aun otras, no son ni muy picudas ni muy planas (llamadas mesocúrticas). Una clase de distribución simétrica mesocúrtica, como la que se muestra en la Figura 3.6(c), la curva normal, tiene especial importancia para la investigación social y se estudiará en detalle en el Capítulo 6. Existe una variedad de distribuciones asimétricas o sesgadas. Cuando existe sesgo, apilándose los puntajes en una sola dirección, la distribución tendrá una “cola” pronunciada. La posición de esta cola indica dónde están localizados los relativamente pocos puntajes extremos y determina la dirección del sesgo. La distribución (a) en la Figura 3.7 está negativamente sesgada (sesgada hacia la izquierda), ya que tiene una cola mucho más larga a la izquierda que a la derecha. Esta distribución indica que la mayoría de los entrevistados recibieron puntajes altos y que sólo unos cuantos obtuvieron puntajes bajos. Si se tratara de una distribución de calificaciones, en un examen final, podríamos afirmar que a la mayoría de los estu- diantes les fue bastante bien y a unos cuantos mal. Miremos ahora la distribución (b) cuya cola está situada a la derecha. Ya que la dirección de la cola indica el sesgo, podemos decir que la distribución está positivamente sesgada (sesgada hacia la derecha). ¡Las calificaciones del examen final de los estudiantes de nuestro hipotético grupo serían bastante bajas! 38 Descripción FIGURA 3.7 Tres distribuciones que representan la dirección del sesgo (a) (b) (c) Examinemos finalmente la distribución (c) que contiene dos colas idénticas. En tal caso, existe el mismo número de puntajes en ambas direcciones. La distribución no está en absoluto sesgada, sino que es perfectamente simétrica. Si se tratara de la distribución de calificaciones en nuestro examen final, tendríamos un gran número de estudiantes más o menos promedio y pocos alumnos que obtuvieran calificaciones altas o bajas. RESUMEN Las presentaciones gráficas de datos pueden usarse para aumentar la legibilidad de los hallazgos de la investigación. Nuestro análisis de las presentaciones gráficas incluyó gráficas de sectores, gráficas de barra y polígonos de frecuencia. Las gráfi- cas de sectores nos dan una simple ilustración de los puntajes que pueden divi- dirse en unas cuantas categorías. Las gráficas de barra se utilizan más ampliamente, ya que pueden acomodar cualquier número de categorías. Los polígonos de frecuen- cia acomodan también un amplio rango de categorías, pero son especialmente útiles para datos ordinales y por intervalos, ya que enfatizan una continuidad a lo largo de la escala. Las variaciones en la forma de las distribuciones pueden caracterizarse en términos de simetría o, si contienen más casos extremos en una dirección que en otra, en términos de sesgo positivo o negativo. METODOS DE MUESTREO Los métodos de muestreo del investigador social son generalmente más cuidadosos y sistemáticos que los de la vida diaria. Su preocupación central es asegurarse de que los miembros de su muestra sean lo suficientemente representativos ue la población entera como para permitir hacer generalizaciones precisas acerca de ella. Para hacer tales inferencias, el investigador escoge un método de muestreo apropiado para ver si todos y cada uno de los miembros de la muestra tienen igual oportunidad de ser integrados en ella. Si a cada miembro de la población se le da igual oportunidad de ser escogido para la muestra, se está utilizando un método aleatorio; de no ser así, el método empleado viene a ser no aleatorio. Muestras no aleatorias El método de muestreo no aleatorio más usual es el muestreo por accidente y es el que menos difiere con nuestros procedimientos diarios de muestreo, ya que se basa exclusivamente en lo que es conveniente para el investigador. Es decir, el investiga- dor simplemente incluye los casos más convenientes en su muestra y excluye de ella los casos inconvenientes. La mayoría de los estudiantes podrá recordar al menos algunas ocasiones en que el maestro que está realizando una investigación les ha pedido a todos los alumnos de su clase que participen en un experimento o llenen un cuestionario. La popularidad de esta forma de muestreo por accidente en psicología ha ocasionado que algunos detractores vean a la psicología como “la ciencia del estudiante universitario” de 2o semestre debido a que muchos de ellos son sujetos de investigación. Otro tipo no aleatorio es el muestreo por cuota. En este procedimiento de muestreo, las diversas características de una población, tales como edad, sexo, clase social o raza, son muestreadas de acuerdo con el porcentaje que ocupan dentro de la población. Supongamos, por ejemplo, que se nos pidiera sacar una muestra por cuota de los estudiantes que asisten a una universidad donde el 42% son mujeres y el 58% son hombres. Usando este método, se da a los entrevistadores una cuota de estu- diantes para localizar, de manera que sólo el 42% de la muestra consista de mu- jeres y el 58% de hombres. Se incluyen en la muestra los mismos porcentajes que están representados en la población. Si el tamaño total de la muestra es 200, entonces se seleccionan 84 estudiantes del sexo femenino y 116 del sexo masculino. Una tercera variedad de muestra no aleatoria se conoce como muestreo intencio- nal o de juicio. La idea básica que involucra este tipo de muestra es que la lógica, el sen- tido común o el sano juicio, pueden usarse para seleccionar una muestra que sea repre- sentativa de una población. Por ejemplo, para sacar una muestra de juicio de revistas Muestras y poblaciones 95 que reflejen los valores de la clase media, podríamos, a un nivel intuitivo, escoger Visión, Vanidades, ya que los artículos que aparecen en estas revistas parecen reflejar lo que la mayoría de los latinoamericanos de la clase media desean (por ejemplo, el nivel de vida del norteamericano, el éxito económico y similares). De manera seme- jante, los distritos estatales que tradicionalmente han votado por los candidatos gana- dores para cargos públicos podrían ser encuestados en un intento por predecir el resultado de determinadas elecciones. Muestras aleatorias Como se anotó anteriormente, el müestreo aleatorio le da a todos y cada uno de los miembros de la población igual oportunidad de ser seleccionados para la muestra. Esta característica del müestreo aleatorio indica que cada miembro de la población debe ser identificado antes de obtener dicha muestra aleatoria, requisito que gene- ralmente se llena obteniendo una lista que incluya a todos y cada uno de los miem- bros de la población. Si pensamos un poco veremos que la obtención de una lista completa de los miembros de la población no es siempre una tarea fácil, especialmente si se está estudiando una población grande y diversa. Para tomar un ejemplo relati- vamente fácil, ¿dónde podríamos conseguir una lista completa de los estudiantes inscritos en una universidad importante? Aquellos investigadores sociales que lo han intentado darán fe de su dificultad. Para una tarea más laboriosa, tratemos de encontrar una lista de todos los residentes de una gran ciudad. ¿Cómo podemos aseguramos de identificarlos a todos, incluso a aquellos residentes que no desean ser identificados? El tipo básico de muestra aleatoria, el müestreo aleatorio simple, puede obtener- se mediante un proceso no muy distinto de la técnica, actualmente conocida, de poner todos los nombres en diferentes pedazos de papel y luego sacar sólo algunos nombres de un sombrero con los ojos vendados. Este procedimiento le da, idealmen- te, igual oportunidad a todos los miembros de la población de ser seleccionados para la muestra ya que se incluye sólo un pedazo de papel por persona. Por varios motivos (incluyendo el hecho de que el investigador necesitaría un sombrero extre- madamente grande) el investigador social que intenta tomar una muestra aleatoria generalmente no saca nombres de sombreros. En cambio, usa una tabla de números aleatorios tal como la tabla H localizada al final del texto. Hemos reproducido a continuación una porción de una tabla de números aleatorios. Número de columna t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 i23157548590183725993 0262497088695230367440 304555043105374350890 411837441096221343148 1 516035032404362223500 96 De la descripción a la toma de decisiones Una tabla de números aleatorios se construye en forma tal que genere series de números sin ningún patrón u orden determinado. Como resultado, el proceso de usar una tabla de números aleatorios produce una muestra imparcial semejante a aquélla que se logra poniendo pedazos de papel en un sombrero y sacando nombres con los ojos vendados. Para obtener una muestra aleatoria simple por medio de una tabla de números aleatorios, el investigador social obtiene primero su lista de la población y le asigna un número de identificación único a todos y cada uno de sus miembros. Por ejemplo, si está realizando una investigación acerca de los 500 estudiantes inscritos en la materia de “Introducción a la Sociología” podría obtener una lista de ellos con el profesor y asignarle a cada alumno un número de 001 a 500. Habiendo preparado la lista, procede a sacar los miembros de su muestra de una tabla de números aleatorios. Digamos que el investigador busca sacar una muestra de 50 estudiantes para representar a los 500 miembros de la población del curso. Podría entrar a la tabla de números aleatorios en cualquier número (con los ojos cerrados, por ejemplo) y moverse en cualquier dirección tomando números apropiados hasta que haya seleccionado los 50 miembros para la muestra. Mirando una porción de la anterior tabla de números aleatorios, podríamos comenzar arbitrariamente en la intersección de la columna 1 y la fila 3 moviéndonos de izquierda a derecha para tomar cada número que aparezca entre 001 y 500. Los primeros números que aparecen en la columna 1 y la fila 3 son 0, 4 y 5. Por lo tanto, el alumno número 045 es el primer miembro de la población que se elegirá para la muestra. Continuan- do de izquierda a derecha vemos que 4, 3 y 1 aparecen enseguida, de manera que se selecciona el alumno número 431. Se continúa con este proceso hasta que se hayan tomado todos los 50 miembros para la muestra. Una nota para el estudiante: al usar la tabla de números aleatorios, pase siempre por alto los números que aparezcan por segunda vez o que estén más arriba de lo necesario. Todos los métodos de muestreo aleatorio son en realidad variaciones del procedimiento de muestreo simple que se acaba de ilustrar. Por ejemplo, con el muestreo sistemático no se requiere tabla de números aleatorios, ya que se hace el muestreo con una lista de miembros de la población7 por intervalos fijos. Entonces, empleando el muestreo sistemático se incluye cada enésimo miembro de una po- blación, en una muestra de ella. Para ilustrar, al sacar una muestra de la población de 10 000 amas de casa de cierta colonia podríamos organizar una lista de amas de casa, tomar cada décimo nombre de la lista y presentar una lista de 1 000 amas de casa. La ventaja del muestreo sistemático es que no se requiere una tabla de números aleatorios. Como resultado, este método es siempre menos demorado que el procedi- miento aleatorio simple, especialmente para sacar muestras de grandes poblaciones. Por el contrario, al tomar una muestra sistemática se presume que la posición en una lista de miembros de una población no influye en la aleatoriedad. Si esta presunción no se toma seriamente, el resultado puede ser que se seleccionen más de una vez Muestras y poblaciones 97 ciertos miembros de la población, mientras que otros definitivamente no se seleccio- nan. Esto puede suceder, por ejemplo, cuando se muestrean sistemáticamente casas de una lista en la que las casas de esquina (que son generalmente más caras que las demás casas de la cuadra) ocupan una posición fija o cuando se sacan muestras de los nombres de un directorio telefónico por intervalos fijos, de manera que los nombres asociados a ciertos lazos étnicos no se seleccionan. Otra variación del muestreo aleatorio simple es el muestreo estratificado; involu- cra la división de la población en subgrupos o estratos más homogéneos de los que se toman entonces muestras aleatorias simples. Supongamos, por ejemplo, que deseamos estudiar la aceptación de Varios métodos de control de la natalidad entre la población de cierta ciudad. Como las actitudes hacia el control de la natalidad varían según la religión y el estatus socioeconómico, podríamos estratificar nuestra pobla- ción sobre estas variables, formando así subgrupos más homogéneos con respecto a la aceptación del control de la natalidad. Más específicamente, digamos que podría- mos identificar a los miembros de la población, católicos, protestantes y judíos, así como a los de clase alta, media y baja. Nuestro procedimiento de estratificación podría dar los siguientes subgrupos o estratos: Protestantes de clase alta Protestantes de clase media Protestantes de clase baja Católicos de clase alta Católicos de clase media Católicos de clase baja Judíos de clase alta Judíos de clase media Judíos de clase baja Habiendo identificado nuestros estratos, procedemos a tomar una muestra aleatoria simple de cada subgrupo o estrato (por ejemplo, de protestantes de clase baja, de católicos de clase media, etc.) hasta que hayamos muestreado la población entera. O sea que, para los efectos del muestreo, cada estrato se trata como una población completa y se aplica el muestreo aleatorio simple. Específicamente se le da a cada miembro de un estrato un número de identificación, se pone en lista y se saca una muestra por medio de una tabla de números aleatorios. Como paso final del procedimiento, los miembros seleccionados de cada subgrupo o estrato se combinan para lograr tener una muestra de toda la población. La estratificación se basa en la idea de que un grupo homogéneo requiere una muestra más pequeña que un grupo heterogéneo. Por ejemplo, el estudio de los individuos que caminan por la esquina de una calle céntrica requiere, probablemente, una muestra más grande que el estudio de los individuos de clase media que viven en un suburbio. Se pueden encontrar generalmente caminando por el centro individuos