Capítulo 7 - Concepción o Elección del Diseño de Investigación (PDF)
Document Details
Uploaded by ProfusePeace7822
Roberto Hernández-Sampieri
Tags
Summary
Este texto presenta una guía sobre la Concepción o elección del diseño de la investigación cuantitativa, que detalla la importancia de la elección del diseño de investigación apropiado para responder preguntas de investigación y alcanzar objetivos en estudios cuantitativos. Explica los tipos de diseño, las diferencias entre las investigaciones experimental y no experimental, y el concepto de validez experimental.
Full Transcript
126 Capítulo 7 Concepción o elección del diseño de investigación capítulo Concepción o elección del diseño de investigación 7 La gestación del diseño de...
126 Capítulo 7 Concepción o elección del diseño de investigación capítulo Concepción o elección del diseño de investigación 7 La gestación del diseño del estudio representa el punto donde se co- nectan las etapas conceptuales del proceso de investigación como el planteamiento del problema, el desarrollo de la perspectiva teórica y las hipótesis con las fases subsecuentes cuyo carácter es más opera- tivo. Roberto Hernández-Sampieri Paso 6 Elección o desarrollo del diseño apropiado Proceso de investigación para la investigación cuantitativa Definir cuál es el tipo de diseño más apropiado para la inves- tigación: experimental, no experimental o múltiple. Precisar el diseño específico. Justificar el diseño elegido o desarrollado. Objetivos de aprendizaje Al terminar este capítulo, el alumno será capaz de: 1. Definir el significado del término “diseño de investigación”, así como las implicaciones de elegir uno u otro tipo de diseño. 2. Comprender que en un estudio pueden incluirse uno o varios diseños de investigación. 3. Conocer los tipos de diseños de la investigación cuantitativa y relacionarlos con los alcances del estudio. 4. Comprender las diferencias entre la investigación experimental y la investigación no experimental. 5. Analizar los diferentes diseños experimentales y sus grados de validez. 6. Analizar los distintos diseños no experimentales y las posibilidades de investigación que ofrece cada uno. 7. Realizar experimentos y estudios no experimentales. 8. Comprender cómo el factor tiempo altera la naturaleza de un estudio. Síntesis Con el propósito de responder a las preguntas de investigación planteadas y cumplir con los objetivos del estudio, el investigador debe seleccionar o desarrollar un diseño de investigación específico. Cuando se establecen y formulan hipótesis, los diseños sirven también para some- terlas a prueba. Los diseños cuantitativos pueden ser experimentales o no experimentales. En este capítulo se analizan los principales diseños experimentales y la manera de aplicar- los. Asimismo, se explica el concepto de validez experimental y cómo lograrla. www.e losopa nda.c om | ja me spoe trodrig ue z.c om Diseños experimentales 127 También se presenta una clasificación de diseños no experimentales, en la que se considera: a) el factor tiempo o número de veces en que se recolectan datos. b) el alcance del estudio. Del mismo modo, se deja en claro que ningún tipo de diseño es intrínsecamente mejor que otro, sino que son el planteamiento del problema, los alcances de la investigación y la formu- lación o no de hipótesis y su tipo los que determinan qué diseño es el más adecuado para un estudio en concreto; asimismo, es posible utilizar más de un diseño. Cuyo propósito es: Diseño de investigación Responder preguntas de investigación Cumplir objetivos del estudio Someter hipótesis a prueba Preexperimentos Tienen grado de control mínimo Tipos Cuasiexperimentos Implican grupos intactos Manipulación intencional de variables Experimentales (que (independientes) No experimentales Medición de variables (dependientes) administran estímulos Experimentos o tratamientos y/o “puros” Control y validez intervenciones) Dos o más grupos de comparación Participantes asignados al azar o emparejados Recolección de datos en un Característica único momento Exploratorios Transeccionales Tipos Descriptivos o transversales Correlacionales-causales Analizar cambios a través Propósito del tiempo Diseños de tendencia (trend) En una misma investigación Longitudinales Tipos Diseños de análisis evolutivo pueden incluirse dos o más o evolutivos de grupos (cohorte) diseños de distintos tipos (diseños Diseños panel múltiples) Nota: En el centro de recursos en línea de la obra (http://www.mhhe.com/he/hmi6e) S Material complementario S Capítulos, el lector encontrará y podrá descargar el capítulo 5 adicional, “Diseños: segunda parte”, que extiende los contenidos expuestos en este capítulo 7, en especial lo relativo a la técnica de asignación al azar y emparejamiento, así como a series cronológicas, diseños factoriales y cuasiexperimen- tos. Parte del material que estaba en ediciones anteriores en este capítulo o en el CD, se actualizó y transfirió a dicha página (no se eliminó). www.e losopa nda.c om | ja me spoe trodrig ue z.c om 128 Capítulo 7 Concepción o elección del diseño de investigación ¿Qué es un diseño de investigación? Una vez que se precisó el planteamiento del problema, se definió el alcance inicial de la investiga- ción y se formularon las hipótesis (o no se establecieron debido a la naturaleza del estudio), el investigador debe visualizar la manera práctica y concreta de contestar las preguntas de investiga- ción, además de cumplir con los objetivos fijados. Esto implica seleccionar o desarrollar uno o más diseños de investigación y aplicarlos al contexto particular de su estudio. El término diseño se refie- re al plan o estrategia concebida para obtener la información que se desea con el fin de responder al planteamiento del problema (Wentz, 2014; McLaren, 2014; Creswell, 2013a, Hernández-Sampieri et al., 2013 y Kalaian, 2008). En el enfoque cuantitativo, el investigador utiliza sus diseños para analizar la certeza de las hipó- tesis formuladas en un contexto en particular o para aportar evidencias respecto de los lineamientos de la investigación (si es que no se tienen hipótesis). Sugerimos a quien se inicia en la investigación comenzar con estudios que se basen en un solo diseño y luego desarrollar indagaciones que impliquen más de uno, si es que la situación de investi- gación así lo requiere. Utilizar más de un diseño eleva considerablemente los costos de la investiga- ción. Para visualizar más claramente el asunto del diseño, recordemos una interrogante coloquial del capítulo anterior: ¿le gustaré a Paola, por qué?; y la hipótesis: “yo le resulto atractivo a Paola porque me mira frecuentemente”. Diseño Plan o estrategia que se El diseño constituiría el plan o la estrategia para confirmar si es o no cierto que le desarrolla para obtener la información resulto atractivo a Paola (el plan incluiría procedimientos y actividades tendientes a que se requiere en una investigación y responder al planteamiento. encontrar la respuesta a la pregunta de investigación). En este caso podría ser: mañana buscaré a Paola después de la clase de estadística, me acercaré a ella, le diré que se ve muy guapa y la invitaré a tomar un café. Una vez que estemos en la cafetería la toma- ré de la mano, y si ella no la retira, la invitaré a cenar el siguiente fin de semana; y si acepta, en el lugar donde cenemos le comentaré que me parece bonita y le preguntaré si yo le resulto atractivo. Desde luego, puedo concebir otra estrategia, tal como invitarla a bailar o ir al cine en lugar de ir a cenar; o bien, si conozco a varias amigas de Paola y yo también soy amigo de ellas, preguntarles si le gusto. En la investigación disponemos de distintas clases de diseños y debemos elegir uno o varios o desarrollar nuestra propia estrategia (por ejemplo, invitarla al cine y darle un regalo para observar cuál es su reacción al recibirlo). Si el diseño está concebido cuidadosamente, el producto final de un estudio (sus resultados) tendrá mayores posibilidades de generar conocimiento. Y no es lo mismo seleccionar un tipo de dise- ño que otro: cada uno tiene sus características, como se verá más adelante. No es igual preguntarle directamente a Paola si le gusto o no, que preguntar a sus amigas; o que en lugar de interrogarla de palabra prefiera analizar su conducta no verbal (cómo me mira, qué reacciones tiene cuando la abrazo o me acerco a ella, etc.). Como tampoco será lo mismo si le pregunto delante de otras personas, que cuando estemos solos los dos. La precisión, amplitud y profundidad de la información obtenida varía en función del diseño. ¿Cómo debemos aplicar el diseño elegido o desarrollado? En el enfoque cuantitativo, la calidad de una investigación se relaciona con el grado en que aplique- mos el diseño tal como fue concebido (particularmente en el caso de los experimentos). Desde luego, en cualquier tipo de investigación el diseño se debe ajustar por contingencias o cambios en la situa- ción (por ejemplo, en un experimento en el que no funciona el estímulo experimental, tendría que modificarse o adecuarse). www.e losopa nda.c om | ja me spoe trodrig ue z.c om Diseños experimentales 129 En el proceso cuantitativo, ¿de qué tipos de diseños disponemos para investigar? En la literatura sobre la investigación cuantitativa es posible encontrar diferentes clasificaciones de los diseños. En esta obra adoptamos la siguiente clasificación:1 investigación experimental e investigación no experimental. A su vez, la primera puede dividirse de acuerdo con las clásicas categorías de Campbell y Stanley (1966) en: preexperimentos, experimentos “puros” y cuasiexperimentos.2 La investigación no experimental la subdividimos en diseños transversales y diseños longitudinales. En cada clasificación se comentarán los diseños específicos. De los diseños de la investigación cualitativa nos ocuparemos en la siguiente parte del libro. En términos generales, no consideramos que un tipo de investigación —y los consecuentes dise- ños— sea mejor que otro (experimental frente a no experimental). Como mencionan Kerlinger y Lee (2002), ambos son relevantes y necesarios, ya que tienen un valor propio. Cada uno posee sus carac- terísticas, y la decisión sobre qué clase de investigación y diseño específico hemos de seleccionar o desarrollar depende del planteamiento del problema, el alcance del estudio y las hipótesis formuladas. Diseños experimentales El término experimento tiene al menos dos acepciones, una general y otra particular. La general se refiere a “elegir o realizar una acción” y después observar las consecuencias (Babbie, 2014). Este uso del término es bastante coloquial; así, hablamos de “experimentar” cuando mezclamos sustancias químicas y vemos la reacción provocada, o cuando nos cambiamos de peinado y observamos el efecto que causa en nuestras amistades. La esencia de esta concepción de experimento es que requiere la manipulación intencional de una acción para analizar sus posibles resultados. Una acepción particular de experimento, más armónica con un sentido científico del término, se refiere a un estudio en el que se manipulan intencionalmente una o más variables independientes (supuestas causas antecedentes), para analizar las consecuencias que la manipulación tiene sobre una o más variables dependientes (supuestos efectos consecuentes), dentro de una situación de control para el investigador (Fleiss, 2013; O’Brien, 2009 y Green, 2003). Esta definición quizá parezca com- pleja; sin embargo, conforme se analicen sus componentes se aclarará su sentido. Figura 7.1 Esquema de experimento y variables. Causa Efecto (variable independiente) (variable dependiente) X Y Creswell (2013a) y Reichardt (2004) llaman a los experimentos estudios de intervención, por- que un investigador genera una situación para tratar de explicar cómo afecta a quienes participan en ella en comparación con quienes no lo hacen. Es posible experimentar con seres humanos, seres vivos y ciertos objetos, pero siempre observando los principios éticos que se comentarán más adelante y en el capítulo 2 adicional del centro de recursos en línea. Los experimentos manipulan tratamientos, estímulos, influencias o intervenciones (denomina- das variables independientes) para observar sus efectos sobre otras variables (las dependientes) en una situación de control. Veámoslo gráficamente en la figura 7.2. 1 La tipología ha sido aceptada en ediciones anteriores por su sencillez. Otros autores han coincidido con ella como McBurney y White (2013); Creswell (2013a); Rovai, Baker y Ponton (2012), así como Kalaian (2008). Los estudios de caso se consideran como una clase diferente y de ellos se comenta más adelante, sobre todo en el capítulo 4 adicional que el lector puede descargar del centro de recursos en línea. 2 Esta clasificación sigue siendo la más citada en textos contemporáneos; por ejemplo, Creswell (2013a), Fleiss (2013), Babbie (2014 y 2012), Silva (2008), Reichardt (2004) y Shadish, Cook y Campbell (2001). www.e losopa nda.c om | ja me spoe trodrig ue z.c om 130 Capítulo 7 Concepción o elección del diseño de investigación Figura 7.2 Ejemplos de la relación de variables independiente y dependiente. Tratamiento, estímulo, influencia, intervención, Variable dependiente Influye en... etc. Variable independiente (supuesto efecto) (supuesta causa) Un tratamiento Reduce Depresión psicológico Un tratamiento médico Mejora Artritis Un nuevo motor Incrementa Velocidad revolucionario Es decir, los diseños experimentales se utilizan cuando el investigador pretende establecer el posi- ble efecto de una causa que se manipula. Pero, para establecer influencias (por ejemplo, decir que el tratamiento psicológico reduce la depresión), se deben cubrir varios requisitos que a continuación se verán. Desde luego, hay ocasiones en que no podemos o no debemos experimentar. Por ejemplo, no podemos evaluar las consecuencias del impacto deliberadamente provocado por un meteorito sobre un planeta, pues el estímulo es imposible de manipular (¿quién puede enviar un meteorito a cierta velocidad para que choque con un planeta?). Tampoco podemos experimentar con hechos pasados, así como no debemos realizar cierto tipo de experimentos por cuestiones éticas (por ejemplo, experi- mentar en seres humanos con un nuevo virus para conocer su evolución). Ciertamente se han efec- tuado experimentos con armas bacteriológicas y bombas atómicas, castigos físicos a prisioneros, deformaciones al cuerpo humano, etc.; sin embargo, son situaciones que no deben permitirse en ninguna circunstancia. ¿Cuál es el primer requisito de un experimento? El primer requisito es la manipulación intencional de una o más variables independientes. La variable independiente es la que se considera como supuesta causa en una relación entre variables, es la condición antecedente, y al efecto provocado por dicha causa se le denomina variable dependiente (consecuente). Cabe destacar que el investigador puede incluir en su estudio dos o más variables independientes o dependientes. Cuando en realidad existe una relación causal entre una variable independiente y una dependiente, al variar intencionalmente la primera, la segunda también variará; por ejemplo, si la motivación es causa de la productividad, al variar la motivación deberá variar la pro- ductividad. Experimento Situación de control en la Se lleva a cabo un experimento para analizar si una o más variables independien- cual se manipulan, de manera tes afectan a una o más variables dependientes y por qué (Kirk, 2012 y Montgomery, intencional, una o más variables independientes (causas) para analizar 2012). Por ahora, simplifiquemos el problema de estudio a una variable independien- las consecuencias de tal manipulación te y una dependiente. En un experimento, la variable independiente resulta de interés sobre una o más variables dependien- para el investigador, ya que hipotéticamente será una de las causas que producen el tes (efectos). efecto supuesto. Para obtener evidencia de esta supuesta relación causal, el investiga- dor manipula la variable independiente y observa si la dependiente varía o no. Aquí, manipular es sinónimo de hacer variar o asignar distintos valores a la variable indepen- diente. www.e losopa nda.c om | ja me spoe trodrig ue z.c om Diseños experimentales 131 Ejemplo Si un investigador deseara analizar el posible efecto de los contenidos televisivos antisociales en la conducta agresiva de determinados niños, podría hacer que a un grupo se le proyectara un programa de televisión con contenido antisocial y que otro viera un programa con contenido de promoción social,3y posteriormente obser- var cuál de los dos grupos muestra una conducta más agresiva. La hipótesis de investigación nos hubiera señalado lo siguiente: “La exposición de los niños a contenidos antisociales tenderá a provocar un aumento en su conducta agresiva”. De este modo, si descubre que el grupo que observó el programa antisocial muestra mayor conducta agresiva respecto del grupo que vio el programa de promoción social, y que no hay otra posible causa que hubiera afectado a los grupos de manera desigual, comprobaría su hipótesis. El investigador manipula o hace fluctuar la variable independiente para observar el efecto en la depen- diente, y lo realiza asignándole dos valores: presencia de contenidos antisociales por televisión (programa antisocial) y ausencia de contenidos antisociales por televisión (programa de promoción social). El experimen- tador establece la variación a propósito (no es casual): tiene el control directo sobre la manipulación y crea las condiciones para proveer la variación deseada. En un experimento, para que una variable se considere independiente debe cumplir tres requisitos: 1. Que anteceda a la dependiente 2. Que varíe o sea manipulada 3. Que esta variación pueda controlarse La variable dependiente se mide La variable dependiente no se manipula, sino que se mide para ver el efecto que la manipulación de la variable independiente tiene en ella. Esto se esquematiza de la siguiente manera: Manipulación de la Medición del efecto sobre la variable independiente variable dependiente XA Y XB Se utiliza la letra “X” para simbolizar una variable independiente o tratamiento experimental. Las letras o subíndices “A, B…” indican distintos niveles de variación de la independiente y la letra “Y” se utiliza para representar una variable dependiente. Grados de manipulación de la variable independiente La manipulación o variación de una variable independiente puede realizarse en dos o más grados. El nivel mínimo de manipulación es de presencia o ausencia de la variable independiente. Cada nivel o grado de manipulación comprende un grupo en el experimento. Presencia o ausencia Este nivel o grado implica que un grupo se expone a la presencia de la variable independiente y el otro no. Posteriormente, los dos grupos se comparan para saber si el grupo expuesto a la variable indepen- diente difiere del grupo que no fue expuesto. Por ejemplo, a un grupo de personas con artritis se le administra el tratamiento Grupo experimental Es el que recibe médico y al otro grupo no se le administra. Al primero se le conoce como grupo el tratamiento o estímulo experi- experimental, y al otro, en el que está ausente la variable independiente, se le deno- mental. 3 En este momento no se explica el método para asignar a los niños a los dos grupos; lo veremos en el apartado de control y validez interna. Lo que importa ahora es que se comprenda el significado de la manipulación de la variable independiente. www.e losopa nda.c om | ja me spoe trodrig ue z.c om 132 Capítulo 7 Concepción o elección del diseño de investigación mina grupo de control; pero en realidad ambos grupos participan en el experimento. Grupo de control Se le conoce también como grupo testigo. Después se observa si hubo o no alguna diferencia entre los grupos en lo que respecta a la cura de la enfermedad (artritis). A la presencia de la variable independiente se le llama “tratamiento experimen- tal”, “intervención experimental” o “estímulo experimental”. Es decir, el grupo expe- rimental recibe el tratamiento o estímulo experimental o, lo que es lo mismo, se le expone a la variable independiente; el grupo de control no recibe el tratamiento o estímulo experimental. Ahora bien, el hecho de que uno de los grupos no se exponga al tratamiento experimental no significa que su parti- cipación en el experimento sea pasiva. Por el contrario, implica que realiza las mismas actividades que el grupo experimental, excepto someterse al estímulo. En el ejemplo de la violencia televisada, si el grupo experimental va a ver un programa de televisión con contenido violento, el grupo de control podría ver el mismo programa, pero sin las escenas violentas (otra versión del programa). Si se tratara de experimentar con un medicamento, el grupo experimental consumiría el medicamento, mientras que el grupo de control consumiría un placebo (por ejemplo, una supuesta píldora que en realidad es un caramelo bajo en azúcares). En general, en un experimento puede afirmarse lo siguiente: si en ambos grupos todo fue “igual” menos la exposición a la variable independiente, es muy razonable pensar que las diferencias entre los grupos se deban a la presencia o ausencia de tal variable. Más de dos grados En otras ocasiones, es posible hacer variar o manipular la variable independiente en cantidades o grados. Supongamos una vez más que queremos analizar el posible efecto del contenido antisocial por televisión sobre la conducta agresiva de ciertos niños. Podría hacerse que un grupo fuera expuesto a un programa de televisión sumamente violento (con presencia de violencia física y verbal); un segun- do grupo se expusiera a un programa medianamente violento (sólo con violencia verbal), y un tercer grupo se expusiera a un programa sin violencia. En este ejemplo, se tendrían tres niveles o cantidades de la variable independiente, lo cual se representa de la siguiente manera: X1 (programa sumamente violento) X2 (programa medianamente violento) — (programa sin violencia, prosocial) Manipular la variable independiente en varios niveles tiene la ventaja de que no sólo se puede determinar si la presencia de la variable independiente o tratamiento experimental tiene un efecto, sino también si distintos niveles de la variable independiente producen diferentes efectos. Es decir, si la magnitud del efecto (Y ) depende de la intensidad del estímulo (X1, X2, X3, etcétera). Ahora bien, ¿cuántos niveles de variación deben ser incluidos? No hay una respuesta exacta, pues depende del planteamiento del problema y los recursos disponibles. Del mismo modo, los estudios previos y la experiencia del investigador pueden arrojar luces al respecto, ya que cada nivel implica un grupo experimental más. Por ejemplo, en el caso del tratamiento médico, dos niveles de variación pueden ser suficientes para probar su efecto, pero si tenemos que evaluar los efectos de distintas dosis de un medicamento, tendremos tantos grupos como dosis y, además, el grupo testigo o de control. Modalidades de manipulación en lugar de grados Hay otra forma de manipular una variable independiente que consiste en exponer a los grupos expe- rimentales a diferentes modalidades de la variable, pero sin que esto implique cantidad. Por ejemplo, experimentar con tipos de semillas, medios para comunicar un mensaje a todos los ejecutivos de la empresa (correo electrónico o teléfono celular o memorando escrito), vacunas, estilos de argumenta- ciones de abogados en juicios y procedimientos de construcción o materiales. En ocasiones, la manipulación de la variable independiente conlleva una combinación de canti- dades y modalidades de ésta. Los diseñadores de automóviles experimentan con el peso del chasís www.e losopa nda.c om | ja me spoe trodrig ue z.c om ¿Cómo se define la manera de manipular las variables independientes? 133 (cantidad) y el material con que está construido (modalidad) para conocer su efecto en la aceleración del vehículo. Finalmente, es necesario insistir en que cada nivel o modalidad implica, al menos, un grupo. Si hay tres niveles (grados) o modalidades, se tendrán tres grupos como mínimo. ¿Cómo se define la manera de manipular las variables independientes? Al manipular una variable independiente es necesario especificar qué se va a entender por esa variable en el experimento (definición operacional experimental). Es decir, trasladar el concepto teórico a un estímulo experimental. Por ejemplo, si la variable independiente a manipular es la exposición a la violencia televisada (en adultos), el investigador debe pensar cómo va a transformar ese concepto en una serie de operaciones experimentales. En este caso podría ser: la violencia televisada será operacio- nalizada (transportada a la realidad) mediante la exposición a un programa donde haya riñas y golpes, insultos, agresiones, uso de armas de fuego, crímenes e intentos de crímenes, ataques sexuales, intimi- dación, persecuciones, etc. Entonces se selecciona un programa en el que se muestren tales conductas (por ejemplo, CSI: Investigación de la escena del crimen, Hannibal o La ley y el orden: Unidad de vícti- mas especiales, o una telenovela o serie producida en Iberoamérica en que se presenten dichos compor- tamientos). Así, el concepto abstracto se transforma en un referente real. Veamos cómo un concepto teórico (grado de información sobre la deficiencia mental) en la prác- tica se tradujo a dos niveles de manipulación experimental. Ejemplo Naves y Poplawsky (1984) diseñaron un experimento para poner a prueba la siguiente hipótesis: “a mayor grado de información sobre la deficiencia mental que posea el sujeto común se mostrará menor evitación en la interacción con el deficiente mental”.4 La variable independiente fue “el grado de información sobre la deficiencia mental” (o mejor dicho, capacidad mental distinta); y la dependiente, “la conducta de evitación en interacciones con personas cuyas capacidades mentales son diferentes”. La primera se manipuló mediante dos niveles de información: 1) infor- mación cultural, y 2) información sociopsicológica acerca de esta capacidad mental. Por tanto, hubo dos gru- pos: uno con información cultural y otro con información sociopsicológica. El primer grupo no recibió ninguna información sobre la deficiencia mental o la capacidad mental distinta, ya que se supuso “que todo individuo, por pertenecer a cierta cultura, maneja este tipo de información, y está conformada por nociones generales y normalmente estereotipadas sobre la deficiencia mental; de ello se desprende que si un sujeto basa sus pre- dicciones sobre la conducta del otro en el nivel cultural, obtendrá mínima precisión y pocas probabilidades de controlar el evento comunicativo” (Naves y Poplawsky, 1984, p. 119). El segundo grupo acudió a un centro de entrenamiento para personas cuyas capacidades mentales son diferentes, quienes les proporcionaron información sociopsicológica (algunas contaron sus problemas en el trabajo y sus relaciones con superiores y compañeros, también se trataron temas como el amor y la amistad). Este grupo pudo observar lo que es la “capacidad mental distinta”, cómo se trata clínicamente y los efectos en la vida cotidiana de quien la posee, además de recibir información sociopsicológica al respecto. Después, todos los participantes fueron expuestos a una interacción sorpresiva con un supuesto individuo con capacidad mental distinta (que en realidad era un actor entrenado para comportarse como “deficiente mental” y con conocimientos sobre la materia).5 La situación experimental estuvo bajo riguroso control y se filmaron las interacciones para medir el grado de evitación hacia el sujeto con capacidad mental diferente, a través de cuatro dimensiones: a) distancia física, b) movimientos corporales que denotaban tensión, c) con- ducta visual y d) conducta verbal. Se comprobó la hipótesis, pues el grupo con información cultural mostró una mayor conducta de evitación que el grupo con información sociopsicológica. 4 En el ejemplo a veces se emplean los términos “deficiencia mental” y “deficiente mental”, debido a que son los que utilizaron Esther Naves y Silvia Poplawsky. Tal vez serían más adecuados los términos: “capacidad mental diferente” y “persona con tal capacidad”. De antemano, una disculpa si alguien se siente ofendido por estos vocablos. 5 Las actuaciones fueron ensayadas una y otra vez ante un grupo de cuatro expertos sobre la deficiencia mental, hasta que el grupo validó unánimemente el desempeño del actor. www.e losopa nda.c om | ja me spoe trodrig ue z.c om 134 Capítulo 7 Concepción o elección del diseño de investigación Dificultades para definir cómo se manipularán las variables independientes En ocasiones no resulta tan difícil trasladar el concepto teórico (variable independiente) a operaciones prácticas de manipulación (tratamientos o estímulos experimentales). Manipular la paga (cantidades de dinero otorgadas), la realimentación, el reforzamiento y la administración de un medicamento no es demasiado complejo. Sin embargo, a veces resulta verdaderamente complicado representar el con- cepto teórico en la realidad, sobre todo con variables internas, variables que pueden tener diversos significados o variables que sean difíciles de alterar. La socialización, la cohesión, la conformidad, el poder, la motivación individual y la agresión son conceptos que requieren un enorme esfuerzo por parte del investigador para operacionalizarse. Guía para sortear dificultades Para definir cómo se va a manipular una variable es necesario: 1. Consultar experimentos antecedentes para ver si fue exitosa la forma de manipular la variable inde- pendiente. Al respecto, resulta imprescindible analizar si la manipulación de esos estudios puede aplicarse al contexto específico del nuestro, o cómo se extrapolaría a nuestra situación experimental. 2. Evaluar la manipulación antes de que se conduzca el experimento. Hay varias preguntas que el experimentador debe hacerse para evaluar su manipulación antes de llevarla a cabo: ¿las operacio- nes experimentales representan la variable conceptual que se tiene en mente? ¿Los diferentes niveles de variación de la variable independiente harán que los sujetos se comporten de diferente forma? (Christensen, 2006). ¿Qué otras maneras hay para manipular la variable? ¿Ésta es la mejor? Si el concepto teórico no se traslada adecuadamente a la realidad, lo que sucederá es que al final realizaremos otro experimento muy distinto del que pretendemos. Si deseáramos averi- guar el efecto de la ansiedad sobre la memorización de conceptos y si nuestra manipulación es errónea (en lugar de provocar ansiedad, generase inconformidad), los resultados del experimento tal vez nos ayudarían a explicar la relación entre la inconformidad y la memorización de concep- tos; pero de ninguna manera servirán para analizar el efecto de la ansiedad en la memorización. También, si la presencia de la variable independiente en los grupos experimentales es “débil”, probablemente no se encontrarán efectos, pero no porque no pueda haberlos. Si pretendemos manipular la violencia televisada y nuestro programa no es en realidad violento (incluye uno que otro insulto y algunas sugerencias de violencia física) y no encontramos un efecto, no podemos afirmar o negar que haya un efecto, porque la manipulación fue débil. 3. Incluir verificaciones para la manipulación. Cuando se experimenta con personas hay varias for- mas de verificar si realmente funcionó la manipulación. La primera consiste en entrevistar a los participantes. Supongamos que, por medio de la manipulación, pretendemos generar que un grupo esté muy motivado hacia una tarea, y el otro no. Después del experimento entrevistaría- mos a los individuos para ver si el grupo que debía estar muy motivado en realidad lo estuvo y si el grupo que no debía estar motivado no lo estuvo. Una segunda forma es incluir mediciones relativas a la manipulación durante el experimento. Por ejemplo, aplicar una escala de motivación a ambos grupos cuando supuestamente unos deben estar motivados y otros no. ¿Cuál es el segundo requisito de un experimento? El segundo requisito consiste en medir el efecto que la variable independiente tiene en la variable dependiente. Esto es igualmente importante y como en la variable dependiente se observa el efecto, la medición debe ser adecuada, válida y confiable. Imaginemos que conducimos un experimento para evaluar el efecto de un nuevo tipo de ense- ñanza en la comprensión de conceptos políticos por parte de ciertos niños, y en lugar de medir com- prensión medimos la memorización; por más correcta que resulte la manipulación de la variable www.e losopa nda.c om | ja me spoe trodrig ue z.c om ¿Cuál es el tercer requisito de un experimento? 135 independiente, el experimento resultaría un fracaso porque la medición de la dependiente no es váli- da. O pensemos que tenemos dos grupos a comparar con mediciones distintas, y si encontramos diferencias ya no sabremos si se debieron a la manipulación de la independiente o a que se aplicaron exámenes de comprensión diferentes. Los requisitos para medir correctamente una variable se comen- tan en el capítulo 9: “Recolección de los datos cuantitativos”. ¿Cuántas variables independientes y dependientes deben incluirse en un experimento? No hay reglas para ello; depende de cómo se haya planteado el problema de investigación y las limi- taciones existentes. Si un investigador se encuentra interesado en contrastar efectos de apelaciones emotivas frente a racionales en comerciales televisivos sobre la predisposición de compra de un pro- ducto, y sólo le interesa este problema, tendrá una variable independiente única y una sola depen- diente. Pero si también pretende analizar el efecto de utilizar comerciales en blanco y negro frente a los que son a color, agregaría esta variable independiente y la manipularía. Tendría dos variables inde- pendientes (apelación y colorido) y una dependiente (predisposición de compra), son cuatro grupos (sin contar el de control): a) Grupo expuesto a apelación emotiva y comercial en blanco y negro b) Grupo expuesto a apelación emotiva y comercial en color c) Grupo expuesto a apelación racional y comercial en blanco y negro d) Grupo expuesto a apelación racional y comercial en color O también se podría agregar una tercera variable independiente: duración de los comerciales, y una cuarta: realidad de los modelos del comercial (personas vivas en contraposición a dibujos anima- dos) y así sucesivamente. Claro está que conforme se aumenta el número de variables independientes se incrementan las manipulaciones que deben hacerse y el número de grupos requerido. Entonces, entraría en juego el segundo factor: limitantes, tal vez no pueda reclutar las suficientes personas para varios grupos o contar con el presupuesto para producir tal variedad de comerciales. Por otro lado, en cada caso podría optar por medir más de una variable dependiente y evaluar múltiples efectos de las independientes (en distintas variables). Por ejemplo, además de la predisposi- ción de compra, medir la recordación del comercial y la evaluación estética de éste. Resulta obvio que al aumentar las variables dependientes, no tienen que incrementarse los grupos, porque estas variables no se manipulan. Lo que aumenta es el tamaño de la medición (cuestionarios con más preguntas, mayor número de observaciones, entrevistas más largas, etc.) porque hay más variables que medir. ¿Cuál es el tercer requisito de un experimento? El tercer requisito es el control o la validez interna de la situación experimental. El Validez interna Grado de confianza término “control” tiene diversas connotaciones. Sin embargo, su acepción más común que se tiene de que los resultados del experimento se interpreten es que, si en el experimento se observa que una o más variables independientes hacen adecuadamente y sean válidos (se variar a las dependientes, la variación de estas últimas se debe a la manipulación de las logra cuando hay control). primeras y no a otros factores o causas; y si se observa que una o más independientes no tienen un efecto sobre las dependientes, se puede estar seguro de ello. Es decir, saber qué está ocurriendo realmente con la relación entre las variables independientes y las depen- dientes. Esto podría ilustrarse de la siguiente manera: Figura 7.3 Experimentos con control e intento de experimento. Experimento (con control) Intento de experimento (sin control) X Y X Y Causalidad o no causalidad Sin conocimiento de causa X Y www.e losopa nda.c om | ja me spoe trodrig ue z.c om 136 Capítulo 7 Concepción o elección del diseño de investigación Cuando hay control es posible determinar la relación causal; cuando no se logra el control, no se puede conocer dicha relación (no se sabe qué está detrás del “cuadro en color”, quizá sería, por ejem- plo: “X S Y”, o “X ƒ Y”; es decir, que hay correlación o que no existe ninguna relación). Así, lograr control en un experimento implica contener la influencia de otras variables extrañas en las variables dependientes, para conocer en realidad si las variables independientes que nos interesan tienen o no efecto en las dependientes. Lo anterior se esquematizaría así: Figura 7.4 Experimentos con control de las variables extrañas. X (Extrañas y fuentes de X Control invalidación) X su nc os lue lam ia inf ntro Co Vemos su efecto X (de interés, variable X (variable independiente manipulada) dependiente medida) o la ausencia de éste Es decir, “purificamos” la relación de X (independiente) con Y (dependiente) de otras posibles fuentes que afecten a Y, y que “contaminen” el experimento. Aislamos las relaciones que nos intere- san. Si deseamos analizar el efecto que pueda tener un comercial sobre la predisposición de compra hacia el producto que se anuncia, sabemos que quizás existan otras razones o causas por las cuales las personas piensen en comprar el producto (calidad, precio, cualidades, prestigio de la marca, etc.). Entonces, en el experimento se deberá controlar la posible influencia de estas otras causas, para que sepamos si el comercial tiene o no algún efecto. De lo contrario, si se observa que la predisposición de compra es elevada y no hay control, no sabremos si el comercial es la causa o lo son los demás factores. Lo mismo ocurre con un método de enseñanza, cuando por medio de un experimento se desea evaluar su influencia en el aprendizaje. Si no hay control, no sabremos si un buen aprendizaje se debió al método, a que los participantes eran sumamente inteligentes, a que tenían conocimientos acepta- bles de los contenidos o a cualquier otro motivo. Si no hay aprendizaje no sabremos si se debe a que los sujetos estaban muy desmotivados con los contenidos, a que eran poco inteligentes o a cualquier otra causa. Es decir, buscamos descartar otras posibles explicaciones para evaluar si la nuestra es o no la correcta (variables independientes de interés, estímulos o tratamientos experimentales que tienen el efecto que nos interesa comprobar). Tales explicaciones rivales son las fuentes de invalidación interna (que pueden invalidar el experimento). Fuentes de invalidación interna Existen diversos factores que tal vez nos confundan y sean motivo de que ya no sepamos si la presen- cia de una variable independiente o un tratamiento experimental surte o no un verdadero efecto. Se trata de explicaciones rivales de la explicación de que las variables independientes afectan a las depen- dientes (The SAGE Glossary of the Social and Behavioral Sciences, 2009a). Campbell y Stanley (1966) definieron estas explicaciones rivales, las cuales han sido ampliadas por Campbell (1975), Christensen (2006), Hernández-Sampieri et al. (2013) y Babbie (2014). Se les conoce como fuentes de invalidación interna porque precisamente atentan contra la validez interna de un experimento. Ésta se refiere a cuánta confianza tenemos en que sea posible interpretar los resultados del experimen- to y éstos sean válidos. La validez interna se relaciona con la calidad del experimento y se logra cuando hay control, cuando los grupos difieren entre sí solamente en la exposición a la variable indepen- diente (ausencia o presencia o en grados o modalidades), cuando las mediciones de la variable www.e losopa nda.c om | ja me spoe trodrig ue z.c om ¿Cómo se logran el control y la validez interna? 137 dependiente son confiables y válidas y cuando el análisis es el adecuado para el tipo de datos que estamos manejando. El control en un experimento se alcanza eliminando esas explicaciones rivales o fuentes de invalidación interna. En la tabla 7.1 se mencionan algunas fuentes. Una explicación más amplia, así como ejemplos y otras fuentes posibles, las podrá encontrar el lector en el capítulo 5 adi- cional, “Diseños: segunda parte”, que se puede descargar del centro de recursos en línea. Tabla 7.1 Principales fuentes de invalidación interna6 Fuente o amenaza a la Descripción de la amenaza En respuesta, el investigador debe: validez interna Historia Eventos o acontecimientos externos que ocurran Asegurarse de que los participantes de durante el experimento e influyan solamente a los grupos experimentales y de control algunos de los participantes. experimenten los mismos eventos. Maduración Los participantes pueden cambiar o madurar Seleccionar participantes para los durante el experimento y esto afectar los grupos que maduren o cambien de resultados. manera similar durante el experimento. Inestabilidad del Poca o nula confiabilidad del instrumento. Elaborar un instrumento estable y instrumento de medición confiable. Inestabilidad del Las condiciones del ambiente o entorno del Lograr que las condiciones ambientales ambiente experimental experimento no sean iguales para todos los sean las mismas para todos los grupos. grupos participantes. Administración de Que la aplicación de una prueba o instrumento Tener pruebas equivalentes y pruebas de medición antes del experimento influya las confiables, pero que no sean las respuestas de los individuos cuando se vuelve a mismas y que los grupos que se administrar la prueba después del experimento comparen sean equiparables. (por ejemplo, recuerden sus respuestas). Instrumentación Que las pruebas o instrumentos aplicados a los Administrar la misma prueba o distintos grupos que participan en el experimento instrumento a todos los individuos o no sean equivalentes. grupos participantes. Regresión Seleccionar participantes que tengan puntuacio- Elegir participantes que no tengan nes extremas en la variable medida (casos puntuaciones extremas o pasen por un extremos) y que no se mida su valoración real. momento anormal. Selección Que los grupos del experimento no sean Lograr que los grupos sean equivalen- equivalentes. tes. Mortalidad Que los participantes abandonen el experimento. Reclutar suficientes participantes para todos los grupos. Difusión de tratamientos Que los participantes de distintos grupos se Durante el experimento mantener a los comuniquen entre sí y esto afecte los resultados. grupos tan separados entre sí como sea posible. Compensación Que los participantes del grupo de control Proveer de beneficios a todos los perciban que no reciben nada y eso los grupos participantes. desmoralice y afecte los resultados. Conducta del experimen- Que el comportamiento del experimentador Actuar igual con todos los grupos y ser tador afecte los resultados. “objetivo”. ¿Cómo se logran el control y la validez interna? El control en un experimento logra la validez interna y se alcanza mediante: 1. Varios grupos de comparación (dos como mínimo). 2. Equivalencia de los grupos en todo, excepto en la manipulación de la o las variables indepen- dientes. 6 Basada en Hernández-Sampieri et al. (2013) y Mertens (2010), pero principalmente en Creswell (2013a). www.e losopa nda.c om | ja me spoe trodrig ue z.c om 138 Capítulo 7 Concepción o elección del diseño de investigación Es necesario que en un experimento se tengan, por lo menos, dos grupos que comparar. Si nada más se tiene un grupo no es posible saber con certeza si influyeron las fuentes de invalidación interna u otras causas ajenas a la variable independiente manipulada. Imaginemos un experimento en el cual queremos ver si un fertilizante hace crecer más rápidamente cierta especie de plantas. Debemos tener plantas a las cuales se les administre el fertilizante (grupo experimental) y plantas a las que no (grupo de control). Siempre debe existir un punto de comparación. Pero no basta con dos o más grupos, sino que éstos deben ser similares en todo, menos en la manipulación de la o las variables independientes. El control implica que todo permanece constante, salvo tal manipulación o intervención. Si entre los grupos que conforman el experimento todo es similar o equivalente, excepto la manipulación de la variable independiente, las diferencias entre los grupos pueden atribuirse a ella y no a otros factores. Veamos un ejemplo educativo, supongamos que deseamos analizar si una serie de programas edu- cativos de televisión para niños genera mayor aprendizaje de los preceptos básicos de investigación en comparación con un método educativo tradicional. Un grupo recibe la enseñanza a través de los pro- gramas, otro grupo la obtiene por medio de instrucción oral tradicional y un tercer grupo dedica ese mismo tiempo a actividades recreativas en el salón de clases. Asumamos que los niños que aprendieron mediante los programas obtienen las mejores calificaciones en una prueba de conocimientos relativa a los contenidos enseñados, los que recibieron el método tradicional obtienen calificaciones mucho más bajas, y los que jugaron obtienen puntuaciones de cero o cercanas a este valor. En forma aparente, los programas son un mejor vehículo de enseñanza que la instrucción oral. Pero si los grupos no son equi- valentes, entonces no podemos confiar en que las diferencias se deban en realidad a la manipulación de la variable independiente (programas televisivos-instrucción oral) y no a otros factores, o a la com- binación de ambos. Por ejemplo, a los niños más inteligentes, estudiosos y con mayor empeño se les asignó al grupo que fue instruido por televisión, o la instructora del método tradicional no tenía buen desempeño, o los niños expuestos a este último método recibieron mayor carga de trabajo y tenían exámenes los días en que se desarrolló el experimento, etc. ¿Cuánto se debió al método y cuánto a otros factores? Para el investigador la respuesta a esta pregunta se convierte en un enigma: no hay control. Los grupos deben ser equivalentes al inicio del experimento y durante su desarrollo, salvo en lo que respecta a la variable independiente. Asimismo, los instrumentos de medición deben ser iguales y aplicados de la misma manera. ¿Cómo se logra la equivalencia inicial?: asignación al azar Existe un método muy difundido para alcanzar esta equivalencia: la asignación aleatoria o al azar de los participantes a los grupos del experimento.7 La asignación al azar asegura probabilísticamente que dos o más grupos son equivalentes entre sí (Kirk, 2012; Knapp, 2008; Pettygrove, 2007 y Peng, 2003). Es una técnica de control que tiene como propósito dar al investigador la seguridad de que variables extrañas, conocidas o desconocidas, no afectarán de manera sistemática los resultados del estudio (Christensen, 2006). La asignación al azar puede llevarse a cabo empleando trozos de papel. Se escribe el nombre de cada caso o participante (o alguna clave que lo identifique) en los papeles, los cuales se juntan en algún recipiente, se revuelven y se van sacando —sin observarlos— para formar los grupos. Por ejem- plo, si se tienen dos grupos, las personas con turno non en su papel irían al primer grupo; y las per- sonas con par, al segundo grupo. O bien, si hubiera 80 personas, los primeros 40 papelitos que se saquen irían a un grupo y los restantes 40 al otro. Asignación aleatoria o al azar Es una También, cuando se tienen dos grupos, la asignación aleatoria puede llevarse a técnica de control muy difundida para cabo utilizando una moneda no cargada. Se lista a los participantes y se designa qué asegurar la equivalencia inicial al ser asignados aleatoriamente los casos o lado de la moneda va a significar el grupo uno y qué lado el grupo dos. Con cada sujetos a los grupos del experimento. sujeto se lanza la moneda y, dependiendo del resultado, se asigna a uno u otro grupo. 7 El que los participantes sean asignados al azar significa que no hay un motivo sistemático por el cual fueron elegidos para ser parte de un grupo o de otro, sino que la casualidad es lo que define a qué grupo son asignados. www.e losopa nda.c om | ja me spoe trodrig ue z.c om ¿Cómo se logran el control y la validez interna? 139 Tal procedimiento está limitado sólo a dos grupos, porque las monedas tienen dos caras, aunque podrían utilizarse dados o cubos, por ejemplo. Una tercera forma de asignar los participantes o casos a los grupos es mediante el programa STATS®, seleccionando el subprograma “Generador de números aleatorios”. Previamente se numeran todos los casos (supongamos que se tiene un experimento con dos grupos y 100 personas en total, ® consecuentemente se numera a los sujetos del 1 al 100). El programa pregunta en la ventana: ¿Cuántos números aleatorios desea generar? Entonces se escribe el número relativo al total de los participantes en el experimento, así, debe teclearse “100”. Inmediatamente se elige la opción: Valores mínimo y máximo para los números aleatorios, en el mínimo se introduce un “1” (siempre será “1”) y en el máximo un “100” (o el número total de participantes). Posteriormente se elige como medio de sorteo “random” (al azar) y se hace clic en Calcular y el programa generará 100 números de manera aleatoria, así, se pueden asignar los primeros 50 a un grupo y los últimos 50 al otro grupo, o bien, el primer número al grupo 1, el segundo al grupo 2, el tercero al grupo 1 y así sucesivamente (dado que la gene- ración de los números es completamente aleatoria, en ocasiones el programa duplica o triplica algunos números, entonces debemos saltarnos uno o dos de los números repetidos y seguir asignando sujetos —números— a los grupos; y al terminar se vuelve a repetir el proceso y continuamos asignando a los grupos los números que no habían “salido” antes, hasta situar a los 100 sujetos en los dos grupos (si fueran cuatro grupos, los primeros 25 se asignan al grupo 1, los segundos 25 al grupo 2, los siguientes 25 al grupo 3 y los últimos 25 al grupo 4). La asignación al azar produce control, pues las variables que deben ser controladas (variables extrañas y fuentes de invalidación interna) se distribuyen aproximadamente de la misma manera en los grupos del experimento. Y puesto que la distribución es bastante similar en todos los grupos, la influen- cia de otras variables que no sean la o las independientes se mantiene constante, porque aquellas no pueden ejercer ninguna influencia diferencial en las variables dependientes (Christensen, 2006). La asignación aleatoria funciona mejor cuanto mayor sea el número de casos con que se cuenta para el experimento, es decir, cuanto mayor sea el tamaño de los grupos. Se recomienda que para cada grupo se tengan por lo menos 15 personas.8 Otra técnica para lograr la equivalencia inicial: el emparejamiento Un método alternativo para intentar hacer inicialmente equivalentes a los grupos es el emparejamiento o la técnica de apareo (en inglés, matching). El proceso consiste en Técnica de apareo o emparejamiento igualar a los grupos en relación con alguna variable específica que puede influir de Consiste en igualar a los grupos en relación con alguna variable modo decisivo en la o las variables dependientes. específica, que puede influir de modo El primer paso es elegir la variable concreta de acuerdo con algún criterio teórico. decisivo en la variable dependiente. Es obvio que esta variable debe estar muy relacionada con las variables dependientes. Si se pretendiera analizar el efecto que causa utilizar distintos tipos de materiales suple- mentarios de instrucción sobre el desempeño en la lectura, el apareamiento podría basarse en la variable “agudeza visual”. Experimentos sobre métodos de enseñanza emparejarían a los grupos en “conocimien- tos previos”, “aprovechamiento anterior en una asignatura relacionada con los contenidos a enseñar” o “inteligencia”. Experimentos sobre las actitudes hacia productos o hábitos de compra pueden utilizar la variable “ingreso” para empatar los grupos. En cada caso en particular, debe pensarse cuál es la variable cuya influencia sobre los resultados del experimento resulta más necesario controlar y buscar el aparea- miento de los grupos en esa variable. El segundo paso consiste en obtener una medición de la variable elegida para emparejar a los grupos. Esta medición puede existir o efectuarse antes del experimento. Vamos a suponer que nuestro experimento fuera sobre métodos de enseñanza, el emparejamiento llegaría a hacerse sobre la base de la inteligencia. Si fueran adolescentes, se obtendrían registros de inteligencia de ellos o se les aplicaría una prueba de inteligencia. 8 Este criterio se basa en los requisitos de algunos análisis estadísticos. www.e losopa nda.c om | ja me spoe trodrig ue z.c om 140 Capítulo 7 Concepción o elección del diseño de investigación El tercer paso es ordenar a los participantes en la variable sobre la cual se va a Asignación al azar Es el mejor método para hacer equivalentes los grupos efectuar el emparejamiento (de las puntuaciones más altas a las más bajas). (más preciso y confiable). El empareja- El cuarto paso consiste en formar parejas, tercias, cuartetos, etc., de participantes miento no la sustituye por completo. según la variable de apareamiento (son individuos que tienen la misma puntuación en la variable o una calificación similar) e ir asignando a cada integrante de cada pareja, tercia o similar a los grupos del experimento, buscando un equilibrio entre éstos. También podría intentarse empatar a los grupos en dos variables, pero ambas deben estar sumamente relacionadas, porque de lo contrario resultaría muy difícil el emparejamiento. Conforme más varia- bles se utilizan para aparear grupos, el procedimiento es más complejo. En el capítulo 5 adicional: “Diseños: segunda parte” se ejemplifica el procedimiento. Una tipología sobre los diseños experimentales A continuación se presentan los diseños experimentales más citados en la literatura. Para ello nos basaremos, como ya se señaló, en la tipología de Campbell y Stanley (1966), quienes dividen los diseños experimentales en tres clases: a) preexperimentos, b) experimentos “puros”9 y c) cuasiexperi- mentos. Se utilizará la simbología que generalmente se emplea en los textos sobre experimentos. Simbología de los diseños experimentales Aquí se describe una simbología básica para diseños experimentales: R Asignación al azar o aleatoria. Cuando aparece quiere decir que los sujetos han sido asignados a un grupo de manera aleatoria (proviene del inglés randomization, “aleatorización”). G Grupo de sujetos o casos (G1, grupo 1; G2, grupo 2; etcétera). X Tratamiento, estímulo o condición experimental (presencia de algún nivel o modalidad de la variable independiente). 0 Una medición de los sujetos de un grupo (prueba, cuestionario, observación, etc.). Si apare- ce antes del estímulo o tratamiento, se trata de una preprueba (previa al tratamiento). Si aparece después del estímulo se trata de una posprueba (posterior al tratamiento). — Ausencia de estímulo (nivel “cero” en la variable independiente). Indica que se trata de un grupo de control o testigo. Asimismo, cabe mencionar que la secuencia horizontal indica tiempos distintos (de izquierda a derecha) y cuando en dos grupos aparecen dos símbolos alineados verticalmente, esto indica que tie- nen lugar en el mismo momento del experimento. Veamos de manera gráfica estas dos observaciones. Figura 7.5 Simbología de los diseños experimentales. RG1 0 X 0 Primero, se asigna a los Segundo, se aplica una Tercero, se administra Cuarto, se aplica una participantes al azar al grupo 1 medición previa el estímulo medición posterior RG1 X 0 RG2 — 0 Ambos símbolos están alineados verticalmente, lo cual significa que tienen lugar en el mismo momento. 9 Preferimos utilizar el término “experimentos puros” más que “verdaderos” (que es el término original y así se ha traducido en diversas obras), porque crea confusión entre los estudiantes. www.e losopa nda.c om | ja me spoe trodrig ue z.c om Experimentos “puros” 141 Preexperimentos Los preexperimentos se llaman así porque su grado de control es mínimo. 1. Estudio de caso con una sola medición Este diseño podría diagramarse de la siguiente manera: G X 0 Consiste en administrar un estímulo o tratamiento a un grupo y después aplicar una medición de una o más variables para observar cuál es el nivel del grupo en éstas. Este diseño no cumple con los requisitos de un experimento “puro”. No hay manipulación de la variable independiente (niveles) o grupos de contraste (ni siquiera el mínimo de presencia o ausen- cia). Tampoco hay una referencia previa de cuál era el nivel que tenía el grupo en la o las variables dependientes antes del estímulo. No es posible establecer causalidad con certeza ni se controlan las fuentes de invalidación interna. 2. Diseño de preprueba/posprueba con un solo grupo Este segundo diseño se diagramaría así: G 01 X 02 A un grupo se le aplica una prueba previa al estímulo o tratamiento experimental, después se le administra el tratamiento y finalmente se le aplica una prueba posterior al estímulo. Este diseño ofrece una ventaja sobre el anterior: existe un punto de referencia inicial para ver qué nivel tenía el grupo en las variables dependientes antes del estímulo; es decir, hay un seguimiento del grupo. Sin embargo, el diseño no resulta conveniente para fines de establecer causalidad: no hay manipulación ni grupo de comparación y es posible que actúen varias fuentes de invalidación interna, por ejemplo, la historia. Entre 01 y 02 podrían ocurrir otros acontecimientos capaces de generar cam- bios, además del tratamiento experimental, y cuanto más largo sea el lapso entre ambas mediciones, mayor será también la posibilidad de que actúen tales fuentes. Por otro lado, se corre el riesgo de elegir a un grupo atípico o que en el momento del experimen- to no se encuentre en su estado normal. En ocasiones este diseño se utiliza con un solo individuo (estudio de caso experimental). Sobre tal diseño se abunda en el capítulo cuatro adicional: “Estudios de caso”, el cual se puede descargar del centro de recursos en línea. Los dos diseños preexperimentales no son adecuados para el establecimiento de relaciones causa- les porque se muestran vulnerables en cuanto a la posibilidad de control y validez interna. Algunos autores consideran que deben usarse sólo como ensayos de otros experimentos con mayor control. En ciertas ocasiones los diseños preexperimentales sirven como estudios explo- Diseño preexperimental Diseño de ratorios, pero sus resultados deben observarse con precaución. un solo grupo cuyo grado de control es mínimo. Generalmente es útil como un primer acercamiento al Experimentos “puros” problema de investigación en la realidad. Los experimentos “puros” son aquellos que reúnen los dos requisitos para lograr el control y la validez interna: 1. Grupos de comparación (manipulación de la variable independiente). 2. Equivalencia de los grupos. Estos diseños llegan a incluir una o más variables independientes y una o más dependientes. Asimismo, pueden utilizar prepruebas y pospruebas para analizar la evolución de los grupos antes y después del tratamiento experimental. Desde luego, no todos los diseños experimentales “puros” utili- zan preprueba; aunque la posprueba sí es necesaria para determinar los efectos de las condiciones expe- rimentales (Wiersma y Jurs, 2008). A continuación se muestran varios diseños experimentales “puros”. www.e losopa nda.c om | ja me spoe trodrig ue z.c om 142 Capítulo 7 Concepción o elección del diseño de investigación 1. Diseño con posprueba únicamente y grupo de control Este diseño incluye dos grupos: uno recibe el tratamiento experimental y el otro no (grupo de con- trol). Es decir, la manipulación de la variable independiente alcanza sólo dos niveles: presencia y ausencia. Los sujetos se asignan a los grupos de manera aleatoria. Cuando concluye la manipulación, a ambos grupos se les administra una medición sobre la variable dependiente en estudio. El diseño se diagrama de la siguiente manera: RG1 X 01 RG2 — 02 En este diseño, la única diferencia entre los grupos debe ser la presencia-ausencia de la variable independiente. Inicialmente son equivalentes y para asegurarse de que durante el experimento conti- núen siéndolo (salvo por la presencia o ausencia de dicha manipulación) el experimentador debe obser- var que no ocurra algo que sólo afecte a un grupo. La hora en que se efectúa el experimento debe ser la misma para ambos grupos (o ir mezclando un sujeto de un grupo con un sujeto del otro grupo, cuan- do la participación es individual), al igual que las condiciones ambientales y demás factores mencio- nados al hablar sobre la equivalencia de los grupos. Wiersma y Jurs (2008) comentan que, de preferencia, la posprueba debe administrarse inmedia- tamente después de que concluya el experimento, en especial si la variable dependiente tiende a cambiar con el paso del tiempo. La posprueba se aplica de manera simultánea a ambos grupos. La comparación entre las pospruebas de ambos grupos (01 y 02) nos indica si hubo o no efecto de la manipulación. Si ambas difieren significativamente10 (01 ≠ 02), esto nos indica que el tratamiento experimental tuvo un efecto a considerar. Por tanto, se acepta la hipótesis de diferencia de grupos. Si no hay diferencias (01 = 02), ello indica que no hubo un efecto significativo del tratamiento experi- mental (X ). En este caso se acepta la hipótesis nula. En ocasiones se espera que 01 sea mayor que 02. Por ejemplo, si el tratamiento experimental es un método educativo que facilita la autonomía por parte del alumno, y si el investigador formula la hipótesis de que incrementa el aprendizaje, cabe esperar que el nivel de aprendizaje del grupo experi- mental, expuesto a la autonomía, sea mayor que el nivel de aprendizaje del grupo de control, no expuesto a la autonomía: 01 > 02. En otras ocasiones se espera que 01 sea menor que 02. Por ejemplo, si el tratamiento experimental es un programa de televisión que supuestamente disminuye el prejuicio, el nivel de éste en el grupo experimental deberá ser menor que el del grupo de control: 01 < 02. Pero si 01 y 02 son iguales, quiere decir que tal programa no reduce el prejuicio. Asimismo, puede suceder que los resultados vayan en contra de la hipótesis. Por ejemplo, en el caso del prejuicio, si 02 es menor que 01 (el nivel del prejui- cio es menor en el grupo que no recibió el tratamiento experimental, esto es, el que no vio el progra- ma televisivo). Las pruebas estadísticas que suelen utilizarse en este diseño y en otros que a continuación se revisarán, se incluyen en el capítulo 10, “Análisis de los datos cuantitativos”, y en el capítulo 8 adicio- nal del centro de recursos en línea del libro, “Análisis estadístico: segunda parte”. El diseño con posprueba únicamente y grupo de control puede extenderse para incluir más de dos grupos (tener varios niveles o modalidades de manipulación de la variable independiente). Los efectos de los tratamientos experimentales se investigan comparando las pospruebas de los grupos. 10 Los estudiantes preguntan frecuentemente qué es una diferencia significativa. Si el promedio en la posprueba de un grupo en alguna variable es de 10 (por ejemplo), y en el otro es de 12, ¿esta diferencia es o no significativa? ¿Puede o no decirse que el tratamiento tuvo un efecto sobre la variable dependiente? A este respecto, hay pruebas o métodos estadísticos que indican si una diferencia entre dos o más cifras (promedios, porcentajes, puntuaciones totales, etc.) es o no significativa. Estas pruebas toman en cuenta aspectos como el tamaño de los grupos cuyos valores se comparan, las diferencias entre quienes integran los grupos y otros factores. Cada comparación entre grupos es distinta y ello lo consideran los métodos, los cuales se explicarán en el capítulo 10, “Análisis de los datos cuantitativos”. No resultaría conve- niente exponerlos aquí, porque habría que clarificar algunos aspectos estadísticos en los cuales se basan tales métodos, lo que provocaría confusión, sobre todo entre quienes se inician en el estudio de la investigación. www.e losopa nda.c om | ja me spoe trodrig ue z.c om Experimentos “puros” 143 Su formato general sería:11 RG1 X1 01 RG2 X2 02 RG3 X3 03 RGk Xk 0k RGk + 1 — 0k + 1 En el diseño con posprueba únicamente y grupo de control, así como en sus posibles variaciones y extensiones, se logra controlar todas las fuentes de invalidación interna. La administración de prue- bas no se presenta porque no hay preprueba. La inestabilidad no afecta porque los componentes del experimento son los mismos para todos los grupos (excepto la manipulación o los tratamientos expe- rimentales), ni la instrumentación porque es la misma posprueba para todos, ni la maduración por- que la asignación es al azar (si hay, por ejemplo, cinco sujetos en un grupo que se cansan fácilmente, habrá otros tantos en los otros grupos), ni la regresión estadística, porque si un grupo está regresando a su estado normal los otros también. La selección tampoco es problema, ya que si hay sujetos atípicos en un grupo, en los demás habrá igualmente sujetos atípicos. Todo se compensa. Las diferencias se pueden atribuir a la manipulación de la variable independiente y no a que los sujetos sean atípicos, pues la asignación aleatoria hace equivalentes a los grupos en este factor. De este modo, si en los dos grupos sólo hubiera personas demasiado inteligentes y la variable independiente fuera el método de enseñanza, las diferencias en el aprendizaje se atribuirían al método y no a la inteligencia. La mortalidad no afecta, puesto que al ser los grupos equiparables, el número de personas que abandonen cada grupo tenderá a ser el mismo, salvo que las condiciones experimen- tales tengan algo en especial que haga que los sujetos abandonen el experimento; por ejemplo, que las condiciones sean amenazantes para los participantes, en cuyo caso la situación se detecta, analiza a fondo y corrige. De todas maneras el o la experimentadora tiene control sobre la situación, debido a que sabe que todo es igual para los grupos, con excepción del tratamiento experimental. Otras interacciones tampoco pueden afectar los resultados, pues si la selección se controla, sus interacciones operarán de modo similar en todos los grupos. Además, la historia se controla si se vigila cuidadosamente que ningún acontecimiento afecte a un solo grupo. Y si ocurre el aconteci- miento en todos los grupos, aunque afecte, lo hará de manera pareja. En resumen, lo que influya en un grupo también influirá de manera equivalente en los demás. Este razonamiento se aplica a todos los diseños experimentales “puros”. Ejemplo Diseño con posprueba únicamente, varios grupos y uno de control Un investigador lleva a cabo un experimento para analizar cómo influye el estilo de liderazgo del supervisor en la productividad de los trabajadores. Pregunta de investigación: ¿influye el estilo de liderazgo que ejerzan los supervisores de producción en una maquiladora sobre la productividad de los trabajadores de línea? Hipótesis de investigación: “distintos estilos de liderazgo que ejerzan los supervisores tendrán diferentes efectos sobre la productividad”. 11 El factor “k” fue extraído de Wiersma y Jurs (2008) e indica “un número tal de grupos”. Otros autores utilizan “n”. En los ejemplos, tal factor implica el número del último grupo con tratamiento experimental más uno. Desde luego, el grupo de control se incluye al final y el número que le corresponde a su posprueba será el último. www.e losopa nda.c om | ja me spoe trodrig ue z.c om 144 Capítulo 7 Concepción o elección del diseño de investigación En una planta maquiladora, se asigna al azar a 90 trabajadores de línea a tres condiciones experimenta- les: 1) 30 realizan una tarea bajo el mando de un supervisor con estilo autocrático, 2) 30 ejecutan la tarea bajo el mando de un supervisor con estilo democrático y 3) 30 efectúan la tarea bajo el mando de un supervisor con estilo liberal (que no supervisa directamente, no ejerce presión y es permisivo). Por último, 30 más son asig- nados en forma aleatoria al grupo de control donde no hay supervisor. En total, son 120 trabajadores. Se forman grupos de 10 trabajadores para el desempeño de la tarea (armar un sistema de arneses o cables para vehículos automotores). Por tanto, habrá 12 grupos de trabajo repartidos en tres tratamientos experimentales y un grupo de control. La tarea es la misma para todos y los instrumentos de trabajo también, al igual que el ambiente físico (iluminación, temperatura, etc.). Las instrucciones son uniformes. Se ha preparado a tres supervisores (desconocidos para todos los participantes) para que ejerzan los tres estilos (democrático, autocrático y liberal). Los supervisores se distribuyen al azar entre los horarios. Estilos Supervisor Autocrático Democrático Liberal Supervisor 1 trabaja 10 sujetos 10 sujetos 10 sujetos con… 10:00-14:00 h 15:00-19:00 h 10:00-14:00 h Lunes Lunes Martes Supervisor 2 trabaja 10 sujetos 10 sujetos 10 sujetos con… 15:00-19:00 h 10:00-14:00 h 10:00-14:00 h Lunes Martes Lunes Supervisor 3 trabaja 10 sujetos 10 sujetos 10 sujetos con… 10:00-14:00 h 10:00-14:00 h 15:00-19:00 h Martes Lunes Lunes Sin supervisor 10 sujetos 10 sujetos 10 sujetos 10:00-14:00 h 15:00-19:00 h 10:00-14:00 h Lunes Lunes Martes Si se observa, los tres supervisores interactúan en todas las condiciones (siguen los tres estilos), con el propósito de evitar que la apariencia física o la personalidad del supervisor afecte solamente a una de ellas. Es decir, si un supervisor es más “carismático” que los demás e impacta la productividad, influirá en los tres gru- pos por igual. El horario está controlado, puesto que los tres estilos se aplican en todas las horas en que se lleva a cabo el experimento. Es decir, las tres condiciones siempre se realizan en forma simultánea. Este ejemplo se esque- matizaría de la siguiente manera: RG1 X1 (supervisión con estilo autocrático) 01 RG2 X2 (supervisión con estilo democrático) 02 Comparaciones en productividad RG3 X3 (supervisión con estilo liberal) 03 RG4 — (sin supervisión) 04 Ejemplo En el ejemplo del selenio que se comentó previamente en esta obra, además de ponderar la literatura podría realizarse un experimento o prueba clínica aplicando este diseño a, digamos, tres grupos de mujeres con tumores cancerígenos: a uno que se le administrara durante un año cierto complemento alimenticio de selenio en cápsulas (por ejemplo, 200 μg diarios), a otro solamente 100 μg y a un tercero no se le suministrara Se (de control). La posprueba consistiría en evaluar si el tratamiento reduce el crecimiento de los tumores canceríge- nos en aquellas pacientes que se encuentran en la etapa inicial de la enfermedad. www.e losopa nda.c om | ja me spoe trodrig ue z.c om Experimentos “puros” 145 Desde luego, se controlarían posibles fuentes de invalidación o contaminación como la dieta (que la alimenta- ción sea la misma para todas los participantes, porque hay alimentos que contienen selenio, como el pescado y el huevo), y la asignación al azar igualaría a los grupos en edad, región geográfica donde viven (vinculada a la dieta), nivel socioeconómico y otras variables que pudieran afectar. Una cuestión que debe valorarse en esta clase de intervenciones es que diversos estudios han demos- trado que administrar selenio puede ser muy delicado, ya que altos niveles de este cofactor esencial en los sistemas antioxidantes endógenos más importantes del cuerpo humano pueden tener efectos en la salud como el riesgo potencial de desarrollar diabetes tipo 2 (Muecke et al., 2010), además de otros efectos secundarios. Asimismo, un protocolo de tal naturaleza tiene que ser sometido a distintas instancias de ética médica y comunidades científicas. El investigador debe asegurarse de que el selenio no vaya a tener efectos perjudiciales en las participantes (no sólo con la vigilancia del crecimiento de los tumores, sino realizando también otras pruebas clínicas para evaluar permanentemente el estado de salud y suspender el experi- mento a la mínima sospecha de otros efectos). Y también existe el serio dilema de las enfermas del grupo de control, pues se les niega la posibilidad de mejorar al no suministrarles el selenio, por esto, tal vez la opción sería no tener grupo testigo o que éste se encuentre constituido por mujeres que ya hayan fallecido y se posea información sobre la evolución de sus tumores durante la enfermedad, además de que posean un perfil similar a las participantes del experimento (emparejarlas). En este caso, se mezclarían asignación al azar y emparejamiento en la constitución de los grupos. Roberto Hernández-Sampieri recomienda a los estudiantes discutir las cuestiones éticas de la experimentación con su profesor o profesora de métodos de investigación.12 2. Diseño con preprueba-posprueba y grupo de control Este diseño incorpora la administración de prepruebas a los grupos que componen el experimento. Los participantes se asignan al azar a los grupos y después se les aplica