Unidad VI: Evaluación, Medición e Investigación Lección 3 PDF

Summary

This document is about evaluation, measurement, and research in education. It covers topics such as the analysis of items, the importance of content validity, and different assessment techniques used for students. It defines indexes for difficulty and discrimination related to questions and examines descriptive statistics and interpretation of measurements.

Full Transcript

Unidad VI: Evaluación, Medición e Investigación Lección 3: Instrumentos de evaluación: Análisis, interpretación y uso de los resultados Objetivos de la lección: Al finalizar la lección el estudiante será capaz de: 1. Explicar el propósito del análisis de items. 2. Describir la importancia de la vali...

Unidad VI: Evaluación, Medición e Investigación Lección 3: Instrumentos de evaluación: Análisis, interpretación y uso de los resultados Objetivos de la lección: Al finalizar la lección el estudiante será capaz de: 1. Explicar el propósito del análisis de items. 2. Describir la importancia de la validez de contenido. 3. Realizar un organizador gráfico donde identifiques las técnicas de assessment apropiadas a la materia que estás estudiando. Contenido de la lección: a. Análisis de ítemes 1. índice de dificultad- Permite determinar en qué medida una pregunta es fácil o difícil. En realidad, es un índice de facilidad, puesto que cuanto más alto es, más fácil es la pregunta. Este índice va de 0 a 100, siendo 100 muy fácil y 0 muy difícil. El índice de dificultad recomendado se sitúa entre 50 y 60. Si las preguntas que se diseñan son fáciles, no se puede conocer el grado de pericia de un estudiante sobre el material dado. Para que un ejercicio sea un indicador discriminatorio de los estudiantes de alto rendimiento académico se requiere una operación estadística para conocer el grado de dificultad del ejercicio. 2. índice de discriminación- Esto indica si un ejercicio sirve para discriminar entre alumnos de un nivel alto, medio y bajo. Si ningún estudiante del grupo bajo y todos los estudiantes del grupo alto aciertan la respuesta, entonces el índice discriminatorio es el más alto, es decir 1.00. Si sucede a la inversa, entonces el nivel discriminatorio del ejercicio es el más bajo concebido para un ejercicio -1.00. Los grados intermedios entre 1.00 y el -1.00 indicarán el mayor o menor índice discriminatorio del ejercicio. b. Estadísticas Descriptivas y su interpretación 1. Medidas de tendencia central- Las medidas que describen un valor típico en un grupo de observaciones suelen llamarse medidas de tendencia central. Es importante tener en cuenta que estas medidas se aplican a grupos más bien que a individuos. Un promedio es una característica de grupo, no individual. Entre las medidas de tendencia central tenemos: a) Media- La medida de tendencia central más obvia que se puede elegir, es el valor obtenido sumando las observaciones y dividiendo esta suma por el número de observaciones que hay en el grupo. La media resume en un valor las características de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas. Ejemplo: 8,7,5,7 = 27/4= 6.75 b) Moda- Es el dato que más se repite en la cuenta. Si existen dos datos que se repite un número igual de veces entonces el conjunto será bimodal. Ejemplo: 7, 8, 8, 8, 9, 10,7. La moda en este ejemplo es 8 porque es el dato que mayor frecuencia presenta o más veces se repite. c) Mediana- Definiremos como mediana al valor de la variable que deja el mismo número de datos antes y después que él. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra. Me = , si n es par, Me será el promedio aritmético de las dos observaciones centrales. La mediana es el centro de los valores ya una vez organizados. d) Desviación Estándar- La desviación estándar (o desviación típica) es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Es una medida (cuadrática) de lo que se apartan los datos de su media, y por tanto, se mide en las mismas unidades que la variable. Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que representan los datos en su distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones. La desviación estándar es una medida del grado de dispersión de los datos del valor promedio. Dicho de otra manera, la desviación estándar es simplemente el promedio o variación esperada con respecto de la media. Una desviación estándar grande indica que los puntos están lejos de la media, y una n pequeña indica que los datos están agrupados cerca de la media. Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estándar son 7, 5 y 1, respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7. La desviación estándar puede ser interpretada como una medida de incertidumbre. La desviación estándar de un grupo repetido de medidas nos da la precisión de éstas. Cuando se va a determinar si un grupo de medidas está de acuerdo con el modelo teórico, la desviación estándar de esas medidas es de vital importancia: si la media de las medidas está demasiado alejada de la predicción (con la distancia medida en desviaciones estándar), entonces consideramos que las medidas contradicen la teoría. Esto es de esperarse, ya que las mediciones caen fuera del rango de valores de los cuales sería razonable esperar que ocurrieran si el modelo teórico fuera correcto. 2. Medidas de dispersión o variabilidad- Las medidas de dispersión muestran la variabilidad de una distribución, indicando por medio de un número si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos. Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto y otra es tomando las desviaciones al cuadrado. a) Rango- Es la diferencia entre el valor mayor y el valor menor de los resultados. Ejemplo: Si el valor mayor de una prueba fuera 98 y el valor menor fuera 23 entonces el rango es la resta de 98 menos 23, 98-23= 75. b) Varianza- La varianza es una variable estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, la media de las diferencias cuadráticas de las puntuaciones respecto a su media aritmética. c. Sistemas de calificación Según Rodríguez (2014), las calificaciones constituyen al aspecto final del proceso evaluativo. La nota o calificación asignada para indicar aprovechamiento escolar, debe referirse exclusivamente al grado en que el estudiante ha satisfecho las metas fijadas como objetivos de enseñanza. La calificación final del aprovechamiento debe representar cuánto sabe el estudiante al comparársele con lo que debió aprender, según las normas fijadas por la institución educativa. La calificación tradicional Los profesores asignan letras que representan el trabajo académico del estudiante. Luego estas notas entran al récord permanentemente del estudiante. Las cinco letras A, B, C, D y F nació en los Estados Unidos durante la última década del siglo 18 y hasta mediados del siglo 20. Estas letras han permanecido sin cambio alguno. Tendencias en el sistema de calificación Se han considerado dos tendencias para mejorar los sistemas de calificación, uno es el sistema de notas A, B, C, D y F o reducirlo a aprobado y no aprobado. El aprobado degenera en una actividad convencional, pero no comunica información que diferencie entre unas personas y otras. Para eliminar la rigidez de las cinco letras, otros reformistas les han añadido el + y el – a cada letra. Esto arroja doce categorías para discriminar entre el aprovechamiento académico de unos estudiantes y otros. ( A+, A, A-, B+, B, B-, C+, C, C-, D+, D, D-, F) Otros persisten en gradación numérica en la escala de 100. Pero esta simplemente se convierte al código de cinco letras. 90-100 80-89 79-70 69-60 59 ó menos A B C D F d. Validez y confiabilidad del instrumento 1. Tipos de validez – Según Vera (2008) la cualidad más esencial que debe poseer una prueba es su validez. La validez es una cualidad específica que indica el grado de precisión por el cual una prueba mide lo que se supone debe medir. Hay tres tipos de validez: a) Validez de contenido – Se refiere a cuán bien el contenido de la prueba, en términos de los conceptos y destrezas pertenece a la materia o curso que se enseña. Para determinar esto se tiene que examinar la prueba y ver si lo que mide es una muestra representativa de lo enseñado utilizando fuentes externas como los son: planilla de especificaciones, planes, libros de textos, entre otros. b) Validez de criterio – La validez relacionada al criterio se refiere al alcance o grado de los resultados de una prueba y su comparación con otra prueba o instrumento de evaluación. Se valida el criterio cuando un estudiante que siempre ha sido de excelencia puede obtener resultados de excelencia en sus pruebas comparando estos resultados con pruebas de su materia en años anteriores. c) Validez de constructo – La validez del constructo indica cómo una medición se relaciona con otras de acuerdo con la teoría o hipótesis que concierne a los conceptos que se están midiendo. La validez de constructo se puede buscar con un estándar o una expectativa, ambos instrumentos pueden ofrecer validez de constructo a una prueba. Según Vera (2016), de los tres tipos de validez, la más que concierne al maestro del salón de clases es la validez de contenido. 2. Confiabilidad – Los resultados obtenidos con un examen o algún otro instrumento de medición en una determinada ocasión, bajo ciertas condiciones, deben ser reproducibles. Se espera que sean similares si se vuelve a medir el mismo rasgo en condiciones idénticas. Este aspecto de la exactitud de un instrumento de medida es su confiabilidad. De este modo la confiabilidad es la exactitud de la medición, independientemente de que uno esté realmente midiendo lo que ha querido medir. La confiabilidad es investigar qué cantidad de error existe en un instrumento; en otras palabras, la confiabilidad puede definirse como la ausencia relativa de errores de medición en un instrumento (Ángela, 2000). Técnicas de assessment o avalúo (Vera, 2016). Técnica Tipos Reacción Escrita Inmediata (REI) Cualitativa Hoja de cotejo Cualitativa-cuantitativa Diario reflexivo Cualitativa Portafolio Cualitativo Mapa de conceptos Cualitativo Rúbricas Cualitativa - cuantitativa Lista focalizada Cualitativa Tirillas cómicas Cualitativa Debate Cualitativa Descripción y características Resumir en forma breve las ideas y conceptos discutidos de una lección de clases. Un formulario que indica los aspectos que van a ser observados en los estudiantes, para determinar su nivel de comportamiento con relación a los conceptos, destrezas o actitudes en determinadas tareas o ejercicios de aplicación. Un medio para expresar por escrito lo que los estudiantes piensan a fin de formar y clarificar sus ideas con relación a las sesiones de clase o tareas asignadas. Es una colección de los trabajos realizador por los estudiantes en un periodo académico para demostrar el progreso y logros alcanzados en un área o un trabajo en específico. Un diagrama que organiza gráficamente la amplitud y profundidad de un concepto. Una guía que describe los criterios con una escala para caracterizar los niveles de ejecución a fin de juzgar la calidad de la tarea realizada por los estudiantes. Redactar una lista de términos o aspectos más importantes sobre un tema o asunto en particular. Crear y manifestar mediante el uso de caricaturas el desarrollo de conceptos, actitudes y destrezas. Sesión de preguntas y respuestas en forma competitiva. Propósito y uso Verificar cuan efectivo logró ser el proceso de enseñanza. Verificar el nivel de conocimiento adquirido sobre los conceptos estudiados. Observar el nivel de ejecución en el uso de las destrezas adquiridas. Determinar el nivel de disposición de los estudiantes. Valorar el aprendizaje adquirido a través de la introspección. Fomentar la articulación de ideas. Documentar y evidenciar los esfuerzos, progresos y logros de los estudiantes. Fomentar la creatividad. Reflexionar sobre las fortalezas y limitaciones en la realización de los trabajos asignados. Organizar mentalmente la extensión de un concepto. Evaluar el nivel de abstracción que se tiene sobre un concepto. Comprobar el nivel de dominio sobre los conceptos y las destrezas en determinadas tareas. Examinar fortalezas y limitaciones en diversos tipos de aprendizaje. Explorar el conocimiento que los estudiantes puedan poseer sobre un tema o asunto. Manifestar el aprendizaje de los estudiantes en forma creativa e imaginativa. Clarificar conceptos e interrelacionar materias. Repaso de lecciones y unidades de estudio previo a los exámenes. Corroborar nivel de dominio de los conceptos y destrezas en determinadas lecciones o tareas de aprendizaje. Actividades para el logro de los objetivos: 1. Explica cuál es el propósito del análisis de ítemes. 2. Describe la importancia de la validez de contenido. 3. Realiza un organizador gráfico con las técnicas de assessment que mejor se pueden usar en la materia que estudias.

Use Quizgecko on...
Browser
Browser