Tema 4 Instrumentos de Evaluación Psicológica y Garantías de Calidad (PDF)
Document Details
Uploaded by ImaginativeGadolinium
UNED
Tags
Summary
This document provides an overview of psychological evaluation instruments and techniques. It discusses various types of instruments, such as psychometric, projective, subjective, and objective techniques. The document also explores the factors influencing the selection and application of these tools and covers ethical considerations in psychological assessment.
Full Transcript
Tema 4 los instrumentos de evaluación psicológica y garantías de calidad Introducción Hay técnica, prueba, test Técnicas pueden ser procedimientos cuantificados y tipificados o no serlo, por ejemplo las técnicas psicométricas lo son porque además de normas para su administración disponen de baremo...
Tema 4 los instrumentos de evaluación psicológica y garantías de calidad Introducción Hay técnica, prueba, test Técnicas pueden ser procedimientos cuantificados y tipificados o no serlo, por ejemplo las técnicas psicométricas lo son porque además de normas para su administración disponen de baremos para su interpretación y permiten comparar a una persona con el grupo de referencia. Otras técnicas como la entrevista, la observación, las proyectivas y subjetivas no lo son porque no suelen estar cuantificadas, ni tipificadas, no disponen de unos baremos establecidos estadísticamente a través de los cuales se compara el sujeto evaluado con su grupo normativo. Prueba se ha venido utilizando habitualmente como sinónimo de test, pueden ser tipificados como no tipificados. El test siempre debe estar tipificado Desde los distintos modelos de evaluación psicológica se han generado diferentes técnicas psicológicas. Los modelos dinámicos y constructivista centrados en evaluar El Mundo inconsciente del individuo o las construcciones subjetivas de las personas, utilizan técnicas proyectivas y subjetivas y los instrumentos que se sirven no suelen estar tipificados Del atributo o cognitivo conductual utilizan técnicas psicométricas que facilita la evaluación de aspectos más cuantificables. Las técnicas de evaluación psicológica La entrevista Se utiliza a lo largo de todo el proceso de evaluación psicológica. La observación Tipos de registros dependiendo de una auto o hetero observación suele aplicarse de forma más asistemática en las primeras fases y con mayor grado de sistematicidad en fases más avanzadas. Las técnicas psicométricas Son los test que se encuentran estandarizados y disponen de baremos, cuestionarios inventarios y escalas que están estandarizadas se identifican con los test. 1 Las técnicas proyectivas No lo son si no están estandarizadas y no disponen de baremos psicométricamente establecidos, pero hay algunas técnicas proyectivas que sí disponen de estándares por ejemplo El test del dibujo de 2 figuras humanas T2F Test de los cuentos de hadas FTT Las técnicas subjetivas Evalúan significados personales acerca de la persona y su mundo usan categorías del lenguaje para la atribución o auto atribución subjetiva de significado. Listados de adjetivos, la técnica Q, la técnica de rejilla, el diferencial semántico, los métodos hermenéuticos y narrativos. Escala de satisfacción familiar por adjetivos ESFA El inventario de adjetivos para la evaluación de los trastornos de la personalidad IA-TP Listado de adjetivos para la evaluación del autoconcepto LAEA Las técnicas subjetivas son especialmente útiles durante el proceso de evaluación Las técnicas objetivas Utilizan aparatos que permiten el registro y análisis de variables cognitivas motoras psicofisiológicas se utilizan en fases más avanzadas. Los psicólogos formados en corrientes más humanistas o constructivistas utilizarán preferentemente técnicas subjetivas. Las técnicas proyectivas serán más aplicadas desde la variante psicodinámica. Los conductistas o cognitivo conductuales técnicas psicométricas y objetivas. ¿qué aspectos generales se deben tener en cuenta para elegir un instrumento de evaluación psicológica? Previamente a la realización de la evaluación lo primero que debe conocer el psicólogo es el objetivo de la misma, que variables constructos o dimensiones quiere evaluar a quién, edad y las características de la persona. Consejo General de la psicología en España -nivel a: formación y experiencia en el ámbito concreto de aplicación a través de pruebas que puedan administrarse corregir e interpretarse con solo la ayuda del manual. -nivel b: conocimiento sobre la teoría de los tests y métodos estadísticos garantizado por la correspondiente titulación académica -nivel c: titulados superiores en psicología psiquiatría o psicopedagogía y con experiencia profesional en diagnóstico clínico 2 ¿cómo aplicar correctamente los instrumentos de evaluación psicológica? -establecer un buen clima durante la aplicación condiciones ambientales, luz, temperatura, silencio. -explicar el objetivo de la evaluación garantizar la confidencialidad de los resultados obtenidos. -motivar a las personas para que realicen las pruebas con interés. -en los casos de pruebas con tiempos limitados es importante indicar a los objetos que se esfuercen al máximo sin que se sientan ansiosos. -considerar la edad de la persona. -considerar si la persona tiene alguna deficiencia sensorial o discapacidad. -los materiales deberán prepararse con anterioridad. Fuentes de error de los instrumentos de evaluación psicológica Las posibles fuentes de error de los instrumentos de evaluación pueden ser debidas a los siguientes factores: -los constructos y adaptadores de los mismos 1-del propio contenido del test 2-la inestabilidad de las puntuaciones a lo largo del tiempo 3-las diferencias en la aplicación o corrección por un mismo evaluador en dos momentos temporales diferentes -al evaluador -el evaluado En el caso de la evaluación infantil y en personas mayores no realizar la evaluación a últimas horas del día, hay que empezar por las más dificultosas y acabar por las más fáciles o divertidas. El evaluador además de saber aplicar una prueba, corregirla e interpretarla será importante prestar atención a sí mismo, a cómo se está trabajando, al estado físico y emocional propio. Mostrar una actitud Serena, empática y calmada beneficiará a todo el proceso de evaluación psicológica. Conocer las variables que evalúa un instrumento y su interrelación con otros constructos. Conocer los modelos que han guiado la construcción de los instrumentos, conocer las bases conceptuales. Modelo de la teoría de respuesta al ítem TRI ofrece otra perspectiva sobre la creación de los ítems de un test y sus correspondientes grados de dificultad o facilidad en las respuestas. 3 Desde el modelo Cattell-Horn-Carrol existen 3 niveles o estratos jerárquicos de aptitudes -en el estrato III se encuentra el factor “g”. -en el estrato II las aptitudes intelectuales generales de segundo orden, entre las que se incluyen la inteligencia fluida y la cristalizada. -en el estrato I se sitúan los factores o actitudes específicos que conforman cada una de las actitudes generales de segundo orden o estrato II. BAS-II 3:6 a 5:11 Mide el índice verbal es el conocimiento y la adquisición de conceptos verbales que se relaciona con la inteligencia cristalizada. BAS-II 6:0 17:11 Lo que mide el índice verbal es el procesamiento verbal complejo incluyendo la adquisición de conceptos verbales el conocimiento verbal y el razonamiento que supone una medida de la inteligencia cristalizada. Conocer lo que mide un test, la población y el contexto de aplicación Es importante saber qué mide cada prueba, cómo lo mide, la edad de aplicación los contenidos, el contexto de aplicación cómo se calculan las puntuaciones y se interpretan y las fortalezas y debilidades de cada instrumento. Las escalas de Wechsler, los contextos de aplicación puede ser clínico neuropsicológico y educativo. En el WPPSI-IV y WISC-V su aplicación será principalmente a población infantil y en el contexto educativo, evalúan a niños y adolescentes. El WAIS-IV puede aplicarse desde los 16:00 hasta los 89:11 considerado como una medida de la inteligencia del adulto. El BAT-7 evalúa personas entre 12 y 60 años de edad puede aplicarse en el contexto educativo, muy adecuado en el ámbito laboral adecuado para utilizar en los procesos de selección de personal. Test MATRICES para personas con problemas de lenguaje o que no dominan el español a través de estímulos no verbales. Conocer la forma de puntuación corrección e interpretación de un test Conocer las puntuaciones y los criterios de calidad de los instrumentos de evaluación para seleccionar un instrumento de evaluación es conocer las puntuaciones que se pueden obtener, así como sus criterios de calidad o propiedades psicométricas. Las puntuaciones y criterios de calidad suelen encontrarse descritos en los manuales de los test psicométricos. 4 La aplicación conjunta de técnicas psicométricas y proyectivas pueden ofrecer una riqueza extraordinaria a la hora de la evaluación psicológica. Las puntuaciones en los instrumentos de evaluación psicológica Interpretación de las puntuaciones en los test psicológicos Cuando un sujeto realiza un test lo primero que el evaluador obtiene es una puntuación directa o bruta, estas puntuaciones deben convertirse en puntuaciones de aptitud que indican el nivel puro de rendimiento en el test, se basan en la dificultad de los ítems intentados y en el número de respuestas correctas y se obtienen a partir del modelo de Rasch. Los criterios de rendimiento (en el caso de los test referidos al criterio) y los baremos (en los test referidos a la norma) Criterios de rendimiento El individuo en el test se evalúa mediante la interpretación referida a un criterio, nos informa acerca del dominio que tiene el sujeto en una habilidad particular, evalúa los conocimientos que tiene un sujeto en un ámbito específico. Se utiliza principalmente en la evaluación educativa, en este caso la puntuación no necesita transformarse en otra puntuación debido a que tiene sentido en sí misma, si un sujeto acierta al 90% de las preguntas de un test significa que ha adquirido el 90% de las competencias o dominios que evalúa el test. Ejemplos de test referidos al criterio: -la prueba de Screening del inventario de desarrollo Battelle -el Beck depression inventory -el Beck anxiety inventory -guía de educación de preescolar Portage -El cuestionario compeTEA evaluación de determinadas competencias en el ámbito laboral. Interpretación en función de baremos Los baremos constituyen el rendimiento o la conducta típica de uno o más grupos de referencia, en el test que estamos valorando, se realiza una interpretación normativa de las puntuaciones. Este modo de interpretar la puntuación de un test permite comparar individuos entre sí o con su grupo de referencia. Para interpretar una puntuación referida a la norma es necesario transformar la puntuación directa obtenida por el individuo en un test, en otra puntuación que indique la posición que ocupa respecto al grupo de referencia normativo. Existen diferentes formas de baremar un test: Baremos cronológicos Se suelen utilizar fundamentalmente en poblaciones infantiles Edad mental o edad cronológica han ido quedando obsoletos y ha sido sustituido por El CI de desviación. 5 La edad mental EM se trata de la puntuación media que obtiene en una prueba el conjunto de la población de esa determinada edad. El problema de ese tipo de puntuaciones es que un año de edad mental, no significa lo mismo a lo largo del desarrollo. El cociente intelectual CI se define como el cociente entre la edad mental y la edad cronológica multiplicada por 100. Cuando se informa del CI de un sujeto basándose en la EM debe indicarse la edad cronológica del sujeto para que el CI resulte verdaderamente significativo Algunos test actuales utilizan un nuevo concepto de CI que se derivan no de la comparación del EM y EC del mismo sujeto sino de la comparación del rendimiento del sujeto con el rendimiento promedio de un grupo de referencia se trata del denominado CI de desviación. El CI de desviación es una puntuación estándar transformada de modo que el promedio tiene valor 100 y la desviación típica valor 15, indica la media y dirección en el que el resultado de un sujeto se desvía del resultado promedio de su grupo de comparación. La edad equivalente es la edad en la que la puntuación del niño es igual a la mediana percentil 50 de la distribución de la muestra normativa. Las puntuaciones de desarrollo proporcionan una estimación de la capacidad independiente de los niños de su misma edad y permiten seguir su desarrollo a lo largo del tiempo. Puntuaciones centiles o percentiles Los centiles o percentiles representan medidas de posición en una distribución de frecuencias, ordenan a los sujetos e indican el porcentaje del grupo que se deja por debajo. No permiten explicar las diferencias entre percentiles, tampoco permiten comparar los percentiles obtenidos por un mismo sujeto en diferentes instrumentos de evaluación. Baremos típicos Una puntuación típica estándar Z se define como la diferencia entre la puntuación directa obtenida por el sujeto en el test y la media del grupo de referencia dividida por la desviación típica de ese mismo grupo en el test. Indica el número de desviaciones típicas a la que se encuentra la puntuación de un sujeto respecto de la medida del grupo normativo. Una puntuación típica igual a 1.5 indica que la puntuación directa del sujeto se sitúa una desviación típica y media por encima de la media del grupo. Una puntuación típica normalizada es el valor Z asociado con el percentil correspondiente a una determinada puntuación directa en la distribución normal. 6 Ventaja que presenta la puntuación típica normalizada es que permiten comparar las puntuaciones en test que presenten distribuciones diferentes y expresar las diferencias cuantitativas entre los sujetos. El principal problema de las puntuaciones típicas tanto estándares como normalizadas para su interpretación es la posibilidad que tienen de asumir valores decimales y valores negativos, para salvar este problema se pueden llevar a cabo transformaciones lineales de las puntuaciones típicas a esto se denominan puntuaciones típicas derivadas estás puntuaciones dan lugar a lo que se denominan escalas típicas derivadas. Escalas típicas derivadas de uso más frecuente en los baremos de los test: -Puntuaciones T media 50 y desviación típica 10 -Puntuaciones media 50 y desviación típica 20 -Decatipos DE media 5.5 y desviación típica 2 -Eneatipos EN media 5 y desviación típica 2 -Escalas de CI media 100 desviación típica 15 -Puntuaciones escalares Pe media 10 desviación típica 3 Criterios de calidad psicométricos de instrumentos de evaluación psicológica La evaluación basada en la evidencia consiste en el uso de la investigación y las teorías científicas como base para: -la selección de los constructos a evaluar según los objetivos de evaluación establecidos. -el uso de técnicas e instrumentos validados para su contrastación -la implementación del proceso de evaluación. Una aproximación de la evaluación basada en la evidencia supone obtener criterios de precisión y utilidad de esta toma de decisiones, así como valorar sus costes y el impacto que los resultados obtenidos tiene sobre la persona evaluada. Las principales garantías de una evaluación científica, está tanto en la precisión y validez de las medidas como en la rigurosidad con la que el proceso de evaluación es implementado. La comisión internacional de test proporciona los criterios exigidos para la traducción y adaptación de test creados en países diferentes a los de la población evaluada, las normas de uso de los test, uso de instrumentos informatizados de evaluación para que un instrumento sea psicométricamente sólido debe estar estandarizado y tener evidencias adecuadas de fiabilidad y validez. Fiabilidad La APA describe la fiabilidad como la exactitud de la medición de un test, precisión con la que mide la prueba. La fiabilidad de la medida implicada consistencia y precisión El cálculo de la fiabilidad nos informa de la cuantía del error de medida 7 El error puede ser de 2 tipos -error sistemático o constante que se produce cuando las mediciones que se obtienen con un instrumento de evaluación son sistemáticamente mayores o menores que lo que realmente deben ser. -error no sistemático que se produce cuando las medidas son alternativamente mayores o menores de lo que realmente deben ser. La fiabilidad de un instrumento se ve influenciada por los errores de medida no sistemáticos. Las fuentes de varianza de error no sistemática son: -las relativas a la construcción del instrumento -las relativas a la administración -las relativas a la calificación e interpretación de las pruebas Fiabilidad desde la teoría clásica de test Los indicadores de fiabilidad más frecuentes desde los modelos clásicos son -la consistencia interna -la consistencia temporal o estabilidad test-retest -acuerdo entre evaluadores o fiabilidad inter-jueces Consistencia interna Se refiere al grado en que los diferentes ítems de una escala miden de manera consistente el mismo constructo subyacente y constituye el método más extendido para el cálculo de la fiabilidad. El coeficiente más utilizado en el cálculo de la fiabilidad es el coeficiente Alfa de Cronbach, los valores de este coeficiente suelen estar entre 0 y 1. El método de la dos mitades constituye una variante en el cálculo de la consistencia interna, como corrección se utiliza la forma de Spearman-Brown. El error típico de medida proporciona una estimación de la cantidad de error que contiene la puntuación obtenida. Estabilidad temporal o coeficiente test-retest La consistencia temporal o fiabilidad test-retest indica la estabilidad de la medida a lo largo del tiempo, en el caso de comportamientos que se supone que permanecen relativamente constantes. Se denomina también coeficiente de estabilidad. Fiabilidad inter-jueces Se trata de determinar si dos o más resultados obtenidos por dos o más evaluadores distintos o por el mismo evaluador en momentos diferentes son coincidentes El índice kappa. 8 Según Nunnally en las primeras fases de la investigación un valor de fiabilidad de 0.5 o 0.6 puede ser suficiente. En la investigación básica mínimo 0.8 En investigación aplicada 0,9 y 0,95 Test de fiabilidad moderada entre 0.75 y.80 pueden utilizarse como pruebas preliminares o de cribado. Pruebas de fiabilidad inferior a 0.67 han de ser rechazadas incluyen exceso de error Fiabilidad desde la teoría de respuesta al ítem Según Hambleton y Swaminathan 1985 desde la TRI el concepto de fiabilidad es equivalente a la inversa de la varianza muestral del estimador del rasgo latente, cuanto mayor es el poder discriminativo y menor es la varianza de la estimación, mayor es la información y por tanto la precisión con la que se mide. El concepto de fiabilidad se sustituye por el concepto de información propuesto por Birnbaum 1968. La función de información de un test o su fiabilidad será igual a la suma de las funciones de información de todos sus elementos. Desde la TRI la función de información es distinta para cada nivel del rasgo latente lo que implica que la fiabilidad es distinta a lo largo del continuo de habilidad. Validez Tradicionalmente la validez se ha entendido como el grado en que un instrumento mide aquello que pretende medir. En la fiabilidad de una prueba estamos valorando el instrumento en sí. La validez no es una propiedad del instrumento sino más bien del significado de las puntuaciones y de la interpretación que se realiza de las mismas. La validez de una prueba puede verse afectada tanto por errores no sistemáticos, como por errores sistemáticos. El error sistemático de medición surge cuando sin que el autor lo sepa, la prueba mide de manera consistente alguna otra variable que no es el rasgo para el que se creó. Una prueba puede ser fiable sin ser válida, pero no puede ser válida sin ser fiable. Silva 1989 matizaciones importantes sobre la validez: -la validez se relaciona con las inferencias que se hagan a partir de las puntuaciones obtenidas mediante un instrumento y en determinadas circunstancias -no se valida el instrumento sino las interpretaciones que se hagan a partir de sus puntuaciones -la validez es algo estimado que se infiere a partir de un conjunto de informaciones no algo que se reduce a un coeficiente o coeficientes particulares -no debe hablarse de clases o tipos de validez más bien de tipos o clases de evidencias la validez se identifica con el proceso científico de construcción y contrastación de hipótesis. 9 Métodos clásicos para el cálculo de la validez -análisis del contenido, validación del contenido. -establecimiento de la relación de las puntuaciones obtenidas en la prueba con un criterio de interés u otras medidas, validación referida al criterio -análisis general de las características psicológicas o constructos particulares, validación del constructo Validación del contenido La validez de contenido hace referencia al grado en que los elementos que componen un instrumento de medida constituyen una muestra relevante y representativa del posible universo de ítems que se podrían haber utilizado para medir el constructo de interés. Un estudio de contenido implica el desarrollo de un conjunto de ítems para su posterior análisis por parte de un grupo de jueces expertos. Croker y Algina 1986 Deben llevarse a cabo las siguientes fases: -definición del dominio de constructo -elaboración de las especificaciones del test -selección de un panel de expertos en el dominio -establecimiento de un marco estructurado para el emparejamiento entre equipos y objetivos -evaluación del grado de congruencia y 3 objetivos Uno de los índices más utilizados es propuesto por Rovinelli y Hambleton 1997 en el que se le pide al juez que valore en una escala de 3 puntos (-1, 0, 1). En la literatura psicométrica podemos encontrar otros conceptos relacionadas con el concepto de validez: -validez aparente se refiere al grado en que un test da la impresión a los evaluados de que mide lo que se pretende -validez ecológica grado en que los comportamientos observados y registrados en una investigación reflejan aquello que realmente acontece a los escenarios naturales -validez curricular examinar el grado en el que el test refleja los objetivos cultura filosofía -validez instruccional el test refleja la dinámica instruccional seguida para la enseñanza del contenido Validez referida al criterio Mediante la validez del criterio se pretende examinar las relaciones empíricas entre las puntuaciones del test y un criterio variable externa de interés. La manera más directa y fácil de cuantificar el grado de validez referida al criterio es obteniendo la correlación entre las puntuaciones del test y del criterio. Podemos diferenciar entre validez predictiva, concurrente y retrospectiva. 10 -en un estudio de validación predictiva se estudia la correlación entre las puntuaciones obtenidas en el test con las puntuaciones de algún criterio recogidas en un tiempo futuro. -estudio de validación concurrente la administración del test y la medida del criterio son simultáneas. -estudio de validación retrospectiva el criterio se mide antes de aplicar el test Validación del constructo Se entiende como la medida en que el test refleja la teoría psicológica a partir de la que se ha construido y permite interpretar las puntuaciones dándoles un significado teórico. Los procedimientos metodológicos más utilizados para la obtención de datos referentes a la validez de constructo son el análisis factorial, matriz multirasgo- multimétodo. A.mbos sistemas son indicadores de los denominadas validez factorial y validez convergente y discriminante Validez factorial: análisis factorial exploratorio confirmatorio El análisis factorial presenta dos tipos o modalidades diferentes: -el análisis factorial exploratorio AFE -el análisis factorial confirmatorio AFC Ambos tipos de procedimientos se corresponden con las dos grandes aproximaciones que llevamos a cabo para la definición de los constructos: -aproximación inductiva o exploratoria -aproximación deductiva o confirmatoria Validez convergente discriminante: matrices multirasgo-multimétodo Las matrices multirasgo-multimétodo MRMM Para la aplicación de la técnica requiere: -seleccionar dos o más formas de medir el constructo de interés -identificar dos o más constructos que puedan medirse por los mismos métodos -medir en una muestra de personas todos los constructos a través de todos los métodos Los diferentes coeficientes de correlación pueden agruparse en una de estas 3 categorías: -coeficientes de fiabilidad: correlaciones entre las medidas de un solo constructo con el mismo método -coeficientes de validez convergente: correlaciones entre las medidas de un solo constructo con métodos de medida diferentes -coeficientes de validez discriminante: correlaciones de diferentes constructos con el mismo método 11 Las matrices multirasgo-multimétodo son una evidencia empírica sobre la validez de constructo desde una perspectiva externa. Otras perspectivas del concepto de validez Validez consecuencial Messik 1998 define la validez consecuencial como los efectos colaterales no anticipados de los usos legítimos de los test especialmente si se pueden relacionar los efectos adversos imprevistos con fuentes de invalidez del test tales como la baja representación del constructo o la dificultad no relacionada con el constructo Validez social el concepto aparece inicialmente vinculado a la evaluación e intervención de sujetos con retraso se proponen dos métodos para evaluarla: -la valoración subjetiva de la aceptabilidad social y la importancia de las metas procedimientos y resultados obtenidos -la valoración cuantitativa de los resultados mediante comparaciones normativas Utilidad -sensibilidad de una técnica para detectar variables de tratamiento -su eficacia para identificar comportamientos objetivo del tratamiento -el grado en que la utilización de una técnica contribuye a la mejora de los resultados del tratamiento La evaluación psicológica es al menos tan útil como la médica en las siguientes áreas -descripción de sintomatología clínica y diagnóstico diferencial -predicción del comportamiento -predicción de resultados médicos -predicción de uso de sistemas de salud -predicción de resultados de las psicoterapias -predicción de resultados en salud mental Meyer -la validez de los test psicológicos es alta y convincente -la validez de los test psicológicos es comparable a la de los test médicos -distintos métodos de evaluación proporcionan fuentes de información única -los clínicos que solo se basan en entrevistas son propensos a obtener un conocimiento incompleto de los pacientes Es recomendable el uso de baterías de evaluación psicológica multimétodo 12 Validez incremental Grado en el que la inclusión de medidas e informantes a lo largo del proceso de evaluación mejore consistentemente en la toma de decisiones y el poder predictivo la validez incremental de las medidas puede ser analizada sobre varias dimensiones: -sensibilidad al cambio -eficacia diagnóstica -validez de contenido -validez criterial -diseño de tratamiento y resultado y validez convergente La validez de los test referidos al criterio: es sensibilidad y especificidad El objetivo de los Test referidos a criterio es clasificar a los sujetos a partir de las puntuaciones que se obtienen en el test. Los sujetos se clasifican según un punto de corte en “aptos-no aptos” o “trastorno-no trastorno”. Entre los índices más utilizados se destacan el índice de sensibilidad y el índice de especificidad a- el índice de sensibilidad o sensibilidad de la prueba SE hace referencia a la proporción de sujetos que realmente tienen el trastorno y han sido correctamente identificados por el test, la sensibilidad es por lo tanto la capacidad del test para detectar trastorno en el sujeto fracción de verdaderos positivos FVP b-el índice de especificidad o especificidad de la prueba SP se refiere a la proporción de sujetos que no tienen trastorno y han sido identificados correctamente por el test probabilidad de que un sujeto sin trastorno tenga un resultado negativo fracción de verdaderos negativos FVN. Se ha propuesto la curva operativa del receptor COR para determinar los puntos de corte que optimicen la validez de las decisiones de clasificación. La validez desde la teoría de la Generalizabilidad TG Cuatro cuestiones específicas a la hora de determinar la validez de una prueba -la generalizabilidad de los elementos: los elementos de un test son representativos del amplio universo de elementos implicados en el mismo ámbito de contenido se relaciona con el concepto de validez de contenido en el TCT. -la generalizabilidad de las situaciones: se plantea la cuestión de la validez ecológica al preguntarse hasta qué punto los datos recogidos en un test son generalizables a otras situaciones -las generalizabilidad de los métodos: se plantea en qué medida de los datos procedentes de un método de evaluación son generalizables a otros que evalúan el mismo contenido. Validez convergente y concurrente de la TCT -La generalizabilidad de las dimensiones: en qué medida las propiedades o estimaciones de una variable son generalizables a otras validez de constructo desde la TCT. 13 Exactitud desde una perspectiva conductual asumir los principios psicométricos de la teoría clásica del test a la hora de elaborar instrumentos de evaluación. Cone 1988 -si la conducta ocurre o no -si ocurre de forma repetida -si ocurre en más de una situación -si se puede medir de más de una forma -si se relaciona sistemáticamente con la ocurrencia de otra u otras conductas Para establecer la exactitud de un instrumento de evaluación conductual es necesario especificar claramente los procedimientos o reglas de utilización del instrumento y disponer de un índice indiscutible con el que puedan compararse los datos que obtengamos mediante la prueba Garantías éticas en el uso de los instrumentos de evaluación psicológica Consejo General de la Psicología en España máximo órgano de representación de los Colegios oficiales de psicólogos, dicho Consejo ha publicado los principios éticos de la evaluación psicológica. Consideraciones sobre la evaluación en grupos diversos o multiculturales Guidelines on Multicultural Education Training Research Practice and Organizational Change for psychologists. 14