Diccionario de términos psicométricos: Letra C, CONFIABILIDAD, FORMAS DE OBTENCION DE LA

Glosario de psicométricas

“C”

CONFIABILIDAD, FORMAS DE OBTENCION DE LA. Puesto que la fiabilidad se determina formalmente mediante el coeficiente de correlación lineal entre medidas repetidas, realizadas con el mismo test y en las mismas condiciones, o con tests considerados equivalentes por proporciones medidas paralelas, existen procedimientos, que han venido a ser clásicos en el diseño de las pruebas, para la obtención de la fiabilidad. Estos son los denominados test-retest, formas paralelas y división del test en dos mitades. Cada una de las modalidades tiene asociada una problemática distinta y no responden exactamente al mismo concepto de fiabilidad, pues en tanto que unos diseños nos llevan a su medida en el sentido de la estabilidad de las puntuaciones (test – retest), otros nos indican cual es la consistencia interna de la prueba (división por mitades; formas equivalentes en una sola aplicación). Otra de las anotaciones que debemos de hacer aquí, es la de que las “medidas repetidas”; entre las que son usuales el test-retest, formas paralelas y división en dos mitades, deben cumplir las condiciones formales de paralelismo para que se les utilice como “medidas paralelas”. Si las medidas y las varianzas de las dos secuencias de medidas repetidas no son significativamente iguales, no se puede hacer uso de todas aquellas propiedades de las medidas que fueron deducidas a través de las condiciones de paralelismo.
– División en dos mitades. Se trata en este caso de poner en relación las puntuaciones entre dos partes del mismo test, actuando ambas como si fuesen dos formas paralelas. La división del test en dos mitades se puede llevar a cabo de muy distintas formas, sin embargo, para realizarla correctamente con el propósito de calcular la fiabilidad, hay que tener en cuenta cómo ese test ha sido diseñado. En un test con ítems muy homogéneos, cualquier división en dos mitades se puede aceptar como adecuada. Por el contrario, en aquellos casos en los que el test va creciendo en dificultad a medida que se avanza en su ejecución o bien, en aquellos otros en que sin ser de dificultad creciente, se les ha introducido al principio un pequeño número de ítems de pequeña dificultad con el fin de motivar al sujeto, no sería conveniente el realizar una división arbitraria en dos mitades sin tener en cuenta dichas características. Una de las divisiones en dos mitades, que tiende a paliar las dificultades anteriormente mencionadas, es aquella en que el criterio es el de elegir por un lado los elementos que ocupan los lugares pares del test y por otro los impares, para utilizarlos como dos formas paralelas. El coeficiente de confiabilidad se obtiene correlacionando las puntuaciones logradas en una mitad de una prueba con las alcanzadas en la otra mitad de la misma, y aplicando la fórmula Spearman – Brown para compensar la doble longitud de toda la prueba. Los coeficientes de confiabilidad de división en dos mitades a veces se llaman medidas de consistencia interna de una prueba; sólo se refieren al muestreo de contenido y no a la estabilidad de la prueba a través del tiempo. Este tipo de coeficiente de confiabilidad es impropio para las pruebas en que la rapidez es importante. Este procedimiento de división en dos mitades es adecuado en cuanto a lo que la forma de obtener la correlación se refiere, si bien, hay que hacer notar que la fiabilidad así calculada no tiene el mismo sentido que en ese otro caso de utilización de dos test diferentes como formas paralelas.
Test-retest. Bajo esta denominación se indica que las puntuaciones repetidas X y X’ se han obtenido aplicando el mismo test a los mismos individuos y en las mismas condiciones en dos ocasiones diferentes en el tiempo. Es evidente que, si se determina que el test debe ser aplicado a los mismos individuos y en las mismas condiciones, hay que ser extremadamente cuidadosos en la verificación de que esas premisas se cumplen. Uno de los problemas a los que con mayor frecuencia se hace alusión en la literatura es al posible efecto de aprendizaje del sujeto, y que influirá en sus resultados, cuando realiza por segunda vez la prueba. Por lo tanto una fuente de varianza de error a controlar es el muestreo del tiempo. Este efecto se elimina, o al menos queda paliado, si se deja transcurrir un tiempo suficiente entre ambas aplicaciones de la prueba. Esta solución sin embargo no siempre es plausible, bien porque no se pueda tener disponibles a los mismos sujetos en un tiempo posterior conveniente, o bien porque el rasgo que se está evaluando pueda sufrir también variaciones en ese intervalo de tiempo, por ser función del tiempo (es el caso de las variables evolutivas) o porque se produzca alguna intervención que lo modifique. Si la prueba es fiable, y las condiciones de aplicación de la prueba en las dos ocasiones son esencialmente iguales, se observará una significativa estabilidad en las puntuaciones. En general, se utiliza el coeficiente de correlación producto – momento de Pearson para obtener el coeficiente de confiabilidad test – retest. Actualmente, la expresión “test – retest” se utiliza también para describir la administración de diferentes formas de una misma prueba, en cuyo caso, este coeficiente de confiabilidad se combina con un coeficiente de formas alternas. En cualquier caso, intervienen (1) fluctuaciones en el tiempo y en la situación de prueba, así como (2) cualquier efecto que ejerza la primera prueba sobre la segunda. Cuando es considerable el intervalo de tiempo transcurrido entre las dos administraciones, como por ejemplo, un intervalo de varios meses, un coeficiente test-retest de confiabilidad no sólo reflejaría la consistencia de medición inherente a la prueba, sino también la estabilidad de la característica medida en los examinados.
– Formas alternas, equivalentes o paralelas. Se entiende por formas alternas, equivalentes o paralelas de un mismo test a dos tests construidos de forma que resulten ser prácticamente iguales, de manera que las puntuaciones de los sujetos en ambos sean comparables ítem a ítem. Se trata, entonces, de la correspondencia o correlación entre los resultados obtenidos en formas alternas de una prueba; por lo tanto, es una medida del grado hasta donde estas dos formas son congruentes o confiables en la medición. Si el método utilizado es el de formas alternas inmediata, los intervalos de tiempo que separen a las dos administraciones deben ser relativamente cortos, de forma tal que la fuente de varianza de error, esto es el muestreo de contenido, quede relativamente menguada. También, habría que tener en cuenta la longitud de las pruebas, por si deben de ser aplicadas en una misma sesión o en varias, para que las respuestas en alguna de ellas no estén contaminadas por un efecto de fatiga en los sujetos. En cambio, si se utiliza el de formas alternas demorada, los intervalos de tiempo serán más largos y aquí habrá que controlar como posible fuente de varianza de error tanto el muestreo de contenido cuanto el de tiempo. El gran inconveniente que tiene esta modalidad es la de que multiplica el esfuerzo en el proceso de construcción y selección de ítems, si bien, en muchos casos, ya se han construido éstos con anterioridad y se tiene disponible un gran banco de ítems de los que se conocen sus características.
Confiabilidad de Kuder – Richardson y coeficiente alfa. Las fórmulas deducidas por Kuder y Richardson están destinadas a estimar la confiabilidad de una prueba. Estas fórmulas se basan en la consistencia inter – ítem y sólo requieren una administración de la prueba. La más usada de ellas, la fórmula 20, requiere información basada en el número de ítems de la prueba, la desviación estándar de la puntuación total y la proporción de examinados que aprobaron cada ítem. Las fórmulas de Kuder-Richardson no deben utilizarse con pruebas en donde la velocidad de resolución es importante. El coeficiente alfa de Cronbach, por su parte, suele utilizarse para estimar la consistencia interna de un test y se trata de un método basado en la covarianza de los ítems. Los procedimientos descriptos están basados en el supuesto de que las puntuaciones de las partes son esencialmente equivalentes.
Confiabilidad entre calificadores. Una fuente importante de varianza de error, sobre todo en los instrumentos clínicos, es la varianza del examinador. La confiabilidad del calificador se obtiene con una muestra de tests calificados en forma independiente por dos o más examinadores. Los dos (o más) resultados se correlacionan de acuerdo a la forma usual y el consecuente coeficiente de correlación es la medida de la confiabilidad del calificador. Esta clase de fiabilidad suele calcularse en la investigación de instrumentos de calificación subjetiva. ( Anastasi, 1998; Martínez Arias, 1996; Machrens, Sehmann, 1982)

Volver al Glosario «Letra C«

Volver al índice principal de «Diccionario de términos psicométricos«