Confiabilidad y Validez

En Estadística debemos saber diferenciar una de la otra y por lo tanto saber interpretarlas. Para que quede un poco más claro, si nos piden realizar un estudio o investigación de cualquier indole, primero necesitamos identificar las variables que intervienen en el fenomeno a estudiar, para luego verificar si estas variables tienen correlación alguna (por medio de un cálculo de coeficiente de Pearson), posteriormente se puede comprobar la confiabilidad siguiendo el enfoque de la Teoría Clásica de los Tests (que llamaremos TCT de aqui en adelante), creada por el psicólogo inglés Charles Spearman.

Si hablamos de confiabilidad, es necesario tomar en cuenta el término error probabilistico, que no es otra cosa que, la probabilidad de que cierto estimado no se encuentre en cierto intervalo elegido de antemano. Entoces si el error deseado es 5%, la confiabilidad estadistica es de 95%.

El desarrollo en este tema estadístico, lo abordaré unicamente de manera superficial, por cuestiones estéticas del blog, no obstante en alguna otra entrada publicaré el procedimiento de cada uno de los conceptos probabilisticos.

Ahora que ya tenemos una idea general del error, tendremos que obtener el coeficiente de confiabilidad (mediante cualquier método), recordemos lo siguiente: "ha mayor cofiabilidad, menor porcentaje de error y por lo tanto mayor consistencia interna" en la aplicación del instrumento.

Los metodos mas utilizados son los siguientes:

-Medida de estabilidad (confiabilidad por test-retest)
-Método de formas alternativas o paralelas
-Método de mitades partidas (split-halves)
-Coeficiente alfa de Cronbach.
-Coeficiente KR-20. Kuder y Richardson
-Coeficiente KR-21. Kuder y Richardson


Y para la interpretación se utiliza el siguiente esquema:



Nota: La confiabilidad de un instrumento está en relación directa con su extensión. Esto se explica porque, en la medida que la prueba está formada por pocos ítems (n < 10) el error de medición aumenta y, en consecuencia, la confiabilidad tiende a bajar. Es decir, cuando la prueba contiene una muestra grande de ítems (n > 30) que son representativos del dominio que se pretende medir, aumenta la probabilidad de acercarnos a la varianza verdadera del instrumento y, de esta manera, se incrementa la confiabilidad.




(En construcción)