El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar dos o más medias. Es necesario porque cuando se quiere comparar más de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student.
En resumen, el análisis de varianza sirve para comparar si los valores de un conjunto de datos numéricos son significativamente distintos a los valores de otro o más conjuntos de datos. El método para comparar estos valores está basado en la varianza global observada en los grupos de datos numéricos a comparar. Típicamente, el análisis de varianza se utiliza para asociar una probabilidad a la conclusión de que la media de un grupo de puntuaciones es distinta de la media de otro grupo de puntuaciones.
El ANOVA parte de algunos supuestos que han de cumplirse:
- La variable dependiente debe medirse al menos a nivel de intervalo.
- Independencia de las observaciones.
- La distribución de la variable dependiente debe ser normal.
- Homocedasticidad: homogeneidad de las varianzas.
Existen tres tipos de modelos:
- El modelo de efectos fijos asume que el experimentador ha considerado para el factor todos los posibles valores que éste puede tomar. Ejemplo: Si el género del individuo es un factor, y el experimentador ha incluido tantos individuos masculinos como femeninos, el género es un factor fijo en el experimento.
- Los modelos de efectos aleatorios asumen que en un factor se ha considerado tan sólo una muestra de los posibles valores que éste puede tomar. Ejemplo: Si el método de enseñanza es analizado como un factor que puede influir sobre el nivel de aprendizaje y se ha considerado en el experimento sólo tres de los muchos más métodos posibles, el método de enseñanza es un factor aleatorio en el experimento.
- Los modelos mixtos describen situaciones donde están presentes ambos tipos de factores: fijos y aleatorios.
La técnica fundamental consiste en la separación de la suma de cuadrados (SS, 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Como ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un análisis de regresión lineal).
SSTotal = SSError + SSFactores
El número de grados de libertad (gl) puede separarse de forma similar y se corresponde con la forma en que la distribución chi-cuadrado describe la suma de cuadrados asociada.
glTotal = glError + glFactores
Nota: Por grados de libertad "degrees of freedom" entendemos el número efectivo de observaciones que contribuyen a la suma de cuadrados en un ANOVA, es decir, el número total de observaciones menos el número de datos que sean combinación lineal de otros.