Colabore con el blog Estadistica

viernes, 18 de enero de 2013

Prueba Estadística “t” de Student

Continuando con la serie de entradas sobre los diferentes test estadísticos (ver las ya publicadas en en el Blog: Spearman, Wilcoxon y Shapiro-Wilks, prueba de F, Chi Cuadrado, Fisher, McNemar, Binomial, Correlación De Pearson), nos llega el turno de estudiar la prueba t de Student.

¿Qué hay que saber de la "t" de Student? 

Se utiliza para determinar si hay una diferencia significativa entre las medias de dos grupos, es decir que se utiliza cuando deseamos comparar dos medias.
Se utiliza para la comparación de dos medias de poblaciones independientes y normales.
Asumimos que las variables dependientes tienen una distribución normal. 

Especificamos el nivel de la probabilidad (nivel de la alfa, nivel de la significación, p) que estamos dispuestos a aceptar  (p < .05 es un valor común que se utiliza).
  • Con una prueba t, tenemos una variable independiente y una dependiente.
  • La variable independiente (por ejemplo sexo) solo puede tener dos niveles (hombre y mujer).
  • Si la independiente tuviera más de dos niveles, después utilizaríamos un análisis de la variación unidireccional (ANOVA).
  • La prueba estadística para t de Student es el valor t. Conceptualmente, la t-valor representa el número de unidades estándares que están separando las medias de los dos grupos.
  • Si nuestra t-prueba produce una t-valor que da lugar a una probabilidad de .01, decimos que la probabilidad de conseguir la diferencia que encontramos sería por casualidad de 1 de cada 100 veces.

Cuatro factores contribuyen para indicar si la diferencia entre dos medias de los grupos se puede considerar significativa:
  • Cuanto mayor es la diferencia entre las dos medias, mayor es la probabilidad que una diferencia estadística significativa existe.
  • El tamaño de la muestra es extremadamente importante en la determinación de la significación de la diferencia entre las medias. Aumentando el tamaño de la muestra, las medias tienden a ser más estables y más representativas.
  • Un nivel más grande de la alfa requiere menos diferencia entre las medias (p <0 font="font">.05). 
  •  Se debe utilizar una hipótesis (con dos colas) no directivas.

Asunciones subyacentes la prueba de t:
  • Las muestras se han dibujado aleatoriamente a partir de sus poblaciones respectivas.
  • La población se debe distribuir normalmente.
  • Unimodal (un modo).
  • Simétrico (las mitades izquierdas y derechas son imágenes espejo), el mismo número de gente arriba o abajo de la media.
  • Acampanado (altura máxima (moda) en el medio).
  • Media, moda, y mediana se localizan en el centro.
  • Asintótico (cuanto más lejos se aleja la curva de la media, más cercana será el eje de X; pero la curva nunca debe tocar el eje de X).
  • El número de personas en las poblaciones debe tener la misma varianza (s2 = s2).Si no es el caso se utiliza otro cálculo para el error estándar.

Existen 2 tipos de prueba t de Student

  • Test t para diferencia par ( grupos dependientes, test t correlacionado) : df= n (número de pares) -1

Esto se refiere a la diferencia entre las cuentas medias de una sola muestra de individuos que se determina antes del tratamiento y después del tratamiento. Puede también comparar las cuentas medias de muestras de individuos que se aparean de cierta manera (por ejemplo los hermanos, madres, hijas, las personas que se emparejan en términos de las características particulares).
  • Test t para muestras independientes
Esto se refiere a la diferencia entre los promedios de dos poblaciones.

Básicamente, el procedimiento compara los promedios de dos muestras que fueron seleccionadas independientemente una de la otra.

Un ejemplo sería comparar cuentas matemáticas de un grupo experimental con un grupo de control.
¿Cómo decido qué tipo de t-prueba a utilizar?

Error tipo I:
  • Rechaza una hipótesis nula que sea realmente verdad. La probabilidad de hacer un error tipo I depende del nivel alfa que se seleccionó.
  • Si se fijó la probabilidad alfa en p < 05, entonces existe un 5% de posibilidades de hacer un error de tipo I.
  • Se puede reducir la posibilidad de hacer un error tipo I fijando un nivel alfa más pequeño (p < .01). El problema haciendo esto es que se aumenta la posibilidad de un error tipo II.
Error tipo II:
  • Falla en rechazar una hipótesis nula que sea falsa.
  • La idea básica para calcular una prueba de Student es encontrar la diferencia entre las medias de los dos grupos y dividirla por el error estándar (de la diferencia), es decir la desviación de estándar de la distribución de las diferencias.
  • Un intervalo de confianza para una prueba t con dos colas es calculado multiplicando los valores críticos por el error de estándar y agregando y restando eso de la diferencia de las dos medias.
  • El efecto tamaño se utiliza para calcular la diferencia práctica. Si existen varios miles de pacientes, es muy fácil encontrar una diferencia estadísticamente significativa
Saber si esa diferencia es práctica o significativa es otra pregunta. 
  • Con los estudios implicando diferencias de grupo, el tamaño del efecto es la diferencia de las dos medias dividido por la desviación estándar del grupo control (o la desviación estándar media de ambos grupos si no hay grupo de control).
  • Generalmente, el tamaño del efecto es solamente importante si existe una significación estadística.
  • Un efecto tamaño de 2 se considera pequeño, 5 se considera medio, y 8 se considera grande.
¿Quieres ayudarnos a mantener vivo el blog?

3 comentarios:

Abraham Sarabia dijo...

Excelente entrada, se comprende bien, incluso para novatos como yo

Emmanuel Domínguez dijo...

Muy buena info, pero podrías aclararme... Qué es una cola y dos colas??? No supe... :(

Oniz dijo...

Necesito ayuda! ¿Qué método debo aplicar para relacionar varias variables independientes con una sola variable dependiente?