17/04, 2019

ANOVA

  • Muchos ANOVA(s)
    • ANOVA
    • ANOVA factorial o en bloque
    • ANOVA anidado o jerarquico
    • ANOVA desbalanceado
    • al infinito

ANOVA simple

  • Varios grupos comparten una variable que creemos que es diferente entre grupos
    • por ejemplo ancho de sepalo puede ser differente entre tres especies de Iris
data(iris)
IRISANOVA <- aov(Sepal.Width ~ Species, data = iris)
summary(IRISANOVA)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## Species       2  11.35   5.672   49.16 <2e-16 ***
## Residuals   147  16.96   0.115                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

ANOVA simple

ANOVA factorial

  • Más de un factor puede afectar nuestra variable respuesta
  • Además interacciones
  • Ejemplo: Economía de combustible en mtcars según si es automático o manual y el número de cilindros que tiene
ANOVA.AUTO <- aov(mpg ~ am + cyl + am:cyl, data = mt)
summary(ANOVA.AUTO)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## am           1  405.2   405.2  46.892 1.93e-07 ***
## cyl          1  449.5   449.5  52.029 7.50e-08 ***
## am:cyl       1   29.4    29.4   3.407   0.0755 .  
## Residuals   28  241.9     8.6                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

ANOVA factorial

ANOVA factorial

Interacciones

Interacciones

term df sumsq meansq statistic p.value
Var1 2 2.17 1.08 0.07 0.93458
Var2 1 4500.00 4500.00 281.21 0.00000
Var1:Var2 2 6.50 3.25 0.20 0.81642
Residuals 174 2784.42 16.00 NA NA

Interacciones

Interacciones

term df sumsq meansq statistic p.value
Var1 2 293.63 146.82 9.17 0.00016
Var2 1 0.00 0.00 0.00 1.00000
Var1:Var2 2 7129.68 3564.84 222.77 0.00000
Residuals 174 2784.42 16.00 NA NA

Interacciones

Interacciones

term df sumsq meansq statistic p.value
Var1 2 1827.83 913.92 57.11 0
Var2 1 3125.00 3125.00 195.28 0
Var1:Var2 2 1924.78 962.39 60.14 0
Residuals 174 2784.42 16.00 NA NA

Interacciones

Interacciones

term df sumsq meansq statistic p.value
Var1 2 7000.00 3500.00 206.61 0.00000
Var2 1 3.85 3.85 0.23 0.63408
Var1:Var2 2 0.00 0.00 0.00 1.00000
Residuals 174 2947.57 16.94 NA NA

ANOVA anidado o jerarquico

  • Tenemos un factor jerarquicamente dentro de otro
  • individuos dentro de una especie)
  • hojas dentro de un árbol
  • varias medidas dentro de un mismo individuo
  • en anova si el factor B esta anidado dendtro de A tenemos A/B
  • Ejemplo individuos en la base de datos CO2
ANOVAUptake <- aov(uptake  ~  Type + Treatment + Type/Plant, data=CO2)
summary(ANOVAUptake)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Type         1   3366    3366   50.02 8.13e-10 ***
## Treatment    1    988     988   14.69 0.000269 ***
## Type:Plant   9    509      57    0.84 0.582195    
## Residuals   72   4845      67                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Variables fijas vs aleatoreas

  • Variables fijas: Se espera que tengan una influencia predecible y sistemática en sobre lo que queremos explicar. Además usan todos los niveles de un factor (Ejemplo genero)
    • Uso en R: A + B
  • Variables aleatoreas: Se espera que su influencia sea impredecible e idiosincratica. Además no se usan todos los niveles de un factor (todos los individuos) A + Error(B)

Variables fijas vs aleatoreas

ANOVAUptake <- aov(uptake  ~  Type + Treatment + Type:Treatment + Error(Type/Plant), data=CO2)
summary(ANOVAUptake)
## 
## Error: Type
##      Df Sum Sq Mean Sq
## Type  1   3366    3366
## 
## Error: Type:Plant
##                Df Sum Sq Mean Sq F value  Pr(>F)    
## Treatment       1  988.1   988.1  27.949 0.00074 ***
## Type:Treatment  1  225.7   225.7   6.385 0.03543 *  
## Residuals       8  282.8    35.4                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Error: Within
##           Df Sum Sq Mean Sq F value Pr(>F)
## Residuals 72   4845   67.29

Más casos y resumen

  • Caso hipotético \(Y\) es la variable a explicar y todo el resto variables explicativas en la base de datos d
  • ANOVA Simple
aov(Y ~ A + B, data=d)
  • para agregar interacciones
aov(Y ~ A + B + A:B, data=d)

Igual a

aov(Y ~ A * B, data=d)

Anovas anidados y variables aleatorias

  • B anidado en A
aov(Y ~ A/B, data=d)
  • A es una variable aleatoria pero B esta anidada en A
aov(Y ~ B + Error(A/B), data=d)
  • B y X interactuan dentro de niveles aleatorios de A
aov(Y ~ (B*X) + Error(A/(B*X)), data=d)