[ANOVA 분산분석] 기본 가정과 예외, 가설

2018. 12. 25. 18:30수학/통계

반응형


ANOVA 분산분석은 세 가지 기본 가정이 있습니다. 이 기본가정이 충족된다는 전제조건 하에 ANOVA 분산분석이 의미가 있습니다. 



먼저는, 정규성입니다. 각 그룹에 있는 데이터는 정규분포의 형태를 가져야 합니다. 


둘째는, 등분산입니다. 각 그룹의 분산은 서로 같은 분산을 가져야 합니다. 한 그룹은 넓고, 한 그룹은 좁은 분산을 가지는 경우엔 분산분석을 할 수 없습니다. 아래 그림에서 위는 등분산이 성립하는 경우, 아래는 등분산이 성립하지 않는 경우입니다.


셋째는, 독립성입니다. 각 그룹에 대해서 관찰은 서로 독립적이어서, 그룹간에 서로 영향을 주지 않아야 합니다.


이렇게 기본 가정이 있지만, 예외를 허락하는 경우가 있습니다. 

만약 데이터의 수가 아주 많은 경우에는, 첫 번째 조건인 정규성을 가지지 않아도 됩니다.

만약 그룹간의 데이터 수가 비슷하고 어느 두 그룹 간의 분산의 비 ratio of any two variances 가 모두 4를 넘지 않는 경우에는, 두 번째 조건인 등분산을 가지지 않아도 됩니다.




ANOVA 분산분석의 귀무가설 H0대립가설 Ha 은 아래와 같습니다. 귀무가설 만족하는 경우는 모든 그룹의 평균이 동일한 경우이므로, 반대로 대립가설을 만족하는 경우는 한 쌍이라도 그룹의 평균이 동일하지 않은 경우입니다. 


따라서, 귀무가설을 기각하는 상황이 발생한 경우, 어떤 그룹쌍이 서로 다른 평균을 가지는지 찾아야 합니다.




반응형