1. Anova 분석
- ttest는 집단 간의 평균으로 비교했다면, anova는 평균의 분산을 활용하기 때문에 분산분석이라고 부른다.
- 2개 이상의 다수 집단 간의 차이를 비교할 때 사용
- F분포 이용
- 정규성, 분산의 동질성, 관찰의 독립성 가정
- Anova 분석 종류 : 일원 분산, 이원 분산분석, 다원 변량 분산분석, 공분산 분석
2. Anova(one-way) 변수 특징
- 종속 변수 : 연속형 데이터만 가능
- 독립 변수 : 이산형/범주형 데이터(1개 변수에서 범주가 여려개인 경우도 가능)만 가능
3. F-분포
1) F-value
- F값은 2개의 분산(Between Variance, Within Variance)의 비율로, 이를 구하기 위해 모든 범주의 전체 평균과 각 범주의 평균이 필요함.
- Between Variance (연구자가 알고 싶은 변화/차이) : 전체 평균과 각 범주의 평균까지의 분산을 구함. 만약 Between Variance가 크면 적어도 1개 그룹의 평균은 다른 그룹의 평균과 차이가 난다는 뜻.
- Within Variance (일반적인 수준의 변화/차이) : t-value계산 시, 분모의 표준 편차와 같은 의미. random한 변화 정도를 나타낸다.
=> Between Variance가 Within Variance보다 충분히 크면 Between Variance는 통계적으로 크다고 할 수 있다.
2) F-value 계산
- 가설
H0 : 그룹 간의 평균 차이는 없다.
Ha : 적어도 1개 그룹의 평균은 다르다.
- Between Variance
- Within Variance
Within Variance자유도 df2 = n-k(=샘플크기-그룹개수)
Between Variance의 df1과 df2를 합치면 (k-1)+n-k=n-1
2개 분산의 자유도를 더하면 결국 n-1이 됨.
- F-value
4. 사후 검정
- one way Anova 검정으로 집단 평균의 차이가 있음을 밝힌 후, 어떤 그룹이 어떻게 다른지 규명할 필요가 있다.
- 여러 그룹을 개별적으로 평균 분산 분석하여 확인할 수 있다.
- 사후 검정의 종류로는 Fisher's LSD, Bonferroni, Sheffle, Duncan 등이 있다.
노트필기
'Data_Analysis > 기초통계' 카테고리의 다른 글
기초통계 - 이분산성(Heteroskedasticity) (0) | 2020.10.23 |
---|---|
기초 통계 - Anova(three-way) (0) | 2020.10.23 |
기초통계 - Anova(two-way) (0) | 2020.10.21 |
기초통계 - 조절 효과 (0) | 2020.10.21 |
기초 통계 - Ttest (0) | 2020.10.21 |
댓글