본문 바로가기
Data_Analysis/기초통계

기초 통계 - Anova(one-way)

by Classic! 2020. 10. 21.

1. Anova 분석

- ttest는 집단 간의 평균으로 비교했다면, anova는 평균의 분산을 활용하기 때문에 분산분석이라고 부른다.

- 2개 이상의 다수 집단 간의 차이를 비교할 때 사용

- F분포 이용

- 정규성, 분산의 동질성, 관찰의 독립성 가정

- Anova 분석 종류 : 일원 분산, 이원 분산분석, 다원 변량 분산분석, 공분산 분석

 

 

2. Anova(one-way) 변수 특징

- 종속 변수 : 연속형 데이터만 가능

- 독립 변수 : 이산형/범주형 데이터(1개 변수에서 범주가 여려개인 경우도 가능)만 가능

 

 

3. F-분포

1) F-value

- F값은 2개의 분산(Between Variance, Within Variance)의 비율로, 이를 구하기 위해 모든 범주의 전체 평균각 범주의 평균이 필요함.

- Between Variance (연구자가 알고 싶은 변화/차이) : 전체 평균과 각 범주의 평균까지의 분산을 구함. 만약 Between Variance가 크면 적어도 1개 그룹의 평균은 다른 그룹의 평균과 차이가 난다는 뜻. 

- Within Variance (일반적인 수준의 변화/차이) : t-value계산 시, 분모의 표준 편차와 같은 의미. random한 변화 정도를 나타낸다.

=> Between Variance가 Within Variance보다 충분히 크면 Between Variance는 통계적으로 크다고 할 수 있다.

 

2) F-value 계산

- 가설

H0 : 그룹 간의 평균 차이는 없다.

Ha : 적어도 1개 그룹의 평균은 다르다.

 

- Between Variance

- Within Variance

Within Variance자유도 df2 = n-k(=샘플크기-그룹개수)

Between Variance의 df1과 df2를 합치면 (k-1)+n-k=n-1

2개 분산의 자유도를 더하면 결국 n-1이 됨.

 

 

- F-value

 

 

4. 사후 검정

- one way Anova 검정으로 집단 평균의 차이가 있음을 밝힌 후, 어떤 그룹이 어떻게 다른지 규명할 필요가 있다.

- 여러 그룹을 개별적으로 평균 분산 분석하여 확인할 수 있다.

- 사후 검정의 종류로는 Fisher's LSD, Bonferroni, Sheffle, Duncan 등이 있다.

 


노트필기

 

'Data_Analysis > 기초통계' 카테고리의 다른 글

기초통계 - 이분산성(Heteroskedasticity)  (0) 2020.10.23
기초 통계 - Anova(three-way)  (0) 2020.10.23
기초통계 - Anova(two-way)  (0) 2020.10.21
기초통계 - 조절 효과  (0) 2020.10.21
기초 통계 - Ttest  (0) 2020.10.21

댓글