1. R square (결정계수)
- 표본 회귀선이 관측치를 얼마나 잘 설명하는지 측정하는 척도
1) R square 구하기
결국 R square는 종속 변수에서 독립 변수로 설명 가능한 영역을 나타냄
2) R square 특징
- 음의 값을 가질 수 없음. 0 <= R square <=1
- 1에 가까울수록 모든 i에 대해 Yi_hat에 근사함을 의미,
반대로 0에 가까울수록 설명변수와 종속 변수 간의 관계가 약해짐을 의미(독립변수의 기울기가 0이 됨 : b2=0)
2. Adjusted R square
- R square는 독립 변수를 추가하는 것만으로도 수치가 증가함. 따라서 독립 변수 증가를 감안한 R square 가 필요
- 독립 변수 증가는 곧 자유도의 감소를 의미하므로 자유도를 R square 계산에 사용
- R square와 Adjusted R square 값의 차이가 크다면 의미 없는 독립 변수가 많다고 할 수 있음.
3. R (상관계수)
- 두 변수간의 상관관계를 측정하는 척도
1) R 구하기
- 결정계수 R square에 제곱근으로 구할 수 있음
2) R의 특징
- -1<= R <= 1
- 독립변수와 종속변수가 서로 독립이면 R=0(역은 성립하지 않는다.)
- 두 변수의 선형 관계 척도일 뿐, 인과관계를 의미하지 않는다.
- R은 선형관계, 선형 종속관계만 측정할 수 있다.
독립 변수와 종속 변수가 2차 함수를 그릴 때,
서로 상관관계가 있는 것처럼 보이지만 선형 종속관계만 측정하는 R 상관계수는 0으로 측정됨.
'Data_Analysis > 기초통계' 카테고리의 다른 글
[기초통계] 공분산(Covariance) (0) | 2020.10.26 |
---|---|
[기초통계] χ2 검정 (0) | 2020.10.26 |
기초통계 - 이분산성(Heteroskedasticity) (0) | 2020.10.23 |
기초 통계 - Anova(three-way) (0) | 2020.10.23 |
기초통계 - Anova(two-way) (0) | 2020.10.21 |
댓글