본문 바로가기
Data_Analysis/기초통계

[기초통계] 결정계수 R square, 상관 계수 R

by Classic! 2020. 10. 26.

1. R square (결정계수)

- 표본 회귀선이 관측치를 얼마나 잘 설명하는지 측정하는 척도

1) R square 구하기

 

 

결국 R square는 종속 변수에서 독립 변수로 설명 가능한 영역을 나타냄

 

2) R square 특징

- 음의 값을 가질 수 없음. 0 <= R square <=1

- 1에 가까울수록 모든 i에 대해 Yi_hat에 근사함을 의미,

반대로 0에 가까울수록 설명변수와 종속 변수 간의 관계가 약해짐을 의미(독립변수의 기울기가 0이 됨 : b2=0)

 

 

2. Adjusted R square

- R square는 독립 변수를 추가하는 것만으로도 수치가 증가함. 따라서 독립 변수 증가를 감안한 R square 가 필요

- 독립 변수 증가는 곧 자유도의 감소를 의미하므로 자유도를 R square 계산에 사용

- R square와 Adjusted R square 값의 차이가 크다면 의미 없는 독립 변수가 많다고 할 수 있음.

 

 

3. R (상관계수)

- 두 변수간의 상관관계를 측정하는 척도

1) R 구하기

- 결정계수 R square에 제곱근으로 구할 수 있음

상관계수 R 구하기

2) R의 특징

- -1<= R <= 1

- 독립변수와 종속변수가 서로 독립이면 R=0(역은 성립하지 않는다.)

- 두 변수의 선형 관계 척도일 뿐, 인과관계를 의미하지 않는다.

- R은 선형관계, 선형 종속관계만 측정할 수 있다.

독립 변수와 종속 변수가 2차 함수를 그릴 때,

서로 상관관계가 있는 것처럼 보이지만 선형 종속관계만 측정하는 R 상관계수는 0으로 측정됨.

댓글