Skip to content

Correlation coefficient

상관계수(Correlation coefficient)는 두 변량 X, Y 사이의 상관관계의 정도를 나타내는 수치(계수)이다.

기본 가정

  • 선형성: 두 변인 X와 Y의 관계가 직선적인지를 알아보는 것으로 이 가정은 분포를 나타내는 산점도를 통하여 확인할 수 있다.
  • 동변량성: X의 값에 관계없이 Y의 흩어진 정도가 같은 것을 의미한다. 이분산성이 반대어이다.
  • 두 변인의 정규분포성: 두 변인의 측정치 분포가 모집단에서 모두 정규분포를 이루는 것이다.
  • 무선독립표본: 모집단에서 표본을 뽑을 때 표본대상이 확률적으로 선정된다는 것이다.

분석 방법

  • 단순히 두 개의 변수가 어느 정도 강한 관계에 있는가를 측정하는 단순상관분석(simple correlation analysis),
  • 3개 이상의 변수들간의 관계에 대한 강도를 측정하는 다중상관분석이 있다.
  • 다중상관분석에서 다른 변수들과의 관계를 고정하고 두 변수만의 관계에 대한 강도를 나타내는 것을 편상관계분석(partial correlation analysis)이라고 한다.
  • 이때 상관관계가 \(0 \lt \rho \le +1\) 이면 양의 상관,
  • \(-1 \le \rho \lt 0\)이면 음의 상관,
  • \(\rho = 0\)이면 무상관이라고 한다. (하지만 0인 경우 상관이 없다는 것이 아니라 선형의 상관관계가 아니라는 것이다)

See also