Standard deviation
표준 편차(標準 偏差, 영어: standard deviation, SD)는 통계집단의 분산의 정도 또는 자료의 산포도를 나타내는 수치로, 분산의 음이 아닌 제곱근 즉, 분산을 제곱근한 것으로 정의된다. 표준편차가 작을수록 평균값에서 변량들의 거리가 가깝다. 통계학과 확률에서 주로 확률의 분포, 확률변수 혹은 측정된 인구나 중복집합에 적용된다. 관례에 따라 모집단은 그리스문자로 표본은 영어 알파벳으로 표기하는데, 모집단의 표준편차는 \(\sigma\)(시그마)로, 표본의 표준편차는 \(s\)(에스)로 나타낸다.
편차(deviation)는 관측값에서 평균 또는 중앙값을 뺀 것이다.
분산(variance)은 관측값에서 평균을 뺀 값을 제곱하고, 그것을 모두 더한 후 전체 갯수로 나눠서 구한다. 즉, 차이값의 제곱의 평균이다. 관측값에서 평균을 뺀 값인 편차를 모두 더하면 0이 나오므로 제곱해서 더한다.
표준 편차(standard deviation)는 분산을 제곱근한 것이다. 편차들(deviations)의 제곱합(SS, sum of square)에서 얻어진 값의 평균치인 분산의 성질로부터 다시 제곱근해서 원래 단위로 만들어줌으로써 얻게된다.
모 표준 편차(population standard deviation) \(\sigma\)는 모집단의 표준 편차이다. 모 분산 \(\sigma^{2}\)에 제곱근을 씌워서 구한다.
표본 표준 편차(sample standard deviation) \(s\)는 표본의 표준 편차이다. 표본 분산 \(s^{2}\)에 제곱근을 씌워서 구한다.
값의 의미
분산은 수치가 너무 크기 때문에 제곱근으로 적당하게 줄여 사용하는 데 이를 표준편차라 한다. (즉, 표준편차^2 = 분산
)
- 표준편차가 크면, 수치들이 전반적으로 마구잡이 들쭉날쭉 하다는 의미이다.
- 표준편차가 작으면, 수치들이 대체로 비슷하고 고만고만 하다는 의미이다.