Skip to content

Feature scaling

피쳐 스케일링은 데이터의 피쳐 (기계 학습)이나 독립 변수의 구간을 표준화하는 방법론이다. 데이터 프로세싱에서 이는 데이터 정규화로 정의되며, 이전 단계를 위한 처리 작업이다.

In the Machine learning

Feature 간 데이터 크기가 많이 차이가 나면, Gradient Descent 에서 등고선 간 간격이 좁으므로, Global optima 를 찾는데 오래걸릴 수 있다. 따라서 Feature 값을 m 으로 나누거나 -1 과 1 사이로 scaliing 할 수 있다. 거꾸로 말하면, Feature scaling 을 이용하면 Gradient descent 가 결과값을 더 빠르게 찾는다.

또한 Mean normalization 을 이용할 수 있는데, 모든 feature 에서 평균을 빼서, 평균을 0 으로 만드는 방법이다.

더 일반적인 방법은 mean normalization 을 하고, 거기에 max-min 또는 standard deviation 으로 나누는 방법이다.

See also

Favorite site