Feature scaling
피쳐 스케일링은 데이터의 피쳐 (기계 학습)이나 독립 변수의 구간을 표준화하는 방법론이다. 데이터 프로세싱에서 이는 데이터 정규화로 정의되며, 이전 단계를 위한 처리 작업이다.
In the Machine learning
Feature 간 데이터 크기가 많이 차이가 나면, Gradient Descent 에서 등고선 간 간격이 좁으므로, Global optima 를 찾는데 오래걸릴 수 있다. 따라서 Feature 값을 m 으로 나누거나 -1 과 1 사이로 scaliing 할 수 있다. 거꾸로 말하면, Feature scaling 을 이용하면 Gradient descent 가 결과값을 더 빠르게 찾는다.
또한 Mean normalization 을 이용할 수 있는데, 모든 feature 에서 평균을 빼서, 평균을 0 으로 만드는 방법이다.
더 일반적인 방법은 mean normalization 을 하고, 거기에 max-min 또는 standard deviation 으로 나누는 방법이다.