표준화 (1) 썸네일형 리스트형 표준화(Standardization) vs 정규화(Normalization) 모형이 피처의 척도에 민감하게 반응하는 경우가 있다. 이를 방지하기 위해 스케일링이 필요하다. 스케일링(Scailing)이란 데이터를 특정 범위로 조정하는 것을 의미하며, 주로 서로 다른 변수의 범위를 맞추는 데 사용된다. 데이터 스케일링을 위해 표준화와 정규화를 활용할 수 있다. 혼용되어 쓰이는 경우가 많고 헷갈리기 쉬우니 주의하자. 표준화(Standardization)해당 피처가 표준정규분포의 속성을 갖도록, 즉 평균이 0이고 표준 편차가 1인 분포로 변환한다. Z-스코어 정규화(Z-score Normalization)라고도 한다. 변수 분포가 종 모양일 때 유용하며 이상치에 덜 민감하다. $$x_{std} = \frac{x-mean(x)}{sd(x)}$$ 정규화(Normalization)피처 범위.. 통계·머신러닝 2024. 9. 5. 21:57 이전 1 다음