차원 축소 (Dimension Reduction) 개요

차원 축소는 많은 피처로 구성된 데이터 세트의 차원을 축소해 새로운 차원의 데이터 세트를 생성하는 것이다

**피처 선택 (Feature Selection)**과 **피처 추출 (Feature Extration)**으로 나뉜다.

PCA (Principal Component Analysis)

가장 대표적인 차원 축소 기법으로, 여러 변수 간에 존재하는 상관관계를 이용해 이를 대표하는 주성분 (Principal Component)를 추출해 차원을 축하는 기법이다.

Untitled

선형대수 관점에서의 해석

입력 데이터의 공분산 행렬이 고유 벡터와 고유값으로 분해될 수 있으며, 이렇게 분해된 고유 벡터를 이용해 입력 데이터를 선형 변환하는 방식이 PCA라는 것이다.