5주차_비지도 학습

기본 숙제(필수): k-평균 알고리즘 작동 방식 설명하기

비지도 학습은 정답이 없는 데이터를 학습하는 방법이다. 비지도 학습 중 k-평균 알고리즘은 다음과 같이 작동한다.

1. 랜덤하게 k개의 클러스터의 중심을 정한다.

2. 각 데이터들에서 가장 가까운 클러스터의 중심을 찾고, 해당 데이터를 그 클러스터의 속한 것으로 묶는다.

3. 클러스터에 속한 데이터들의 평균값으로 해당 클러스터의 중심을 바꾼다.

중심의 변화가 없을 때까지 2번부터의 과정을 반복한다.

추가 숙제(선택): Ch.06(06-3) 확인 문제(p.354) 풀고, 설명하기

답: 2번

주성분의 개수는 특성의 개수만큼 찾을 수 있다.

답: 1번

특성의 개수를 주성분의 개수로 변환하는 것이기 때문에 (1000, 100)이 (1000, 10)으로 된다.

답: 1번

주성분은 큰 순서대로 찾기 때문에 가장 큰 주성분은 첫 번째 주성분이다.

답: 4번

설명된 분산의 비율은 explained_variance_ratio_ 속성에 저장되어 있다.

1번: 훈련시킨 후 transform() 을 통해 샘플을 변환할 수 있다.

2번: PCA는 비지도 학습이라 정답이 없는 학습 방법이다. 그래서 새로운 샘플의 레이블을 예측할 수 없다.

3번: inverse_transform() 으로 원본 데이터를 복원할 수 있다. 심지어 주성분의 개수가 원본과 동일하다면 완전히 복원할 수 있다.

yEverything