기본 숙제(필수): k-평균 알고리즘 작동 방식 설명하기
비지도 학습은 정답이 없는 데이터를 학습하는 방법이다. 비지도 학습 중 k-평균 알고리즘은 다음과 같이 작동한다.
1. 랜덤하게 k개의 클러스터의 중심을 정한다.
2. 각 데이터들에서 가장 가까운 클러스터의 중심을 찾고, 해당 데이터를 그 클러스터의 속한 것으로 묶는다.
3. 클러스터에 속한 데이터들의 평균값으로 해당 클러스터의 중심을 바꾼다.
중심의 변화가 없을 때까지 2번부터의 과정을 반복한다.
추가 숙제(선택): Ch.06(06-3) 확인 문제(p.354) 풀고, 설명하기

답: 2번
주성분의 개수는 특성의 개수만큼 찾을 수 있다.

답: 1번
특성의 개수를 주성분의 개수로 변환하는 것이기 때문에 (1000, 100)이 (1000, 10)으로 된다.

답: 1번
주성분은 큰 순서대로 찾기 때문에 가장 큰 주성분은 첫 번째 주성분이다.

답: 4번
설명된 분산의 비율은 explained_variance_ratio_ 속성에 저장되어 있다.
1번: 훈련시킨 후 transform() 을 통해 샘플을 변환할 수 있다.
2번: PCA는 비지도 학습이라 정답이 없는 학습 방법이다. 그래서 새로운 샘플의 레이블을 예측할 수 없다.
3번: inverse_transform() 으로 원본 데이터를 복원할 수 있다. 심지어 주성분의 개수가 원본과 동일하다면 완전히 복원할 수 있다.
'데이터 분석 > 혼자 공부하는 머신러닝 + 딥러닝' 카테고리의 다른 글
| 6주차_딥러닝을 시작합니다 (2) | 2025.08.17 |
|---|---|
| 4주차_트리 알고리즘 (3) | 2025.07.27 |
| 3주차_다양한 분류 알고리즘 (0) | 2025.07.20 |
| 2주차_회귀 알고리즘과 모델 규제 (1) | 2025.07.12 |
| 1주차_나의 첫 머신러닝 및 데이터 다루기 (0) | 2025.07.05 |