본문 바로가기

결측치3

06장 넷플릭스 데이터 분석 프로젝트 import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns사용할 라이브러리들을 불러와서 별칭으로 지정한다.netflix = pd.read_csv('netflix_titles.csv')netflix.head()list(netflix.columns) #열 이름 확인netflix.head(3) netflix.info() #요약 정보 확인데이터셋을 불러와서 간단하게 확인한다.for i in netflix.columns: missingValueRate = netflix[i].isna().sum() / len(netflix) * 100 if missingValueRate > 0: print("{} .. 2025. 2. 23.
2장 연습문제 1번딕셔너리 형태 키: 값 =이 아니다... index=False도 작성할 필요 없다. 2번 결측치 처리한 것을 원본 데이터에 적용되도록 적자. 3번 4번오른쪽처럼 적는 것이 가독성이 더 좋은 것 같다. 5번 6번 7번 2025. 1. 20.
02장 데이터 처리 라이브러리, 판다스 02.1 판다스 시작하기 판다스: 데이터 분석을 위한 파이썬 라이브러리, 주로 행과 열로 이루어진 2차원 데이터를 다루는 데 사용넘파이는 다차원 배열을 다루기에 적합판다스는 표 형태의 데이터를 다루기에 적합import pandas as pdseries_data = pd.Series([True, 3.14, 'ABC']) 데이터프레임: 열과 인덱스로 이루어져 있는 2차원 배열 형태의 데이터 타입netflix = pd.read_csv('./netflix_selena.csv')netflix.to_csv('netflix_new.csv', index=False)index=False: 행 이름을 파일에 저장하지 않도록 설정 판다스에서 object 데이터 타입문자열 데이터: 다른 언어에서는 문자열 데이터를 string.. 2025. 1. 20.