본문 바로가기

데이터 분석13

3장 연습문제 1번 2번 3번코드를 실행해가면서 나오는 그래프의 모습을 봐가면서 추가로 작성하였다. 직접 처음부터 그래프를 만들어보니 어떤 코드가 어떤 것을 나타나게 하는지 좀 더 명확하게 알 수 있었다. 4번산점도 그래프에서 점의 크기는 s= 으로 설정한다. 5번barh도 x축값, y축값 순서대로 작성한다. 2025. 1. 25.
03장 데이터 시각화 라이브러리, 맷플롯립 import matplotlib.pyplot as pltmatplotlib 모듈의 하위 모듈인 pyplot을 import하면 그래프 작성에 필요한 기능을 일일이 호출하지 않아도 된다.plt.xlabel('xlabel')plt.ylabel('ylabel')plt.legend()plt.xlim([0,5])plt.ylim([0, 15])plt.xscale('linear')plt.yscale('log')맷플롯립으로 축 레이블, 범례, 축 범위, 축 스케일을 커스터마이징 할 수 있다.plt.plot([1, 2, 3], [4, 4, 4], '-', label='solid')plt.plot([1, 2, 3], [2, 2, 2], linestyle='dotted', label='dotted')plt.plot([4, 5.. 2025. 1. 25.
2장 연습문제 1번딕셔너리 형태 키: 값 =이 아니다... index=False도 작성할 필요 없다. 2번 결측치 처리한 것을 원본 데이터에 적용되도록 적자. 3번 4번오른쪽처럼 적는 것이 가독성이 더 좋은 것 같다. 5번 6번 7번 2025. 1. 20.
02장 데이터 처리 라이브러리, 판다스 02.1 판다스 시작하기 판다스: 데이터 분석을 위한 파이썬 라이브러리, 주로 행과 열로 이루어진 2차원 데이터를 다루는 데 사용넘파이는 다차원 배열을 다루기에 적합판다스는 표 형태의 데이터를 다루기에 적합import pandas as pdseries_data = pd.Series([True, 3.14, 'ABC']) 데이터프레임: 열과 인덱스로 이루어져 있는 2차원 배열 형태의 데이터 타입netflix = pd.read_csv('./netflix_selena.csv')netflix.to_csv('netflix_new.csv', index=False)index=False: 행 이름을 파일에 저장하지 않도록 설정 판다스에서 object 데이터 타입문자열 데이터: 다른 언어에서는 문자열 데이터를 string.. 2025. 1. 20.
[혼공분석] 3주차_데이터 정제하기 03-1 불필요한 데이터 삭제하기 데이터 정제: 데이터에서 손상되거나 부정확한 부분을 수정하고, 불필요한 데이터를 삭제하거나 불완전한 값을 교체하는 등의 작업, 데이터를 분석 목적에 맞게 변환하는 데이터 랭글링 또는 데이터 먼징의 일부로 수행될 수 있음  열 삭제하기 ns_book = ns_df.loc[:, '번호':'등록일자']selected_columns = ns_df.columns != 'Unnamed: 13'ns_book = ns_df.loc[:, selected_columns]ns_book = ns_df.drop('Unnamed: 13', axis=1)ns_book.drop('주제분류번호', axis=1, inplace=True)ns_book = ns_df.dropna(axis=1)ns_book.. 2025. 1. 20.
[혼공분석] 2주차_데이터 수집하기 02-1 API 사용하기 API(Application Programming Interface): 두 프로그램이 서로 대화하기 위한 방법을 정의한 것애플리케이션 간의 통신을 위해서는 웹 기반의 API가 널리 사용 HTTP: 인터넷에서 웹 페이지를 전송하는 기본 통신 방법데이터 분석가는 웹 기반 API를 사용하는 방법을 아는 것이 중요! HTML: 웹 브라우저가 화면에 표시할 수 있는 문서의 한 종류이자 웹 페이지를 위한 표준 언어웹 기반 API는 주로 JSON이나 XML을 많이 사용 JSON: 파이썬의 딕셔너리와 리스트를 중첩해 놓은 것과 비슷, 키와 값을 콜론으로 연결d = {"name": "혼자 공부하는 데이터 분석"}print(d['name'])JSON 형식으로 만든 파이썬 딕셔너리import jso.. 2025. 1. 14.