데이터 분석/혼자 공부하는 데이터 분석 with 파이썬7 혼공학습단 13기 활동 회고 6주간의 혼공학습단이 끝났다.예전에는 혼자 공부하는 파이썬을 했었는데 이번에는 데이터 분석에 대한 관심이 생겨혼자 공부하는 데이터 분석 with 파이썬 책을 선택해서 진행했다.매주차마다 진행한 내용을 업로드해야 하기 때문에 책을 완독할 수 밖에 없는 것 같다.중간 중간 도서 이벤트나 간식도 보내주셔서 더 열심히 할 수 있었던 것 같다.같은 책을 사서 함께 공부하는 사람들이 있다는 것 또한 공부를 할 때 덜 외롭게 느껴지는 것 같다.다음에는 R이나 SQL을 도전해봐야겠다. 2025. 2. 23. [혼공분석] 6주차_복잡한 데이터 표현하기 06-1 객체지향 API로 그래프 꾸미기 pyplot 방식: matplotlib.pyplot에 있는 함수를 사용객체지향 API: 명시적으로 피겨 객체와 서브플롯 객체를 만들고 이 객체의 메서드를 사용import sysif 'google.colab' in sys.modules: !echo 'debconf debconf/frontend select Noninteractive' | debconf-set-selections #나눔폰트 설치 !sudo apt-get -qq -y install fonts-nanum import matplotlib.font_manager as fm font_files = fm.findSystemFonts(fontpaths=['/usr/share/fonts/truetype/n.. 2025. 2. 23. [혼공분석] 5주차_데이터 시각화하기 05-1 맷플롯립 기본 요소 알아보기plt.figure(figsize=(9, 6)) Figure: 모든 그래프 구성 요소를 담고 있는 최상위 객체figure() 함수를 사용하여 피겨 객체를 만들면 그래프 옵션 조절 가능figsize 매개변수에 그래프의 크기를 튜플로 지정, 기본 크기는 (6, 4), 각각 너비와 높이, 단위는 인치plt.figure(dpi=200)DPI(dot per inch): 1인치를 몇 개의 점(픽셀)으로 표현하는지, 인쇄 출력물의 해상도를 의미PPI(pixel per inch): 1인치를 몇 개의 픽셀로 표현하는지, 화면해상도를 의미(책에는 dpi가 72인 버전이라 두 배인 144를 입력했는데 현재 내가 사용하고 있는 버전은 dpi가 100이라 200을 입력하였다.)dpi 매개변수.. 2025. 2. 15. [혼공분석] 4주차_데이터 요약하기 04-1 통계로 요약하기 기술통계(요약 통계): 자료의 내용을 압축하여 설명하는 방법탐색적 데이터 분석: 데이터 시각화를 아우르는 이러한 데이터 분석 방법ns_book6.describe()ns_book7.describe(percentiles=[0.3, 0.6, 0.9])ns_book7.describe(include='object')describe() 메서드: 데이터프레임에서 기본적인 몇 가지 기술통계를 자동으로 추출percentiles 매개변수: 원하는 위치의 값을 지정하면 보여줌include 매개변수: 수치가 아닌 다른 데이터 타입의 열의 기술통계를 보여줌추가 숙제(선택): Ch.04(04-1)에서 배운 8가지 기술통계량(평균, 중앙값, 최솟값, 최댓값, 분위수, 분산, 표준편차, 최빈값)의 개념을 정.. 2025. 2. 8. [혼공분석] 3주차_데이터 정제하기 03-1 불필요한 데이터 삭제하기 데이터 정제: 데이터에서 손상되거나 부정확한 부분을 수정하고, 불필요한 데이터를 삭제하거나 불완전한 값을 교체하는 등의 작업, 데이터를 분석 목적에 맞게 변환하는 데이터 랭글링 또는 데이터 먼징의 일부로 수행될 수 있음 열 삭제하기 ns_book = ns_df.loc[:, '번호':'등록일자']selected_columns = ns_df.columns != 'Unnamed: 13'ns_book = ns_df.loc[:, selected_columns]ns_book = ns_df.drop('Unnamed: 13', axis=1)ns_book.drop('주제분류번호', axis=1, inplace=True)ns_book = ns_df.dropna(axis=1)ns_book.. 2025. 1. 20. [혼공분석] 2주차_데이터 수집하기 02-1 API 사용하기 API(Application Programming Interface): 두 프로그램이 서로 대화하기 위한 방법을 정의한 것애플리케이션 간의 통신을 위해서는 웹 기반의 API가 널리 사용 HTTP: 인터넷에서 웹 페이지를 전송하는 기본 통신 방법데이터 분석가는 웹 기반 API를 사용하는 방법을 아는 것이 중요! HTML: 웹 브라우저가 화면에 표시할 수 있는 문서의 한 종류이자 웹 페이지를 위한 표준 언어웹 기반 API는 주로 JSON이나 XML을 많이 사용 JSON: 파이썬의 딕셔너리와 리스트를 중첩해 놓은 것과 비슷, 키와 값을 콜론으로 연결d = {"name": "혼자 공부하는 데이터 분석"}print(d['name'])JSON 형식으로 만든 파이썬 딕셔너리import jso.. 2025. 1. 14. 이전 1 2 다음