본문 바로가기

데이터 분석29

06장 넷플릭스 데이터 분석 프로젝트 import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns사용할 라이브러리들을 불러와서 별칭으로 지정한다.netflix = pd.read_csv('netflix_titles.csv')netflix.head()list(netflix.columns) #열 이름 확인netflix.head(3) netflix.info() #요약 정보 확인데이터셋을 불러와서 간단하게 확인한다.for i in netflix.columns: missingValueRate = netflix[i].isna().sum() / len(netflix) * 100 if missingValueRate > 0: print("{} .. 2025. 2. 23.
혼공학습단 13기 활동 회고 6주간의 혼공학습단이 끝났다.예전에는 혼자 공부하는 파이썬을 했었는데 이번에는 데이터 분석에 대한 관심이 생겨혼자 공부하는 데이터 분석 with 파이썬 책을 선택해서 진행했다.매주차마다 진행한 내용을 업로드해야 하기 때문에 책을 완독할 수 밖에 없는 것 같다.중간 중간 도서 이벤트나 간식도 보내주셔서 더 열심히 할 수 있었던 것 같다.같은 책을 사서 함께 공부하는 사람들이 있다는 것 또한 공부를 할 때 덜 외롭게 느껴지는 것 같다.다음에는 R이나 SQL을 도전해봐야겠다. 2025. 2. 23.
[혼공분석] 6주차_복잡한 데이터 표현하기 06-1 객체지향 API로 그래프 꾸미기 pyplot 방식: matplotlib.pyplot에 있는 함수를 사용객체지향 API: 명시적으로 피겨 객체와 서브플롯 객체를 만들고 이 객체의 메서드를 사용import sysif 'google.colab' in sys.modules: !echo 'debconf debconf/frontend select Noninteractive' | debconf-set-selections #나눔폰트 설치 !sudo apt-get -qq -y install fonts-nanum import matplotlib.font_manager as fm font_files = fm.findSystemFonts(fontpaths=['/usr/share/fonts/truetype/n.. 2025. 2. 23.
[SQL 데이터베이스 입문] 1주차 Part 1. 데이터베이스의 개요 1.1 데이터베이스란 데이터베이스: 구조화된 데이터의 집합.                       다양한 정보를 디지털화해 저장 및 관리함으로써,                       사용자가 빠르고 효율적으로 데이터를 활용할 수 있도록 한다.DBMS: 데이터베이스를 관리하기 위한 프로그램DBMS의 기능효율적 데이터 관리데이터 무결성 유지동시성 제어보안백업 및 복구쉬운 데이터 접근성데이터 추상화MYSQL의 장점무료 오픈 소스광범위한 사용풍부한 문서 및 커뮤니티표준 SQL 지원SQL: 데이터베이스를 활용하기 위한 표준화된 질의 언어 1.2 데이터 저장 형식데이터베이스 파일데이터 파일로그 파일인덱스 파일설정 파일메타데이터 파일테이블: 일련의 데이터를 열과 행으로 저장하는.. 2025. 2. 22.
5장 연습문제 1번find() 함수를 사용하면 태그도 같이 출력되므로 .text를 붙여서 해당 태그의 텍스트만 가져온다. 2번 3번find() 함수를 사용하면 자동으로 첫 번째만 나오니까 find만 썼는데,오른쪽과 같이 쓰면 가져온 p태그들 중 0번째와 1번째만 가져오라는 의미를 더 잘 나타낼 수 있는 것 같다. 2025. 2. 16.
05장 웹 데이터 수집 라이브러리, 뷰티풀수프 05.1 웹 데이터 수집 기본 개념 알아보기 robot.txt: 웹 사이트 소유자가 크롤러에게 제공하는 지침서, 접근할 수 있는 영역과 없는 영역을 명확히 정의웹 크롤링: 크롤러라는 프로그램을 인터넷으로 보내 인터넷 콘텐츠를 자동으로 수집하고 색인화하는 것웹 스크래핑: 특정 웹 사이트에서 특정 페이지의 데이터 수집을 목표로 하는 프로그램요청: 서버에 데이터 요청: 서버에 데이터를 요청하는 행위응답: 서버가 데이터 보내줌서버가 요청에 대해 데이터를 보내주는 행위파이썬 + 뷰티풀수프: 데이터 속에서 원하는 데이터 찾기응답으로 받은 데이터에서 원하는 값만 찾을 때 파이썬과 뷰티풀수프 사용, 원하는 데이터의 위치는 CSS Selector로 지정soup.select('p.scraping')soup.select('.. 2025. 2. 16.