데이터 분석27 [혼공분석] 6주차_복잡한 데이터 표현하기 06-1 객체지향 API로 그래프 꾸미기 pyplot 방식: matplotlib.pyplot에 있는 함수를 사용객체지향 API: 명시적으로 피겨 객체와 서브플롯 객체를 만들고 이 객체의 메서드를 사용import sysif 'google.colab' in sys.modules: !echo 'debconf debconf/frontend select Noninteractive' | debconf-set-selections #나눔폰트 설치 !sudo apt-get -qq -y install fonts-nanum import matplotlib.font_manager as fm font_files = fm.findSystemFonts(fontpaths=['/usr/share/fonts/truetype/n.. 2025. 2. 23. [SQL 데이터베이스 입문] 1주차 Part 1. 데이터베이스의 개요 1.1 데이터베이스란 데이터베이스: 구조화된 데이터의 집합. 다양한 정보를 디지털화해 저장 및 관리함으로써, 사용자가 빠르고 효율적으로 데이터를 활용할 수 있도록 한다.DBMS: 데이터베이스를 관리하기 위한 프로그램DBMS의 기능효율적 데이터 관리데이터 무결성 유지동시성 제어보안백업 및 복구쉬운 데이터 접근성데이터 추상화MYSQL의 장점무료 오픈 소스광범위한 사용풍부한 문서 및 커뮤니티표준 SQL 지원SQL: 데이터베이스를 활용하기 위한 표준화된 질의 언어 1.2 데이터 저장 형식데이터베이스 파일데이터 파일로그 파일인덱스 파일설정 파일메타데이터 파일테이블: 일련의 데이터를 열과 행으로 저장하는.. 2025. 2. 22. 5장 연습문제 1번find() 함수를 사용하면 태그도 같이 출력되므로 .text를 붙여서 해당 태그의 텍스트만 가져온다. 2번 3번find() 함수를 사용하면 자동으로 첫 번째만 나오니까 find만 썼는데,오른쪽과 같이 쓰면 가져온 p태그들 중 0번째와 1번째만 가져오라는 의미를 더 잘 나타낼 수 있는 것 같다. 2025. 2. 16. 05장 웹 데이터 수집 라이브러리, 뷰티풀수프 05.1 웹 데이터 수집 기본 개념 알아보기 robot.txt: 웹 사이트 소유자가 크롤러에게 제공하는 지침서, 접근할 수 있는 영역과 없는 영역을 명확히 정의웹 크롤링: 크롤러라는 프로그램을 인터넷으로 보내 인터넷 콘텐츠를 자동으로 수집하고 색인화하는 것웹 스크래핑: 특정 웹 사이트에서 특정 페이지의 데이터 수집을 목표로 하는 프로그램요청: 서버에 데이터 요청: 서버에 데이터를 요청하는 행위응답: 서버가 데이터 보내줌서버가 요청에 대해 데이터를 보내주는 행위파이썬 + 뷰티풀수프: 데이터 속에서 원하는 데이터 찾기응답으로 받은 데이터에서 원하는 값만 찾을 때 파이썬과 뷰티풀수프 사용, 원하는 데이터의 위치는 CSS Selector로 지정soup.select('p.scraping')soup.select('.. 2025. 2. 16. [혼공분석] 5주차_데이터 시각화하기 05-1 맷플롯립 기본 요소 알아보기plt.figure(figsize=(9, 6)) Figure: 모든 그래프 구성 요소를 담고 있는 최상위 객체figure() 함수를 사용하여 피겨 객체를 만들면 그래프 옵션 조절 가능figsize 매개변수에 그래프의 크기를 튜플로 지정, 기본 크기는 (6, 4), 각각 너비와 높이, 단위는 인치plt.figure(dpi=200)DPI(dot per inch): 1인치를 몇 개의 점(픽셀)으로 표현하는지, 인쇄 출력물의 해상도를 의미PPI(pixel per inch): 1인치를 몇 개의 픽셀로 표현하는지, 화면해상도를 의미(책에는 dpi가 72인 버전이라 두 배인 144를 입력했는데 현재 내가 사용하고 있는 버전은 dpi가 100이라 200을 입력하였다.)dpi 매개변수.. 2025. 2. 15. 4장 연습문제 1번 2번kind='scatter'이 기본형이라 적지 않았는데 기본이어도 따로 적어두는게 더 직관적이라서 적어야겠다.title을 써서 y값을 직접 실행해가며 맞춰봤는데 suptitle도 사용할 수 있다는 걸 알아두자. 3번suptitle하고도 y값을 따로 정해줘야 제목이 보기 편하게 조정되는 것 같다.diag_kind를 kde로 따로 지정해줬는데 안 했는데도 자동으로 kde가 나오는 이유를 챗gpt에게 물어봤다.penguins 데이터셋의 변수들이 연속형이기 때문에 자동값이 kde로 설정되어 따로 지정하지 않아도 되는 것을 알게 되었다. 2025. 2. 8. 이전 1 2 3 4 5 다음