본문 바로가기

분류 전체보기40

[SQL 데이터베이스 입문] 1주차 Part 1. 데이터베이스의 개요 1.1 데이터베이스란 데이터베이스: 구조화된 데이터의 집합. 다양한 정보를 디지털화해 저장 및 관리함으로써, 사용자가 빠르고 효율적으로 데이터를 활용할 수 있도록 한다.DBMS: 데이터베이스를 관리하기 위한 프로그램DBMS의 기능효율적 데이터 관리데이터 무결성 유지동시성 제어보안백업 및 복구쉬운 데이터 접근성데이터 추상화MYSQL의 장점무료 오픈 소스광범위한 사용풍부한 문서 및 커뮤니티표준 SQL 지원SQL: 데이터베이스를 활용하기 위한 표준화된 질의 언어 1.2 데이터 저장 형식데이터베이스 파일데이터 파일로그 파일인덱스 파일설정 파일메타데이터 파일테이블: 일련의 데이터를 열과 행으로 저장하는.. 2025. 2. 22.

5장 연습문제 1번find() 함수를 사용하면 태그도 같이 출력되므로 .text를 붙여서 해당 태그의 텍스트만 가져온다. 2번 3번find() 함수를 사용하면 자동으로 첫 번째만 나오니까 find만 썼는데,오른쪽과 같이 쓰면 가져온 p태그들 중 0번째와 1번째만 가져오라는 의미를 더 잘 나타낼 수 있는 것 같다. 2025. 2. 16.

05장 웹 데이터 수집 라이브러리, 뷰티풀수프 05.1 웹 데이터 수집 기본 개념 알아보기 robot.txt: 웹 사이트 소유자가 크롤러에게 제공하는 지침서, 접근할 수 있는 영역과 없는 영역을 명확히 정의웹 크롤링: 크롤러라는 프로그램을 인터넷으로 보내 인터넷 콘텐츠를 자동으로 수집하고 색인화하는 것웹 스크래핑: 특정 웹 사이트에서 특정 페이지의 데이터 수집을 목표로 하는 프로그램요청: 서버에 데이터 요청: 서버에 데이터를 요청하는 행위응답: 서버가 데이터 보내줌서버가 요청에 대해 데이터를 보내주는 행위파이썬 + 뷰티풀수프: 데이터 속에서 원하는 데이터 찾기응답으로 받은 데이터에서 원하는 값만 찾을 때 파이썬과 뷰티풀수프 사용, 원하는 데이터의 위치는 CSS Selector로 지정soup.select('p.scraping')soup.select('.. 2025. 2. 16.

[혼공분석] 5주차_데이터 시각화하기 05-1 맷플롯립 기본 요소 알아보기plt.figure(figsize=(9, 6)) Figure: 모든 그래프 구성 요소를 담고 있는 최상위 객체figure() 함수를 사용하여 피겨 객체를 만들면 그래프 옵션 조절 가능figsize 매개변수에 그래프의 크기를 튜플로 지정, 기본 크기는 (6, 4), 각각 너비와 높이, 단위는 인치plt.figure(dpi=200)DPI(dot per inch): 1인치를 몇 개의 점(픽셀)으로 표현하는지, 인쇄 출력물의 해상도를 의미PPI(pixel per inch): 1인치를 몇 개의 픽셀로 표현하는지, 화면해상도를 의미(책에는 dpi가 72인 버전이라 두 배인 144를 입력했는데 현재 내가 사용하고 있는 버전은 dpi가 100이라 200을 입력하였다.)dpi 매개변수.. 2025. 2. 15.

4장 연습문제 1번 2번kind='scatter'이 기본형이라 적지 않았는데 기본이어도 따로 적어두는게 더 직관적이라서 적어야겠다.title을 써서 y값을 직접 실행해가며 맞춰봤는데 suptitle도 사용할 수 있다는 걸 알아두자. 3번suptitle하고도 y값을 따로 정해줘야 제목이 보기 편하게 조정되는 것 같다.diag_kind를 kde로 따로 지정해줬는데 안 했는데도 자동으로 kde가 나오는 이유를 챗gpt에게 물어봤다.penguins 데이터셋의 변수들이 연속형이기 때문에 자동값이 kde로 설정되어 따로 지정하지 않아도 되는 것을 알게 되었다. 2025. 2. 8.

04장 데이터 시각화 라이브러리, 시본 04.1 시본 기본 개념 알아보기import seaborn as snssns.get_dataset_names()시본(seaborn)맷플롯립 기반의 데이터 시각화 라이브러리맷플롯립보다 간편하게 사용, 효과적으로 모양을 다듬을 수 있다.통계 데이터를 시각적으로 표현하는데 적절, 더 높은 수준의 그래프 생성 가능자체 데이터셋이 포함04.2 여섯 가지 그래프 이해하기 범주형 변수 산점도 그래프 sns.stripplot(x='day', y='tip', hue='sex', data=tips, alpha=0.7, ax=ax1)sns.swarmplot(x='day', y='tip', hue='sex', data=tips, palette='Set2', alpha=0.7, ax=ax2) 범주형 변수와 연속형 변수 간의 .. 2025. 2. 8.

이전 1 2 3 4 5 ··· 7 다음

티스토리툴바