'Data_analysis/Jupyter_notebook' 카테고리의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록Data_analysis/Jupyter_notebook (8)

yEverything

KDE Plot

!pip install seaborn==0.9.0 seaborn을 통해서 더 다양한 그래프들을 그릴 수 있다. 위와 같이 작성해서 seaborn을 설치한다. 0.9.0버전으로 seaborn이 성공적으로 설치된 것을 알 수 있다. import pandas as pd import seaborn as sns pandas는 보통 pd로, seaborn은 sns로 간단하게 사용한다. body_df = pd.read_csv('body.csv', index_col=0) body_df.head() 위와 같은 데이터를 확인할 수 있다. body_df['Height'] Heignt column의 데이터들이다. body_df['Height'].value_counts() value_counts()는, 키 별 값들이 몇 개 있..

Data_analysis/Jupyter_notebook 2024. 4. 22. 22:00

히스토그램

import pandas as pd df = pd.read_csv('body.csv', index_col=0) df.head(10) head안에 숫자를 입력하면, 앞에서부터 숫자만큼의 데이터들을 볼 수 있다. index_col=0은 0 번째 줄에 있는 값들을 column으로 사용하겠다는 것을 의미한다. 0으로 설정할 때는 기본값이 0이기 때문에 굳이 적지 않아도 된다. 키랑 몸무게에 대한 데이터가 담겨 있다는 것을 알 수 있다. df.plot(kind='hist', y='Height') 히스토그램을 그리기 위해서는 kind에 hist를 전달해주고, 보고 싶은 데이터에 대해 y에 전달한다. 데이터에 있는 키들의 분포를 알 수 있다. df.plot(kind='hist', y='Height', bins= 15..

Data_analysis/Jupyter_notebook 2024. 4. 22. 21:29

박스 플롯

%matplotlib inline import pandas as pd df = pd.read_csv('exam.csv', index_col=0) df.head() df.head()를 하면 기본적으로 앞의 5개의 데이터들을 보여준다. df['math score'].describe() math score column의 describe를 하면 통계적인 데이터들을 결과로 얻을 수 있다. 평균값이나, 최솟값, 25%, 50%, 75%지점과 같은 값들을 알 수 있다. df.plot(kind='box', y='math score') kind에 box를 전달하면 박스 플롯이 그려지고, y에 나타내고 싶은 column을 전달하면 된다. describe메서드를 통해 얻은 값들에 대한 대부분의 정보들을 이렇게 박스 플롯을 ..

Data_analysis/Jupyter_notebook 2024. 4. 22. 21:16

파이 그래프

%matplotlib inline import pandas as pd df = pd.read_csv('broadcast.csv', index_col=0) df 방송사들의 연도별 시청률이 들어있는 csv파일을 df에서 읽는다. df.loc[2017] loc를 통해 2017 행에 들어있는 데이터들을 본다. 방송사 별 2017년도 시청률이 실행결과 출력된다. df.loc[2017].plot(kind='pie') plot메서드의 kind에 pie를 전달하면, 그러면 이렇게 파이 그래프를 통해 방송사들의 시청률이 원에서 어느 정도의 비율을 차지하는 지를 볼 수 있다.

Data_analysis/Jupyter_notebook 2024. 4. 22. 20:53

막대 그래프

%matplotlib inline import pandas as pd df = pd.read_csv('sports.csv', index_col=0) df plot을 사용하기 위해 맨 첫 줄 작성. df에 sports.csv 읽기, df 출력. sports.csv에는 위와 같은 데이터들이 들어있다. df.plot() plot메서드를 사용하면, 디폴트가 선 그래프이므로, 해당 데이터에 대해서 그래프를 그려준다. 운동별 남성과 여성의 수가 그래프로 나타나있다. df.plot(kind='bar') kind에 'bar'를 전달해주면, 막대그래프가 출력된다. 선 그래프보다 남성과 여성을 비교하는 것이 훨씬 보기 쉽다. df.plot(kind='barh') bar대신 barh라고 전달하면, 옆으로 누워있는 막대그래프..

Data_analysis/Jupyter_notebook 2024. 4. 21. 23:44

선 그래프

%matplotlib inline import pandas as pd plot을 사용하려면 %matplotlib inline을 작성해야 한다. df = pd.read_csv('broadcast.csv', index_col=0) df df에 pd를 이용해서 csv 파일을 읽는다. csv파일을 이렇게 표로 정리해준다. df.plot(kind= 'line') plot을 이용해 선 그래프를 그려준다. 디폴트 값이 line이라 적지 않아도 된다. 이렇게 연도변 시청률을 선 그래프로 보여준다. df.plot(y='KBS') y에 KBS를 입력하면, KBS의 그래프만을 보여준다. df.plot(y=['KBS', 'JTBC']) 리스트 형식으로 여러 개를 전달할 수 도 있다. df[['KBS', 'JTBC']].plo..

Data_analysis/Jupyter_notebook 2024. 4. 21. 23:29

Numpy

import numpy array1 = numpy.array([2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31]) array1 numpy를 사용하기 위해 import한다. array1에 numpy를 사용해 array를 저장한다. array1을 출력한다. type(array1) array1의 타입을 알아본다. numpy.ndarray라고 나온다. numpy의 ndarray, n차원 배열이다. array1.shape array1의 shape을 출력한다. 11개가 들어있으므로 위와 같이 출력된다. array2 = numpy.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]) array2 array2에 다른 numpy array를 저장하고 출력한..

Data_analysis/Jupyter_notebook 2024. 4. 21. 21:54

Jupyter Notebook 연습

print("Hello world!") Hello world! 출력 x = 5 print(x) y = 17 결과: 5 x에 5 저장 x 출력 y에 17 저장 print(y) 결과: 17 y = 50 print(y) 결과: 50 뒤에 y에 50을 저장한 뒤 위에 써놨던 y출력을 다시 실행하면 50으로 출력됨. # 가장 큰 제목 ## 두 번째 큰 제목 ### 세 번째 큰 제목 그냥 글쓰기 위와 같이 작성한 뒤 실행하면, 아래와 같은 출력 결과를 얻을 수 있다. **두껍게** *날려* 마찬가지이다. * list 1 * list 2 * list 3 이것도 역시. 1. 안녕 2. 녕안 3. 수고 ~~물결~~ __언더바__ _언더바하나_ 코딩 강의는 역시 [코드잇](https://www.codeit.kr)이죠! 이..

Data_analysis/Jupyter_notebook 2024. 4. 21. 21:41

이전 Prev 1 Next 다음

목록Data_analysis/Jupyter_notebook (8)

yEverything

티스토리툴바