일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- stripplot
- lmplot
- const
- catplot
- 혼공학습단
- Axis
- 혼공파
- 클래스
- 구조체
- plot
- value_counts
- matplotlib
- 한빛미디어
- histplot
- STR
- 포인터
- swarmplot
- boxplot
- violinplot
- c++
- class
- 열혈c++
- bins
- expand=true
- 혼공단
- 동적할당
- LOC
- seaborn
- df.t
- 참조자
- Today
- Total
목록분류 전체보기 (33)
yEverything
import pandas as pdimport seaborn as snsdf = pd.read_csv('/young_survey.csv')df.head()young_survey.csv를 읽는다.5개의 행과 147개의 열이 있는 것을 알 수 있다. 음악에 관한 설문조사였나보다.basic_info = df.iloc[:, 140:]basic_info.head()basic_info에 140번 column부터의 값들을 저장한다.이 열들에는 다른 열들과는 다르게 기본적인 정보에 대한 것들을 담고 있다.basic_info.describe()이 열들의 통계값들을 살펴본다.basic_info['Gender'].value_counts()성별을 카운트해보자.여자는 587명, 남자는 405명이다.basic_info['Hand..
!pip install seaborn==0.9.0seaborn을 0.9.0 버전으로 설치하기import pandas as pdimport seaborn as snsbody_df = pd.read_csv('/body.csv', index_col=0)body_df.head()body.csv 파일을 읽고 head를 통해 맨 위 5개의 데이터들만 확인해보자.키와 몸무게에 대한 데이터들이 들어있는 것을 알 수 있다.sns.lmplot(data=body_df, x='Height', y='Weight')lmplot으로 x축에는 키, y축에는 몸무게에 대해 그래프를 그려보자.요런 그래프가 그려지는 것을 확인할 수 있다.키가 크다고 몸무게가 많이 나가는 것도 아니고, 키가 작다고 몸무게가 적게 나가는 것도 아니라는 것을..
여기서부터는 jupyter notebook사용 시 다운받은 파이썬 버전과 그 외 것들의 여러 충돌이 자꾸 발생하여 google colaboratory를 사용해 실습했다. 딱히 사용방법에 있어서 큰 차이도 없고, 웹을 통해 간단하게 할 수 있을 뿐더러, 로컬에서의 충돌같은 것들이 잘 일어나지 않아 쓰기 좋은 것 같다.import pandas as pdimport seaborn as snspandas 와 seaborn을 import해 각각 pd와 sns라고 간단히 사용한다.df = pd.read_csv('titanic.csv')dfdf['Age'].plot(kind='hist')df에 titanic.csv 파일을 읽고 df를 출력했다.df의 Age column을 히스토그램으로 그려본다.연령대별로 히스토그램이..
!pip install seaborn==0.9.0 seaborn을 통해서 더 다양한 그래프들을 그릴 수 있다. 위와 같이 작성해서 seaborn을 설치한다. 0.9.0버전으로 seaborn이 성공적으로 설치된 것을 알 수 있다. import pandas as pd import seaborn as sns pandas는 보통 pd로, seaborn은 sns로 간단하게 사용한다. body_df = pd.read_csv('body.csv', index_col=0) body_df.head() 위와 같은 데이터를 확인할 수 있다. body_df['Height'] Heignt column의 데이터들이다. body_df['Height'].value_counts() value_counts()는, 키 별 값들이 몇 개 있..
import pandas as pd df = pd.read_csv('body.csv', index_col=0) df.head(10) head안에 숫자를 입력하면, 앞에서부터 숫자만큼의 데이터들을 볼 수 있다. index_col=0은 0 번째 줄에 있는 값들을 column으로 사용하겠다는 것을 의미한다. 0으로 설정할 때는 기본값이 0이기 때문에 굳이 적지 않아도 된다. 키랑 몸무게에 대한 데이터가 담겨 있다는 것을 알 수 있다. df.plot(kind='hist', y='Height') 히스토그램을 그리기 위해서는 kind에 hist를 전달해주고, 보고 싶은 데이터에 대해 y에 전달한다. 데이터에 있는 키들의 분포를 알 수 있다. df.plot(kind='hist', y='Height', bins= 15..
%matplotlib inline import pandas as pd df = pd.read_csv('exam.csv', index_col=0) df.head() df.head()를 하면 기본적으로 앞의 5개의 데이터들을 보여준다. df['math score'].describe() math score column의 describe를 하면 통계적인 데이터들을 결과로 얻을 수 있다. 평균값이나, 최솟값, 25%, 50%, 75%지점과 같은 값들을 알 수 있다. df.plot(kind='box', y='math score') kind에 box를 전달하면 박스 플롯이 그려지고, y에 나타내고 싶은 column을 전달하면 된다. describe메서드를 통해 얻은 값들에 대한 대부분의 정보들을 이렇게 박스 플롯을 ..
%matplotlib inline import pandas as pd df = pd.read_csv('broadcast.csv', index_col=0) df 방송사들의 연도별 시청률이 들어있는 csv파일을 df에서 읽는다. df.loc[2017] loc를 통해 2017 행에 들어있는 데이터들을 본다. 방송사 별 2017년도 시청률이 실행결과 출력된다. df.loc[2017].plot(kind='pie') plot메서드의 kind에 pie를 전달하면, 그러면 이렇게 파이 그래프를 통해 방송사들의 시청률이 원에서 어느 정도의 비율을 차지하는 지를 볼 수 있다.
%matplotlib inline import pandas as pd df = pd.read_csv('sports.csv', index_col=0) df plot을 사용하기 위해 맨 첫 줄 작성. df에 sports.csv 읽기, df 출력. sports.csv에는 위와 같은 데이터들이 들어있다. df.plot() plot메서드를 사용하면, 디폴트가 선 그래프이므로, 해당 데이터에 대해서 그래프를 그려준다. 운동별 남성과 여성의 수가 그래프로 나타나있다. df.plot(kind='bar') kind에 'bar'를 전달해주면, 막대그래프가 출력된다. 선 그래프보다 남성과 여성을 비교하는 것이 훨씬 보기 쉽다. df.plot(kind='barh') bar대신 barh라고 전달하면, 옆으로 누워있는 막대그래프..