일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- boxplot
- catplot
- expand=true
- 혼공파
- 혼공학습단
- STR
- c++
- violinplot
- histplot
- 한빛미디어
- 열혈c++
- seaborn
- const
- 혼공단
- 참조자
- 포인터
- class
- 클래스
- bins
- df.t
- 동적할당
- plot
- swarmplot
- Axis
- lmplot
- LOC
- stripplot
- matplotlib
- 구조체
- value_counts
- Today
- Total
목록STR (2)
yEverything
import pandas as pddf = pd.read_csv('albums.csv', encoding='latin1')df.head(20)albums.csv파일을 읽는다.여러 앨범들이 있는 것을 알 수 있다.df['Genre'].unique()어떤 장르들이 있는지 살펴본다.엄청 많다..................df[df['Genre'] == 'Blues']장르가 Blues인 것만 필터링해본다.근데 이러면 Blues가 장르에 첫 번째로 들어있는 경우들만 나온다.df[df['Genre'].str.contains('Blues')]이렇게 하면 Blues가 포함된 모든 경우들을 알 수 있다. 굳이 첫 번째로 들어가 있지 않은 경우들도!!위와 같이 Blues가 첫 번째로 들어가 있지 않은 경우들도 나오는 것..
import pandas as pddf = pd.read_csv('parks.csv')df.head()parks.csv파일을 읽어본다.공원에 관련된 데이터들이 있는 것을 알 수 있다.address = df['소재지도로명주소'].str.split(n=1, expand=True)addressstr.split을 사용해서 문자열을 끊어서 쓸 수 있다. 디폴트는 스페이스를 기준으로 끊는다. n=1은 한 번 끊는다. 소재지도로명주소를 스페이스 기준으로 한 번 끊어서 앞 부분은 0 컬럼에 나머지 부분들은 1컬럼에 있는 것을 알 수 있다.df['관할구역'] = address[0]df관할구역 컬럼을 새로 만들어서 여기에 address의 0번째 들어있는 값들을 저장해준다. 소재지도로명주소의 끊어진 앞부분들이 관할구역 컬럼..