Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Axis
- seaborn
- value_counts
- stripplot
- 한빛미디어
- lmplot
- LOC
- swarmplot
- catplot
- 구조체
- const
- boxplot
- 열혈c++
- bins
- expand=true
- class
- 혼공학습단
- df.t
- 참조자
- c++
- matplotlib
- plot
- 혼공파
- STR
- 혼공단
- 포인터
- 동적할당
- 클래스
- histplot
- violinplot
Archives
- Today
- Total
yEverything
문자열 필터링 본문
import pandas as pd
df = pd.read_csv('albums.csv', encoding='latin1')
df.head(20)
albums.csv파일을 읽는다.
여러 앨범들이 있는 것을 알 수 있다.
df['Genre'].unique()
어떤 장르들이 있는지 살펴본다.
엄청 많다..................
df[df['Genre'] == 'Blues']
장르가 Blues인 것만 필터링해본다.
근데 이러면 Blues가 장르에 첫 번째로 들어있는 경우들만 나온다.
df[df['Genre'].str.contains('Blues')]
이렇게 하면 Blues가 포함된 모든 경우들을 알 수 있다. 굳이 첫 번째로 들어가 있지 않은 경우들도!!
위와 같이 Blues가 첫 번째로 들어가 있지 않은 경우들도 나오는 것을 알 수 있다.
df[df['Genre'].str.startswith('Blues')]
startswith를 통해 Blues로 시작하는 경우들을 필터링.
df['Contains Blues'] = df['Genre'].str.contains('Blues')
df
Contains Blues 컬럼에 장르에 Blues를 포함하고 있는 것들을 불린 값으로 저장한다.
Contains Blues에 False, True로 값들이 있는 것을 확인할 수 있다.
'Data_analysis > Google_colaboratory' 카테고리의 다른 글
데이터 합치기 (0) | 2024.05.03 |
---|---|
카테고리로 분류 (0) | 2024.05.03 |
문자열 분리 (0) | 2024.05.03 |
새로운 값 계산하기 (0) | 2024.05.03 |
EDA (0) | 2024.05.03 |