yEverything

문자열 필터링 본문

Data_analysis/Google_colaboratory

문자열 필터링

yEvery 2024. 5. 3. 18:07
import pandas as pd

df = pd.read_csv('albums.csv', encoding='latin1')
df.head(20)

albums.csv파일을 읽는다.

여러 앨범들이 있는 것을 알 수 있다.

df['Genre'].unique()

어떤 장르들이 있는지 살펴본다.

엄청 많다..................

df[df['Genre'] == 'Blues']

장르가 Blues인 것만 필터링해본다.

근데 이러면 Blues가 장르에 첫 번째로 들어있는 경우들만 나온다.

df[df['Genre'].str.contains('Blues')]

이렇게 하면 Blues가 포함된 모든 경우들을 알 수 있다. 굳이 첫 번째로 들어가 있지 않은 경우들도!!

위와 같이 Blues가 첫 번째로 들어가 있지 않은 경우들도 나오는 것을 알 수 있다.

df[df['Genre'].str.startswith('Blues')]

startswith를 통해 Blues로 시작하는 경우들을 필터링.

df['Contains Blues'] = df['Genre'].str.contains('Blues')
df

Contains Blues 컬럼에 장르에 Blues를 포함하고 있는 것들을 불린 값으로 저장한다.

Contains Blues에 False, True로 값들이 있는 것을 확인할 수 있다.

 

'Data_analysis > Google_colaboratory' 카테고리의 다른 글

데이터 합치기  (0) 2024.05.03
카테고리로 분류  (0) 2024.05.03
문자열 분리  (0) 2024.05.03
새로운 값 계산하기  (0) 2024.05.03
EDA  (0) 2024.05.03