yEverything

문자열 분리 본문

Data_analysis/Google_colaboratory

문자열 분리

yEvery 2024. 5. 3. 17:53
import pandas as pd

df = pd.read_csv('parks.csv')
df.head()

parks.csv파일을 읽어본다.

공원에 관련된 데이터들이 있는 것을 알 수 있다.

address = df['소재지도로명주소'].str.split(n=1, expand=True)
address

str.split을 사용해서 문자열을 끊어서 쓸 수 있다. 디폴트는 스페이스를 기준으로 끊는다. n=1은 한 번 끊는다. 

소재지도로명주소를 스페이스 기준으로 한 번 끊어서 앞 부분은 0 컬럼에 나머지 부분들은 1컬럼에 있는 것을 알 수 있다.

df['관할구역'] = address[0]
df

관할구역 컬럼을 새로 만들어서 여기에 address의 0번째 들어있는 값들을 저장해준다. 

소재지도로명주소의 끊어진 앞부분들이 관할구역 컬럼에 들어가 있는 것을 알 수 있다.

 

'Data_analysis > Google_colaboratory' 카테고리의 다른 글

카테고리로 분류  (0) 2024.05.03
문자열 필터링  (0) 2024.05.03
새로운 값 계산하기  (0) 2024.05.03
EDA  (0) 2024.05.03
LM plot  (0) 2024.05.03