23. 필터링

1) 불린 인덱싱

import seaborn as sns

titanic = sns.load_dataset('titanic')

mask1 = (titanic.age >=10) & (titanic.age <20)
# 10세 이상 20세 미만

df_teenage = titanic.loc[mask1, :]

print(df_teenage.head())

mask2 = (titanic.age <10) & (titanic.sex == 'female')
# 10세 미만 여자

df_female_under10 = titanic.loc[mask2, :]

print(df_female_under10.head())

mask3 = (titanic.age <10) | (titanic.age > 60)
# 10세 미만 혹은 60세 초과

df = titanic.loc[mask3, :]

print(df.head())

2) isin() 메소드 활용

import seaborn as sns

titanic = sns.load_dataset('titanic')
isin_filter = titanic['sibsp'].isin([3,4,5])
# sibsp 열의 값이 3 혹은 4 혹은 5인 값만 추출

df_isin = titanic[isin_filter]
print(df_isin.head())

좋은 웹페이지 즐겨찾기