23. 필터링
1) 불린 인덱싱
import seaborn as sns
titanic = sns.load_dataset('titanic')
mask1 = (titanic.age >=10) & (titanic.age <20)
# 10세 이상 20세 미만
df_teenage = titanic.loc[mask1, :]
print(df_teenage.head())
mask2 = (titanic.age <10) & (titanic.sex == 'female')
# 10세 미만 여자
df_female_under10 = titanic.loc[mask2, :]
print(df_female_under10.head())
mask3 = (titanic.age <10) | (titanic.age > 60)
# 10세 미만 혹은 60세 초과
df = titanic.loc[mask3, :]
print(df.head())
2) isin() 메소드 활용
import seaborn as sns
titanic = sns.load_dataset('titanic')
isin_filter = titanic['sibsp'].isin([3,4,5])
# sibsp 열의 값이 3 혹은 4 혹은 5인 값만 추출
df_isin = titanic[isin_filter]
print(df_isin.head())
Author And Source
이 문제에 관하여(23. 필터링), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://velog.io/@ddaddo_data/23.-필터링저자 귀속: 원작자 정보가 원작자 URL에 포함되어 있으며 저작권은 원작자 소유입니다.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)