Pandas|||데이터 부족|pd.dropna()함수 의 용법 설명 필터 링
DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
Remove missing values.
pd.dropna()함수(공식 문서)는 데이터 의 부족 한 데 이 터 를 걸 러 내 는 데 사 용 됩 니 다.데이터 가 부족 하면 pandas 에 NaN 으로 표시 합 니 다.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), index = list('abcde'), columns = ['one', 'two', 'three']) # 5 3
df.ix[1, :-1] = np.nan #
df.ix[1:-1, 2] = np.nan
print(df)
df.dropna() #
parameters
상세 하 게 해석 하 다
axis
default 0 줄,1 열
how
{'any','all'},default'any'는 부족 한 값 을 가 진 모든 줄 을 말 합 니 다.all'은 모든 값 이 부족 한 줄 을 제거 하 는 것 을 말 합 니 다.
thresh
int,int 개 비 어 있 는 줄 유지
subset
특정 열 에 부족 한 값 삭제 처리
inplace
이것 은 매우 흔 하 다.
추가:Python-pandas 의 dropna()방법-빈 값 을 포함 하 는 줄,열 을 버 립 니 다.
0.요약
dropna()방법 은 DataFrame 형식 데이터 의 빈 값(부족 값)을 찾 을 수 있 으 며,빈 값 이 있 는 줄/열 을 삭제 한 후 새로운 DataFrame 을 반환 값 으로 되 돌려 줍 니 다.
1.함수 상세 설명
함수 형식:dropna(axis=0,how='any',thresh=None,subset=None,inplace=False)
인자:
축.0 또는'index'는 줄 별로 삭제 하 는 것 을 표시 합 니 다.1 또는'columns'는 열 에 따라 삭제 하 는 것 을 표시 합 니 다.
how:선별 방식.'any'는 이 줄/열 에 빈 값 이 하나 이상 있 으 면 이 줄/열 을 삭제 합 니 다.'all',이 줄/열 이 모두 빈 값 임 을 표시 하면 이 줄/열 을 삭제 합 니 다.
thresh:비 공 원소 의 최저 수량.int 형,기본 값 은 None 입 니 다.이 줄/열 에 비 어 있 는 요소 의 수가 이 값 보다 적 으 면 이 줄/열 을 삭제 합 니 다.
subset:부분 집합.목록,요 소 는 줄 또는 열 색인 입 니 다.만약 axis=0 또는'index'라면 subset 에서 요소 가 열 인 색인 입 니 다.만약 axis=1 또는'column'이 라면 subset 에서 요소 가 줄 인 색인 입 니 다.subset 에서 제 한 된 하위 영역 은 이 줄/열 을 삭제 할 지 여 부 를 판단 하 는 조건 판단 영역 입 니 다.
inplace:제자리 에서 바 꿀 지 여부 입 니 다.불 값,기본 값 은 False 입 니 다.트 루 라면 기 존 DataFrame 에서 작 동 하고 반환 값 은 None 입 니 다.
2.예시
DataFrame 데이터 만 들 기:
import numpy as np
import pandas as pd
a = np.ones((11,10))
for i in range(len(a)):
a[i,:i] = np.nan
d = pd.DataFrame(data=a)
print(d)
줄 별로 삭제:빈 값 이 존재 합 니 다.이 줄 을 삭제 합 니 다.
# : ,
print(d.dropna(axis=0, how='any'))
줄 별로 삭제:모든 데 이 터 는 빈 값 입 니 다.이 줄 을 삭제 합 니 다.
# : ,
print(d.dropna(axis=0, how='all'))
열 에 따라 삭제:이 열 은 비어 있 지 않 은 요소 가 5 개 이하 인 열 을 삭제 합 니 다.
# : 5 ,
print(d.dropna(axis='columns', thresh=5))
부분 집합 설정:0,5,6,7 열 이 모두 비어 있 는 줄 삭제
# : 0、5、6、7
print(d.dropna(axis='index', how='all', subset=[0,5,6,7]))
부분 집합 설정:5,6,7 줄 에 빈 값 이 있 는 열 을 삭제 합 니 다.
# : 5、6、7
print(d.dropna(axis=1, how='any', subset=[5,6,7]))
제자리 에서 수정 하 다
#
print(d.dropna(axis=0, how='any', inplace=True))
print("==============================")
print(d)
이상 은 개인 적 인 경험 이 므 로 여러분 에 게 참고 가 되 기 를 바 랍 니 다.여러분 들 도 저 희 를 많이 응원 해 주시 기 바 랍 니 다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Pandas의 DataFrame 스왑 열 순서 방법 구현1. DataFrame 열 레이블 가져오기 ['ps_state-stopped', 'ps_state-running', 'ps_state-blocked', 'ps_state-paging', 'ps_state-sleepi...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.