Pandas|||데이터 부족|pd.dropna()함수 의 용법 설명 필터 링

코드 보 세 요~

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
Remove missing values.
pd.dropna()함수(공식 문서)는 데이터 의 부족 한 데 이 터 를 걸 러 내 는 데 사 용 됩 니 다.
데이터 가 부족 하면 pandas 에 NaN 으로 표시 합 니 다.

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), index = list('abcde'), columns = ['one', 'two', 'three'])        #     5 3        
df.ix[1, :-1] = np.nan        #           
df.ix[1:-1, 2] = np.nan
print(df)
在这里插入图片描述

df.dropna()   #           
在这里插入图片描述
parameters
상세 하 게 해석 하 다
axis
default 0 줄,1 열
how
{'any','all'},default'any'는 부족 한 값 을 가 진 모든 줄 을 말 합 니 다.all'은 모든 값 이 부족 한 줄 을 제거 하 는 것 을 말 합 니 다.
thresh
int,int 개 비 어 있 는 줄 유지
subset
특정 열 에 부족 한 값 삭제 처리
inplace
이것 은 매우 흔 하 다.
추가:Python-pandas 의 dropna()방법-빈 값 을 포함 하 는 줄,열 을 버 립 니 다.
0.요약
dropna()방법 은 DataFrame 형식 데이터 의 빈 값(부족 값)을 찾 을 수 있 으 며,빈 값 이 있 는 줄/열 을 삭제 한 후 새로운 DataFrame 을 반환 값 으로 되 돌려 줍 니 다.
1.함수 상세 설명
함수 형식:dropna(axis=0,how='any',thresh=None,subset=None,inplace=False)
인자:
축.0 또는'index'는 줄 별로 삭제 하 는 것 을 표시 합 니 다.1 또는'columns'는 열 에 따라 삭제 하 는 것 을 표시 합 니 다.
how:선별 방식.'any'는 이 줄/열 에 빈 값 이 하나 이상 있 으 면 이 줄/열 을 삭제 합 니 다.'all',이 줄/열 이 모두 빈 값 임 을 표시 하면 이 줄/열 을 삭제 합 니 다.
thresh:비 공 원소 의 최저 수량.int 형,기본 값 은 None 입 니 다.이 줄/열 에 비 어 있 는 요소 의 수가 이 값 보다 적 으 면 이 줄/열 을 삭제 합 니 다.
subset:부분 집합.목록,요 소 는 줄 또는 열 색인 입 니 다.만약 axis=0 또는'index'라면 subset 에서 요소 가 열 인 색인 입 니 다.만약 axis=1 또는'column'이 라면 subset 에서 요소 가 줄 인 색인 입 니 다.subset 에서 제 한 된 하위 영역 은 이 줄/열 을 삭제 할 지 여 부 를 판단 하 는 조건 판단 영역 입 니 다.
inplace:제자리 에서 바 꿀 지 여부 입 니 다.불 값,기본 값 은 False 입 니 다.트 루 라면 기 존 DataFrame 에서 작 동 하고 반환 값 은 None 입 니 다.
2.예시
DataFrame 데이터 만 들 기:

import numpy as np
import pandas as pd
 
a = np.ones((11,10))
for i in range(len(a)):
    a[i,:i] = np.nan
 
d = pd.DataFrame(data=a)
print(d)

줄 별로 삭제:빈 값 이 존재 합 니 다.이 줄 을 삭제 합 니 다.

#     :    ,     
print(d.dropna(axis=0, how='any'))

줄 별로 삭제:모든 데 이 터 는 빈 값 입 니 다.이 줄 을 삭제 합 니 다.

#      :        ,     
print(d.dropna(axis=0, how='all'))

열 에 따라 삭제:이 열 은 비어 있 지 않 은 요소 가 5 개 이하 인 열 을 삭제 합 니 다.

#     :        5  ,     
print(d.dropna(axis='columns', thresh=5))

부분 집합 설정:0,5,6,7 열 이 모두 비어 있 는 줄 삭제

#     :   0、5、6、7      
print(d.dropna(axis='index', how='all', subset=[0,5,6,7]))

부분 집합 설정:5,6,7 줄 에 빈 값 이 있 는 열 을 삭제 합 니 다.

#     :   5、6、7       
print(d.dropna(axis=1, how='any', subset=[5,6,7]))

제자리 에서 수정 하 다

#     
print(d.dropna(axis=0, how='any', inplace=True))
print("==============================")
print(d)

이상 은 개인 적 인 경험 이 므 로 여러분 에 게 참고 가 되 기 를 바 랍 니 다.여러분 들 도 저 희 를 많이 응원 해 주시 기 바 랍 니 다.

좋은 웹페이지 즐겨찾기