pandas 처리 데이터 부족
NA 처리 방법
메서드
설명
dropna
각 탭의 값에 데이터가 부족한지 여부에 따라 축 탭을 필터링하고 한도값을 통해 부족에 대한 용인도를 조절할 수 있습니다
fillna
지정한 값이나 삽입 방법 (예: ffill, bfill) 으로 부족한 데이터를 채웁니다.
isnull
소스 유형과 같은 부울 값 NA를 나타내는 부울 값이 포함된 객체를 반환합니다.
notnull
isnull의 부정식
누락된 데이터 필터(dropna)
Series
In [1]: import pandas as pd
In [2]: from pandas import DataFrame, Series
In [3]: import numpy as np
In [4]: from numpy import nan as NA
In [5]: data = Series([1, NA, 3.5, NA, 7])
In [6]: data.dropna()
Out[6]:
0 1.0
2 3.5
4 7.0
dtype: float64
In [7]: data[data.notnull()]
Out[7]:
0 1.0
2 3.5
4 7.0
dtype: float64
DataFrame
부족한 데이터 채우기(fillna)!!
df.fillna(0)
df.fillna({1:0.5, 3:-1})
_ = df.fillna(0, inplace=True)
reindex
에 효과적인 삽입 방법도fillna값 바꾸기
fillna
방법을 이용하여 부족한 데이터를 채우는 것은 값 교체의 특수한 상황으로 볼 수 있다.replace
는 이 기능을 실현하는 더욱 간단하고 유연한 방식을 제공했다.In [11]: data = Series([1.,-999.,2.,-999.,-1000.,3.])
In [12]: data
Out[12]:
0 1.0
1 -999.0
2 2.0
3 -999.0
4 -1000.0
5 3.0
dtype: float64
In [13]: data.replace(-999, np.nan)
Out[13]:
0 1.0
1 NaN
2 2.0
3 NaN
4 -1000.0
5 3.0
dtype: float64
In [14]: data.replace([-999,-1000], np.nan)
Out[14]:
0 1.0
1 NaN
2 2.0
3 NaN
4 NaN
5 3.0
dtype: float64
In [15]: data.replace([-999,-1000], [np.nan,0])
Out[15]:
0 1.0
1 NaN
2 2.0
3 NaN
4 0.0
5 3.0
dtype: float64
In [16]: data.replace({-999 : np.nan, -1000 : 0})
Out[16]:
0 1.0
1 NaN
2 2.0
3 NaN
4 0.0
5 3.0
dtype: float64
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
형태소 분석은 데스크톱을 구성하는 데 도움이?문자×기계 학습에 흥미를 가져와 개인 범위의 용도를 생각해, 폴더 정리에 사용할 수 있을까 생각해 검토를 시작했습니다. 이번 검토에서는 폴더 구성 & text의 읽기 → mecab × wordcloud를 실시하고 있...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.