5/1 Q. 판다스 메소드 중 결측치를 처리하는 것은?

데이터 만들기

import pandas as pd
import numpy as np
import random

# 데이터 프레임 만들기
df = pd.DataFrame(np.random.randn(5, 3), columns=['C1', 'C2', 'C3'])
df

# 결측치 만들어 주기
df.iloc[0, 0] = None
df.loc[1, ['C1', 'C3']] = np.nan
df.loc[2, 'C2'] = np.nan
df.loc[3, 'C2'] = np.nan
df.loc[4, 'C3'] = np.nan

결측값을 특정 값으로 채우기

# 0으로 채우기
df_0 = df.fillna(0)
df_0

# string으로 채우기
df_missing = df.fillna('missing')
df_missing

결측값을 변수별로 평균으로 대체하기

df.mean()

df.fillna(df.mean())

참고 자료

좋은 웹페이지 즐겨찾기