[python] groupby / lambda / map

2988 단어 pythonpython

1. map & lambda

df[a] = df.b.map(lambda x : 1 if 'var' in x else 0)

map 함수 : 함수로 받은 데이터를 하나씩 괄호 안의 함수에 적용시키는 함수
labda 함수 : x로 받은 데이터를 정의한 방식으로 처리하는 함수

위 예제의 흐름 : df의 b column의 데이터를 하나씩 lambda 함수에 넘긴다. lambda 함수는 map으로부터 전달받은 데이터가 'var'이면 1, 그렇지 않으면 0을 반환한다.

2. groupby

#ex1
df.groupby(['X', 'Y']).Z.mean()

#ex2 
df.groupby('A').size().to_frame().rename(columns = {0 : 'counts'}.sort_values('counts', ascending = False)

groupby 함수 : 데이터프레임의 특정 열을 기준으로 describe를 실행하는 함수
ex1의 흐름 : 데이터프레임의 X, Y 열을 기준으로 describe를 실행한 뒤 X, Y를 기준으로 'Z'열의 평균을 출력하라

groupby(['X','Y','Z']) != groupby(['X', 'Y]).Z.describe()

ex2의 흐름 : A를 기준으로 데이터프레임의 describe를 실행하고, 빈도수를 출력하라 -> 빈도수 데이터를 데이터프레임으로 전환하고 -> 첫번째 column의 이름을 counts로 바꿔라 -> 빈도수를 내림차순으로 정리해라

좋은 웹페이지 즐겨찾기