예제가 포함된 Pandas map() 함수

Map() 함수를 사용하면 DataFrame 또는 시리즈의 데이터를 한 번에 하나의 값으로 변환할 수 있습니다. 데이터 프레임은 행 및 열 항목에 해당하는 값이 있는 테이블입니다. 데이터 프레임을 만드는 예는 다음과 같습니다.

import pandas as pd
table=pd.DataFrame({'Age':[16,18,25,27,28,30,45],'Gender':['Female','Male','Female','Male','Male','Male','Female'],'Marks':[66,70,88,90,95,50,88]})


출력은 다음과 같아야 합니다.


위의 예에서 pd.DataFrame()을 사용하여 age,gender,marks 열이 있는 DataFrame 테이블을 만들었습니다. 항목은 대괄호 안에 표시된 대로 각 열에 할당됩니다.
이제 map() 함수를 사용해 보겠습니다.

여성을 1로, 남성을 0으로 매핑한 다음 다른 열에 결과를 표시합니다.




table['sex_num']=table.Gender.map({'Female':1,'Male':0})
table.loc[:,['Gender','sex_num']]


table['sex_num']은 새 열 sex_num을 생성하고 Gender.map은 Gender 열에서 매핑할 값을 지정합니다. Dataframe.loc은 여러 열에 액세스하는 데 사용됩니다. 이 경우 'Gender' 및 'sex_num' 열에 액세스하려고 합니다.



평균 마크에서 편차를 찾으려면




dev_mean=table.Marks.mean()
table['Deviation_From_Mean']=table.Marks.map(lambda p:p-dev_mean)
table.loc[:,['Deviation_From_Mean','Marks']]


table.Marks.mean()은 pandas에게 마크 평균을 계산하고 이를 dev_mean에 할당하도록 지시합니다. table['Deviation_From_Mean']_은 평균에서 새 열 편차를 생성하고 람다 함수 _lambda p:p-dev_mean을 열의 각 값에 매핑합니다. 람다 함수는 여러 인수를 사용하고 식을 실행할 수 있습니다. 람다 함수에는 키워드, 변수 및 표현식이 있습니다. 키워드는 람다 & 람다 함수를 사용할 때마다 포함되어야 합니다. 람다에서 p:p-dev_mean p _는 마크 열의 각 항목을 나타냅니다. _p-dev_mean 식은 각 항목에서 dev_mean을 뺍니다.

좋은 웹페이지 즐겨찾기