pandas 중복 행 및 분류 집합 실현 방법

오늘 은 주로 pandas 가 중복 행 에 가 는 것 과 어떻게 분류 하여 모 으 는 지 기록 합 니 다.다음 데이터 프레임 을 예 로 들 면: 

import pandas as pd
data=pd.DataFrame({'  ':['A','A','A','A'],'  ':[50,50,30,30]})
pandas 는 dataframe 에 중복 줄 데이터 가 있 는 지 판단 합 니 다:df.duplicated()

 처음 나타 난 데 이 터 는 False 입 니 다.중 복 된 데이터 줄 은 True 로 기 록 됩 니 다.
중복 줄 데이터 제거 data.drop 사용duplicates().

 색인 이 어 지 러 워 진 것 을 볼 수 있 습 니 다.data.reset 을 사용 합 니 다.index(),안에 있 는 인자 drop=True 는 원래 의 색인 을 버 리 겠 다 는 뜻 입 니 다.그렇지 않 으 면 원래 의 색인 이 남아 있 습 니 다.

 분류 집합 은 주로 groupby(집합 을 나타 내 는 조건 열)와 agg(집합 할 필드/열 및 집합 하 는 방식:구 화 또는 최대 최소 값 또는 계수)를 사용 합 니 다.전체 코드 는 아래 그림 과 같다.

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'  ':['A','A','A','A'],'  ':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='  ').agg({'  ':sum})
print('      :')
print(dataB)
결 과 는 다음 과 같다.

이상 이 바로 본 고의 모든 내용 입 니 다.여러분 의 학습 에 도움 이 되 고 저 희 를 많이 응원 해 주 셨 으 면 좋 겠 습 니 다.

좋은 웹페이지 즐겨찾기