pandas 중복 행 및 분류 집합 실현 방법

오늘 은 주로 pandas 가 중복 행 에 가 는 것 과 어떻게 분류 하여 모 으 는 지 기록 합 니 다.다음 데이터 프레임 을 예 로 들 면:


import pandas as pd
data=pd.DataFrame({'  ':['A','A','A','A'],'  ':[50,50,30,30]})

pandas 는 dataframe 에 중복 줄 데이터 가 있 는 지 판단 합 니 다:df.duplicated()

처음 나타 난 데 이 터 는 False 입 니 다.중 복 된 데이터 줄 은 True 로 기 록 됩 니 다.
중복 줄 데이터 제거 data.drop 사용duplicates().

색인 이 어 지 러 워 진 것 을 볼 수 있 습 니 다.data.reset 을 사용 합 니 다.index(),안에 있 는 인자 drop=True 는 원래 의 색인 을 버 리 겠 다 는 뜻 입 니 다.그렇지 않 으 면 원래 의 색인 이 남아 있 습 니 다.

분류 집합 은 주로 groupby(집합 을 나타 내 는 조건 열)와 agg(집합 할 필드/열 및 집합 하 는 방식:구 화 또는 최대 최소 값 또는 계수)를 사용 합 니 다.전체 코드 는 아래 그림 과 같다.


# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'  ':['A','A','A','A'],'  ':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='  ').agg({'  ':sum})
print('      :')
print(dataB)

결 과 는 다음 과 같다.

이상 이 바로 본 고의 모든 내용 입 니 다.여러분 의 학습 에 도움 이 되 고 저 희 를 많이 응원 해 주 셨 으 면 좋 겠 습 니 다.

이 내용에 흥미가 있습니까?

현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:

【Pandas】DatetimeIndex란?　no.29

안녕하세요, 마유미입니다. Pandas에 대한 기사를 시리즈로 작성하고 있습니다. 이번은 제29회의 기사가 됩니다. 에서 Pandas의 시간에 대한 모듈에 대해 씁니다. 이번 기사에서는, 「DatetimeIndex」...

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다