pandas 중복 행 및 분류 집합 실현 방법
import pandas as pd
data=pd.DataFrame({' ':['A','A','A','A'],' ':[50,50,30,30]})
pandas 는 dataframe 에 중복 줄 데이터 가 있 는 지 판단 합 니 다:df.duplicated()처음 나타 난 데 이 터 는 False 입 니 다.중 복 된 데이터 줄 은 True 로 기 록 됩 니 다.
중복 줄 데이터 제거 data.drop 사용duplicates().
색인 이 어 지 러 워 진 것 을 볼 수 있 습 니 다.data.reset 을 사용 합 니 다.index(),안에 있 는 인자 drop=True 는 원래 의 색인 을 버 리 겠 다 는 뜻 입 니 다.그렇지 않 으 면 원래 의 색인 이 남아 있 습 니 다.
분류 집합 은 주로 groupby(집합 을 나타 내 는 조건 열)와 agg(집합 할 필드/열 및 집합 하 는 방식:구 화 또는 최대 최소 값 또는 계수)를 사용 합 니 다.전체 코드 는 아래 그림 과 같다.
# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({' ':['A','A','A','A'],' ':[50,50,30,30]})
if data.duplicated:
dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by=' ').agg({' ':sum})
print(' :')
print(dataB)
결 과 는 다음 과 같다.이상 이 바로 본 고의 모든 내용 입 니 다.여러분 의 학습 에 도움 이 되 고 저 희 를 많이 응원 해 주 셨 으 면 좋 겠 습 니 다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
【Pandas】DatetimeIndex란? no.29안녕하세요, 마유미입니다. Pandas에 대한 기사를 시리즈로 작성하고 있습니다. 이번은 제29회의 기사가 됩니다. 에서 Pandas의 시간에 대한 모듈에 대해 씁니다. 이번 기사에서는, 「DatetimeIndex」...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.