DataFrame 데이터 의 중복 줄 에 대해 groupby 누적 합병 방법 으로 상세 하 게 설명 합 니 다.

pandas 는 한 그룹의 데 이 터 를 읽 습 니 다.중복 색인 이 존재 할 수 있 습 니 다.drop 을 이용 할 수 있 지만.Duplicate 는 직접 삭제 하지만 중요 한 정 보 는 삭 제 됩 니 다.
예 를 들 어 같은 ID 사용자,여러 번 로그 인 학습 시간.이 사용자 의 총'학습 시간'을 계산 하려 면 중 복 된 ID 의'학습 시간'을 누적 해 야 한다.
groupby 와 sum 함 수 를 결합 하여 이 작업 을 완성 할 수 있 습 니 다.
실례 는 다음 과 같다.
DataFrame 을 새로 만 들 고 모든 id 의 총 학습 시간 을 계산 합 니 다.이 중 id 는 one/two 의 존재 중복 학습 시간 입 니 다.먼저 groupby 를 이용 하여 키 id 에 따라 그룹 을 나 눈 다음 sum()함 수 를 이용 하여 합 을 구하 면 모든 id 의 총 학습 시간 을 얻 을 수 있 습 니 다.
DataFrame数据中的重复行,利用groupby累加合并
이상 의 DataFrame 데이터 에 대한 중복 줄 입 니 다.groupby 누적 합병 방법 을 이용 하여 상세 하 게 설명 하 는 것 은 바로 편집장 이 여러분 에 게 공유 한 모든 내용 입 니 다.참고 하 실 수 있 고 많은 응원 부 탁 드 리 겠 습 니 다.

좋은 웹페이지 즐겨찾기