python 에서 pandas 가 여러 열 을 그룹 으로 나 누 어 통계 하 는 실현
위의 그림 에서 보 듯 이 첫 번 째 빈 줄 은 982499 7 3388 1 입 니 다.이 줄 은 앞의 줄 의 이 두 필드 값 과 같 기 때문에 표시 되 지 않 습 니 다.두 번 째 빈 줄 은 390192 22 4278 1 입 니 다.이 줄 은 앞의 줄 의 첫 번 째 필드 값 과 같 기 때문에 표시 되 지 않 습 니 다.이런 전시 방식 은 더욱 직관 적 이지 만 방금 사용 한 사람 에 게 는 가치 가 부족 하 다 고 생각 할 수 있다.
아직 모 르 면 아래 의 모든 데이터 와 조작 을 볼 수 있 습 니 다.
import pandas as pd
res6 = pd.read_csv('test.csv')
res6.shape
(12, 3)
res6.columns
Index(['user_id', 'cate', 'shop_id'], dtype='object')
res6.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
user_id 12 non-null int64
cate 12 non-null int64
shop_id 12 non-null int64
dtypes: int64(3)
memory usage: 368.0 bytes
res6.describe()
user_idcate
shop_id
count
1.200000e+01
12.000000
12.000000
mean
6.468688e+05
10.666667
3594.000000
std
3.988181e+05
6.665151
373.271775
min
2.421410e+05
7.000000
3388.000000
25%
3.901920e+05
7.000000
3388.000000
50%
4.938730e+05
7.000000
3388.000000
75%
9.824990e+05
10.250000
3586.250000
max
1.558165e+06
23.000000
4278.000000
res6
user_idcate
shop_id
0
390192
20
4178
1
390192
23
4179
2
390192
22
4278
3
1021819
7
3388
4
242141
7
3388
5
283284
7
3388
6
1558165
7
3388
7
533696
7
3388
8
982499
7
3388
9
493873
7
3388
10
493873
7
3388
11
982499
7
3389
res6['user_id'].value_counts()
390192 3
982499 2
493873 2
242141 1
1021819 1
533696 1
1558165 1
283284 1
Name: user_id, dtype: int64
res6.groupby(['user_id']).size().sort_values(ascending=False)
user_id
390192 3
982499 2
493873 2
1558165 1
1021819 1
533696 1
283284 1
242141 1
dtype: int64
res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)
user_id cate
982499 7 2
493873 7 2
1558165 7 1
1021819 7 1
533696 7 1
390192 23 1
22 1
20 1
283284 7 1
242141 7 1
dtype: int64
res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False)
res6_test
user_id cate shop_id
493873 7 3388 2
1558165 7 3388 1
1021819 7 3388 1
982499 7 3389 1
3388 1
533696 7 3388 1
390192 23 4179 1
22 4278 1
20 4178 1
283284 7 3388 1
242141 7 3388 1
dtype: int64
python 에서 pandas 가 여러 열 에 대해 그룹 통 계 를 실시 하 는 실현 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 관련 pandas 여러 열 그룹 통계 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 조회 하 시기 바 랍 니 다.앞으로 많은 응원 바 랍 니 다!
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
【Pandas】DatetimeIndex란? no.29안녕하세요, 마유미입니다. Pandas에 대한 기사를 시리즈로 작성하고 있습니다. 이번은 제29회의 기사가 됩니다. 에서 Pandas의 시간에 대한 모듈에 대해 씁니다. 이번 기사에서는, 「DatetimeIndex」...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.