python 에서 pandas 가 여러 열 을 그룹 으로 나 누 어 통계 하 는 실현

groupby([]).size()를 사용 하여 집계 한 결과 값 이 같은 필드 값 은 표시 되 지 않 습 니 다.
在这里插入图片描述
위의 그림 에서 보 듯 이 첫 번 째 빈 줄 은 982499 7 3388 1 입 니 다.이 줄 은 앞의 줄 의 이 두 필드 값 과 같 기 때문에 표시 되 지 않 습 니 다.두 번 째 빈 줄 은 390192 22 4278 1 입 니 다.이 줄 은 앞의 줄 의 첫 번 째 필드 값 과 같 기 때문에 표시 되 지 않 습 니 다.이런 전시 방식 은 더욱 직관 적 이지 만 방금 사용 한 사람 에 게 는 가치 가 부족 하 다 고 생각 할 수 있다.
아직 모 르 면 아래 의 모든 데이터 와 조작 을 볼 수 있 습 니 다.

import pandas as pd
res6 = pd.read_csv('test.csv')
res6.shape

(12, 3)

res6.columns

Index(['user_id', 'cate', 'shop_id'], dtype='object')

res6.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
user_id    12 non-null int64
cate       12 non-null int64
shop_id    12 non-null int64
dtypes: int64(3)
memory usage: 368.0 bytes

res6.describe()
user_id
cate
shop_id
count
1.200000e+01
12.000000
12.000000
mean
6.468688e+05
10.666667
3594.000000
std
3.988181e+05
6.665151
373.271775
min
2.421410e+05
7.000000
3388.000000
25%
3.901920e+05
7.000000
3388.000000
50%
4.938730e+05
7.000000
3388.000000
75%
9.824990e+05
10.250000
3586.250000
max
1.558165e+06
23.000000
4278.000000

res6
user_id
cate
shop_id
0
390192
20
4178
1
390192
23
4179
2
390192
22
4278
3
1021819
7
3388
4
242141
7
3388
5
283284
7
3388
6
1558165
7
3388
7
533696
7
3388
8
982499
7
3388
9
493873
7
3388
10
493873
7
3388
11
982499
7
3389

res6['user_id'].value_counts()


390192     3
982499     2
493873     2
242141     1
1021819    1
533696     1
1558165    1
283284     1
Name: user_id, dtype: int64

res6.groupby(['user_id']).size().sort_values(ascending=False)


user_id
390192     3
982499     2
493873     2
1558165    1
1021819    1
533696     1
283284     1
242141     1
dtype: int64


res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)


user_id  cate
982499   7       2
493873   7       2
1558165  7       1
1021819  7       1
533696   7       1
390192   23      1
         22      1
         20      1
283284   7       1
242141   7       1
dtype: int64

res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False)
res6_test

user_id  cate  shop_id
493873   7     3388       2
1558165  7     3388       1
1021819  7     3388       1
982499   7     3389       1
               3388       1
533696   7     3388       1
390192   23    4179       1
         22    4278       1
         20    4178       1
283284   7     3388       1
242141   7     3388       1
dtype: int64
python 에서 pandas 가 여러 열 에 대해 그룹 통 계 를 실시 하 는 실현 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 관련 pandas 여러 열 그룹 통계 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 조회 하 시기 바 랍 니 다.앞으로 많은 응원 바 랍 니 다!

좋은 웹페이지 즐겨찾기