Python 데이터 분석 에서 Groupby 용법 은 사전 이나 Series 를 통 해 그룹 을 나 누 는 인 스 턴 스 입 니 다.
people=DataFrame(
np.random.randn(5,5),
columns=['a','b','c','d','e'],
index=['Joe','Steve','Wes','Jim','Travis']
)
mapping={'a':'red','b':'red','c':'blue','d':'blue','e':'red','f':'orange'}
by_column=people.groupby(mapping,axis=1)#
python 밑바닥 이 어떻게 돌아 가 는 지 모 르 겠 습 니 다.실행 결 과 를 인쇄 해서 보 는 것 이 좋 습 니 다.
for i in by_column:
print (i)
반복 되 는 결과:
('blue', c d
Joe 0.218189 -0.228336
Steve 1.677264 0.630303
Wes 0.315320 -0.250787
Jim 3.343462 0.483021
Travis 0.854553 -0.760884)
('red', a b e
Joe 0.218164 0.823654 -1.425720
Steve 1.191175 -0.327735 1.926470
Wes -1.418855 0.497466 0.110105
Jim -1.157157 0.817122 0.749023
Travis -0.440583 -0.907922 1.374294)
결과 에서 볼 수 있 듯 이 a b e 를 red,c d 에 게 blue 를 나 누 어 주 었 다.a b e--->red
c d --->blue
다음 에 people.groupby(mapping,axis=1).mean()을 실행 합 니 다.
blue red
Joe 0.241336 -0.182099
Steve 0.459773 -0.448336
Wes 0.205278 0.605721
Jim -0.094838 1.254174
Travis 0.354140 0.142075
결 과 를 보면 열 방향 group 에서 집합 함수 mean()을 그룹 으로 나 누 어 실행 한 후 열 색인 은 blue 와 red 만 있 습 니 다.전체 과정 은 열 방향 에서 a b e 를 하나의 그룹 으로 나 누 는 것 을 이해 할 수 있 습 니 다.red,c d 는 하나의 그룹 으로 blue 입 니 다.마지막 으로 red blue 를 새 DataFraem 의 열 색인 으로 합 니 다.
마찬가지 로 Series 도 같은 기능 을 가지 고 있어 고정 크기 의 맵 으로 볼 수 있다.위의 예 에 대해 series 를 그룹 키 로 사용 하면 pandas 는 Series 를 검사 하여 색인 그룹 축 이 정렬 되 어 있 는 지 확인 합 니 다.
ser=Series(mapping)
a red
b red
c blue
d blue
e red
f orange
by_ser_group=people.groupby(ser,axis=1).mean()
blue red
Joe 0.241336 -0.182099
Steve 0.459773 -0.448336
Wes 0.205278 0.605721
Jim -0.094838 1.254174
Travis 0.354140 0.142075
결 과 를 보면 사전 을 통 해 그룹 을 나 누 는 것 과 시 리 즈 를 통 해 그룹 을 나 누 는 결 과 는 같다.즉,이들 이 실행 하 는 원 리 는 똑 같 습 니 다.색인(series 에 있어)이나 사전 의 key 를 Dataframe 의 색인 과 일치 시 키 는 것 입 니 다.
사전 에서 value 나 series 에서 values 값 이 같은 것 은 한 그룹 으로 나 뉘 어 마지막 으로 각 그룹 에 따라 취 합 됩 니 다.
groupby 는 용법 이 많 습 니 다.나중에 시간 이 있 으 면 블 로 그 를 천천히 업데이트 하 겠 습 니 다.만약 그런 부분 이 잘못 되 었 다 면 모두 가 함께 공부 하고 함께 발전 하 는 것 을 환영 합 니 다.
이상 의 Python 데이터 분석 에서 Groupby 용법 이 사전 이나 Series 를 통 해 그룹 을 나 누 는 인 스 턴 스 는 바로 작은 편집 이 여러분 에 게 공유 하 는 모든 내용 입 니 다.참고 하 시기 바 랍 니 다.여러분 들 도 저 희 를 많이 사랑 해 주 셨 으 면 좋 겠 습 니 다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Python의 None과 NULL의 차이점 상세 정보그래서 대상 = 속성 + 방법 (사실 방법도 하나의 속성, 데이터 속성과 구별되는 호출 가능한 속성 같은 속성과 방법을 가진 대상을 클래스, 즉 Classl로 분류할 수 있다.클래스는 하나의 청사진과 같아서 하나의 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.