Pandas 데이터 처리 Pandas 의 Index 대상

1580 단어 파 이 썬 기반
《 파 이 썬 데이터 과학 수첩 》 독서 노트.
3.2.3 Pandas 의 Index 대상
    Series 와 DataFrame 대상 은 인용 과 조정 이 편리 한 현식 인덱스 를 사용한다.Pandas 의 Index 대상 은 매우 재 미 있 는 데이터 구조 로 이 를 가 변 배열 이나 질서 있 는 집합 으로 볼 수 있다.
In [1] : import numpy as np
		 import pandas as pd			
In [2] : ind = pd.Index([2,3,5,7,11])
In [3] : ind 
Out[3] :Int64Index([2, 3, 5, 7, 11], dtype='int64')

1. Index 를 가 변 배열 로 간주한다.
『 8195 』 Index 대상 의 많은 조작 은 모두 배열 과 같다.예 를 들 어 표준 Python 의 값 을 추출 하 는 방법 으로 수 치 를 얻 을 수 있 고 절편 을 통 해 수 치 를 얻 을 수 있 습 니 다.
In [4] : ind[1]
Out[4] :3

In [5] : ind[::2]
Out[5] :Int64Index([2, 5, 11], dtype='int64')

#    Numpy   
In [6] : ind.size
Out[6] :5
In [6] : ind.shape
Out[6] :(5,)
In [6] : ind.dtype
Out[6] :dtype('int64')

    Index 대상 과 NumPy 배열 간 의 차이 점 은 Index 대상 의 색인 은 가 변 적 이지 않다 는 것 이다. 즉, 일반적인 방식 으로 조정 할 수 없다 는 것 이다.
In [7] : ind[1] = 0
TypeError: Index does not support mutable operations

『 8195 』 Index 대상 의 가 변 적 이지 않 은 특징 으로 인해 여러 DataFrame 과 배열 간 에 색인 공 유 를 할 때 더욱 안전 합 니 다. 특히 색인 을 수정 할 때 부주의 로 인 한 부작용 을 피 할 수 있 습 니 다.
2. Index 를 질서정연 한 집합 으로 간주한다
Index 대상 은 교 집합, 집합 을 구 할 수 있 습 니 다.
In [8] : indA = pd.Index([1, 3, 5, 7, 9])
		 indB = pd.Index([2, 3, 5, 7, 11])
		 
In [9] : indA & indB 	#   
Out[9] : Int64Index([3, 5, 7], dtype='int64')

In[10] : indA | indB 	#   
Out[10]: Int64Index([1, 2, 3, 5, 7, 9, 11], dtype='int64')

In[11] : indA ^ indB #   
Out[11]: Int64Index([1, 2, 9, 11], dtype='int64')

좋은 웹페이지 즐겨찾기