《 Python for Data Analysis 》 시리즈

pandas 의 주요 데이터 구조: Series
Pandas 가 만족 시 킬 수 있 는 수요:
  • 축 에 따라 자동 또는 명시 적 데이터 정렬 기능 을 가 진 데이터 구 조 를 가진다.이것 은 데이터 가 정렬 되 지 않 고 서로 다른 데이터 원본 (색인 방식 이 다 름) 에서 온 많은 데이터 로 인해 발생 하 는 흔 한 오 류 를 방지 할 수 있다.
  • 집적 시간 시퀀스 기능
  • 시간 서열 데이터 도 처리 할 수 있 고 비 시간 서열 데이터 도 처리 할 수 있다
  • 데이터 연산 과 약간 (예 를 들 어 특정한 축 에 대한 구 화) 은 서로 다른 메타 데이터 (축) 번호 에 따라 집행 할 수 있다.
  • 데이터 부족 을 유연 하 게 처리
  • 합병 및 기타 흔 한 데이터베이스 에 나타 난 관계 형 연산
  • Series 는 1 차원 배열 과 유사 한 대상 으로 데이터 (각종 Numpy 데이터 형식) 와 관련 된 데이터 태그 (즉 색인) 로 구성 된다.
    Series 의 구성 요 소 는 두 가지 입 니 다. 1. 데이터 2. 이에 대응 하 는 색인 생 성: Series ([data], index = [index])
    "Data     (  index)"
    obj = Series([3,4,-5,6])
    
    "  Python    :        "
    sdata = {'a':3,'b':4,'c':-5,'d':6}
    obj = Series(sdata)
    
    "     "
    obj = Series([3,4,-5,6],index=['a','b','c','d'])

    시리즈 방법
    "         "
    In [7]: obj['a']
    Out[7]: 3
    "         "
    In [8]: obj[['a','c','d']]
    Out[8]: 
    a    3
    c   -5
    d    6
    "     (Series        ),           "
    obj[obj > 0]
    obj[obj*2]
    np.exp(obj2)
    "    Series           "
    In [9]: "b" in obj
    Out[9]: True
    
    In [10]: "e" in obj
    Out[10]: False
    
    "Series    "
    In [10]: obj.isnull()  #      
    
    "Series                "
    
    In [11]: obj.index = ['Bob','Steve','Jeff','Ryan']
    
    Out[12]: 
    Bob      3
    Steve    4
    Jeff    -5
    Ryan     6
    dtype: int64
    

    좋은 웹페이지 즐겨찾기