python 진급 - pandas 튜 토리 얼 (1)

간단 한 소개
        pandas 는 numpy 를 바탕 으로 구 축 된 라 이브 러 리 로 데이터 처리 에 있어 numpy 의 강화 판 으로 이해 할 수 있 습 니 다. numpy 는 주로 과학적 인 계산 에 사용 되 기 때문에 특 기 는 데이터 처리 에 있 지 않 습 니 다. 우리 가 평소에 처리 하 는 데 이 터 는 보통 열 태그 와 index 색인 을 가지 고 있 습 니 다. 이때 pandas 는 데이터 분석 패키지 로 개발 되 었 습 니 다.
pandas 데이터 구조 (시리즈 / dataFrame)
       1, 시리즈 생 성
       Series 는 1 차원 배열 과 유사 한 데이터 구 조 는 한 그룹의 데이터 (각종 numpy 데이터 형식) 와 이와 관련 된 데이터 태그 (색인) 로 구성 되 어 있 으 며, 구 조 는 길이 가 정 해 져 있 고 질서 있 는 사전, index 와 value 간 에 서로 독립 되 어 있 습 니 다.
import pandas as pd
import numpy as np

#   Series
a1 = pd.Series([1, 2, 3])  #     Series
a2 = pd.Series(np.array([1, 2, 3]))  # numpy    Series
a3 = pd.Series([1, 2, 3], index=["index1", "index2", "index3"])  #     index  
a4 = pd.Series({"index1": 1, "index2": 2, "index3": 3})  #     Series
a5 = pd.Series({"index": 1, "index2": 2, "index3": 3}, index=["index1", "index2", "index3"])  #     Series,  index,      NaN
a6 = pd.Series(10, index=["index1", "index2", "index3"])

      2, 시리즈 속성
a1 = pd.Series([1, 2, 3])
index = a1.index  # Series  
values = a1.values  # Series  
a1.name = "population"  #   Series  
a1.index.name = "state"  #   Series    

      3. 시리즈 찾기 요소
a3 = pd.Series([1, 2, 3], index=["index1", "index2", "index3"])
#     
value1 = a3["index1"]  #       
value2 = a3.index1  #         
value3 = a3[0]  #         
value4 = a3[["index1", "index2"]]  #     
value5 = a3[[0, 1]]  #     
value6 = a3[a3 > np.mean(a3)]  #        
value7 = a3[0:2]  #       
value8 = a3["index1":"index3"]  #     

       4. 시리즈 수정 요소
#     
a3["index3"] = 100  #         
a3[2] = 1000  #           

        5, 시리즈 추가 요소
#     
a3["index4"] = 10  #         

        6 、 시리즈 삭제 요소
a3.drop(["index4", "index3"], inplace=True)  # inplace=True       Series
print(a3)  # index1 1 index2 2

        7. 시리즈 방법
a3 = pd.Series([1, 2, 3], index=["index1", "index2", "index3"])
a3["index3"] = np.NaN  #     
a3.isnull()  #   Series      
a3.notnull()  #   Series       
print("index1" in a3)  #   Series         
a3.isin([1])  #   Series        
a3.unique()  #   Series     
a3.value_counts()  #   Series        

좋은 웹페이지 즐겨찾기