[Python] Pandas 라이브러리 -(1)

Pandas 생성

  • 라이브러리 불러오기
import pandas as pd
#pandas 라이브러리를 불러와서 pd라고 부르겠다.

Series 생성 (리스트)

  • 1차원 (ind, val)로 구성
  • pd.Series( [ ] , index =[ ]) 를 이용하여 시리즈 생성
pd.Series([9904312, 3448737, 2890451, 2466052], 
index=['서울', '부산', '인천', '대구'])

Series 데이터 확인

  • index : 인덱스 확인
  • values : 값 확인
  • dtype : 데이터 타입 확인

Series 이름 지정

  • .name : 이름 지정
  • .index.name : 인덱스 이름 지정
population.name = '인구'
population.index.name = '도시'

인덱싱과 슬라이싱

  • index 번호(숫자)와 index 값 둘 다 활용 가능
  • 슬라이싱 - [ 포함 : 미포함 ]
  • index 값(문자열) - [ 포함 : 포함 ]
#인덱싱
population[0]
population['대구'] 
#슬라이싱
population[ 1 : 3 ]
population['부산': '인천']

불리언 인덱싱

  • index 번호(숫자)와 index 값 둘 다 활용 가능
population >= 2500000

population[ population >= 2500000 ]

Series 생성 (딕셔너리)

  • 딕셔너리는 key와 value로 구성
  • key 값 : index
  • value 값 : value
data = {'서울': 9631482,
        '부산': 3393191,
        '인천': 2632035,
        '대전': 1490158}
population2 = pd.Series(data)

Series 데이터 수정

  • 데이터 수정
rs['대구'] = 1.41 
  • 데이터 삭제
del rs['대전'] 
  • 데이터 추가
rs['광주'] = 2.13

좋은 웹페이지 즐겨찾기