python 진급 - pandas 튜 토리 얼 (1)
2579 단어 python 데이터 분석
pandas 는 numpy 를 바탕 으로 구 축 된 라 이브 러 리 로 데이터 처리 에 있어 numpy 의 강화 판 으로 이해 할 수 있 습 니 다. numpy 는 주로 과학적 인 계산 에 사용 되 기 때문에 특 기 는 데이터 처리 에 있 지 않 습 니 다. 우리 가 평소에 처리 하 는 데 이 터 는 보통 열 태그 와 index 색인 을 가지 고 있 습 니 다. 이때 pandas 는 데이터 분석 패키지 로 개발 되 었 습 니 다.
pandas 데이터 구조 (시리즈 / dataFrame)
1, 시리즈 생 성
Series 는 1 차원 배열 과 유사 한 데이터 구 조 는 한 그룹의 데이터 (각종 numpy 데이터 형식) 와 이와 관련 된 데이터 태그 (색인) 로 구성 되 어 있 으 며, 구 조 는 길이 가 정 해 져 있 고 질서 있 는 사전, index 와 value 간 에 서로 독립 되 어 있 습 니 다.
import pandas as pd
import numpy as np
# Series
a1 = pd.Series([1, 2, 3]) # Series
a2 = pd.Series(np.array([1, 2, 3])) # numpy Series
a3 = pd.Series([1, 2, 3], index=["index1", "index2", "index3"]) # index
a4 = pd.Series({"index1": 1, "index2": 2, "index3": 3}) # Series
a5 = pd.Series({"index": 1, "index2": 2, "index3": 3}, index=["index1", "index2", "index3"]) # Series, index, NaN
a6 = pd.Series(10, index=["index1", "index2", "index3"])
2, 시리즈 속성
a1 = pd.Series([1, 2, 3])
index = a1.index # Series
values = a1.values # Series
a1.name = "population" # Series
a1.index.name = "state" # Series
3. 시리즈 찾기 요소
a3 = pd.Series([1, 2, 3], index=["index1", "index2", "index3"])
#
value1 = a3["index1"] #
value2 = a3.index1 #
value3 = a3[0] #
value4 = a3[["index1", "index2"]] #
value5 = a3[[0, 1]] #
value6 = a3[a3 > np.mean(a3)] #
value7 = a3[0:2] #
value8 = a3["index1":"index3"] #
4. 시리즈 수정 요소
#
a3["index3"] = 100 #
a3[2] = 1000 #
5, 시리즈 추가 요소
#
a3["index4"] = 10 #
6 、 시리즈 삭제 요소
a3.drop(["index4", "index3"], inplace=True) # inplace=True Series
print(a3) # index1 1 index2 2
7. 시리즈 방법
a3 = pd.Series([1, 2, 3], index=["index1", "index2", "index3"])
a3["index3"] = np.NaN #
a3.isnull() # Series
a3.notnull() # Series
print("index1" in a3) # Series
a3.isin([1]) # Series
a3.unique() # Series
a3.value_counts() # Series
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
데이터 분석 기초(一)텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.