CHO 2 데이터 분석 도구 Pandas

3221 단어
[과정 2.2] Pandas 데이터 구조 시리즈: 기본 개념 및 '1 차원 배열' Serise 구축
import numpy as np
import pandas as pd
#   numpy、pandas  

s = pd.Series(np.random.rand(5),index=list('abcde'))
print(s)
print(type(s))
#     、    ,   Pandas       index:

print('----------------')
print(list(s.index))   #   

#     
print(s.values)
# .index  series  ,   rangeindex
# .values  series ,   ndarray

#   :series   ndarray,       index    →      +     
#      series     ,    ndarray
# series ndarray   ,          
# series dict  ,series          (dict       ),          (   key,   index)
a    0.644754
b    0.900776
c    0.688774
d    0.823236
e    0.813280
dtype: float64

----------------
['a', 'b', 'c', 'd', 'e']
[ 0.64475351  0.90077556  0.68877405  0.82323593  0.81328029]

Series 데이터 구조 Series 는 라벨 이 있 는 1 차원 배열 로 모든 데이터 형식 (정수, 문자열, 부동 소수점, Python 대상 등) 을 저장 할 수 있 으 며 축 라벨 을 색인 이 라 고 통칭 합 니 다.
# Series      :     ,   key  index,values  values

dic = {'a':1 ,'b':2 , 'c':3, '4':4, '5':15}
s = pd.Series(dic)
print(s)
#   :key      ,  values          ? → dic = {'a':1 ,'b':'hello' , 'c':3, '4':4, '5':5}
4     4
5    15
a     1
b     2
c     3
dtype: int64
# Series      :     (    )

arr = np.random.randn(6)
s = pd.Series(arr,index=list('abcdef'))
print(arr)
print(s)
#   index  0  ,   1   

s = pd.Series(arr, index = ['a','b','c','d','e','f'],dtype = np.object)
print(s)
# index  :  index,      
# dtype  :      
[ 2.54754718  0.42551601  2.1959398  -0.89805983  0.31313358 -0.18893152]
a    2.547547
b    0.425516
c    2.195940
d   -0.898060
e    0.313134
f   -0.188932
dtype: float64
a     2.54755
b    0.425516
c     2.19594
d    -0.89806
e    0.313134
f   -0.188932
dtype: object
# Series     :name

s1 = pd.Series(np.random.randn(5))
print(s1)
print('-----')
s2 = pd.Series(np.random.randn(5),name = 'test')
print(s2)
print(s1.name, s2.name,type(s2.name))
# name Series     ,          
# .name  :       ,     str,          ,   None

s3 = s2.rename('hehehe')
print(s3)
print(s3.name, s2.name)
# .rename()          ,         ,     
0    1.149202
1   -0.563965
2    0.155182
3    1.269081
4    0.396754
dtype: float64
-----
0    0.002317
1   -0.388313
2   -0.364267
3    0.494363
4   -1.495762
Name: test, dtype: float64
None test 
0    0.002317
1   -0.388313
2   -0.364267
3    0.494363
4   -1.495762
Name: hehehe, dtype: float64
hehehe test

# Series      :     

s = pd.Series(10, index = range(4))
print(s)
#   data    ,       。     ,        
0    10
1    10
2    10
3    10
dtype: int64

좋은 웹페이지 즐겨찾기