Numpy 와 Pandas

20172 단어 python
Numpy 와 Pandas 의 기본 적 인 사용법 을 말씀 드 리 겠 습 니 다.
먼저 Numpy,Numpy 는 Mean(numpy.mean),Median(numpy.median),Standard deviation(numpy.std)등 매우 유용 한 통계 함 수 를 제공 합 니 다.
import numpy as np

'''
           Numpy,               ,      ,Numpy      。  Numpy    ,     Python  list  。
'''

'''
Numpy    Python  lists   ,      Numpy              ,  int  float。
'''
#  False  True       
if False:
    array = np.array([1, 4, 5, 8], float)
    print array
    print ""
    array = np.array([[1, 2, 3], [4, 5, 6]], float)  # a 2D array/Matrix
    print array

'''
 Python  list  ,     、  、    Numpy  。
'''
#  False  True       
if False:
    array = np.array([1, 4, 5, 8], float)
    print array
    print ""
    print array[1]
    print ""
    print array[:2]
    print ""
    array[1] = 5.0
    print array[1]

#  False  True       
if False:
    two_D_array = np.array([[1, 2, 3], [4, 5, 6]], float)
    print two_D_array
    print ""
    print two_D_array[1][1]
    print ""
    print two_D_array[1, :]
    print ""
    print two_D_array[:, 2]

'''
       Numpy       
'''
#  False  True       
if False:
    array_1 = np.array([1, 2, 3], float)
    array_2 = np.array([5, 2, 6], float)
    print array_1 + array_2
    print ""
    print array_1 - array_2
    print ""
    print array_1 * array_2

#  False  True       
if False:
    array_1 = np.array([[1, 2], [3, 4]], float)
    array_2 = np.array([[5, 6], [7, 8]], float)
    print array_1 + array_2
    print ""
    print array_1 - array_2
    print ""
    print array_1 * array_2

'''
         ,Numpy           ,           。
'''

#  False  True       
if False:
    array_1 = np.array([1, 2, 3], float)
    array_2 = np.array([[6], [7], [8]], float)
    print np.mean(array_1)
    print np.mean(array_2)
    print ""
    print np.dot(array_1, array_2)

다음은 Pandas,Pandas 의 데 이 터 는 보통 DataFrame 의 데이터 프레임 워 크 에 저 장 됩 니 다.Pandas 의 Series 를 소개 합 니 다.
import pandas as pd

'''
         Series   。
    Series    object, array、list   。                 ,   0 N,  N      。
'''
#  False  True     Series  
if False:
    series = pd.Series(['Dave', 'Cheng-Han', 'Udacity', 42, -1789710578])
    print series

'''
   series   ,            。
'''

#  False  True       
if True:
    series = pd.Series(['Dave', 'Cheng-Han', 359, 9001],
                       index=['Instructor', 'Curriculum Manager',
                              'Course Number', 'Power Level'])
    print series

'''
         Series        
'''
#  False  True           
if False:
    series = pd.Series(['Dave', 'Cheng-Han', 359, 9001],
                       index=['Instructor', 'Curriculum Manager',
                              'Course Number', 'Power Level'])
    print series['Instructor']
    print ""
    print series[['Instructor', 'Curriculum Manager', 'Course Number']]

'''
      bool      Series     
'''
#  False  True  bool   
if False:
    cuteness = pd.Series([1, 2, 3, 4, 5], index=['Cockroach', 'Fish', 'Mini Pig',
                                                 'Puppy', 'Kitten'])
    print cuteness > 3
    print ""
    print cuteness[cuteness > 3]

다음은 Pandas 의 Dataframe 을 소개 합 니 다.
import numpy as np
import pandas as pd

'''
           Pandas  Dataframe。
    Dataframe         ,  spreadsheet、      R  data.frame  。
'''

'''
              list   Dataframe   :
1)    key       。
2)               。
'''
#  False  True  Dataframes   
if False:
    data = {'year': [2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012],
            'team': ['Bears', 'Bears', 'Bears', 'Packers', 'Packers', 'Lions',
                     'Lions', 'Lions'],
            'wins': [11, 8, 10, 15, 11, 6, 10, 4],
            'losses': [5, 8, 6, 1, 5, 10, 6, 12]}
    football = pd.DataFrame(data)
    print football

'''
Pandas                            。  :
1) dtypes:           。
2) describe:     dataframe             ,  count、mean、std 。
3) head:         5 
4) tail:          5 
'''
#  False  True         
if False:
    data = {'year': [2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012],
            'team': ['Bears', 'Bears', 'Bears', 'Packers', 'Packers', 'Lions',
                     'Lions', 'Lions'],
            'wins': [11, 8, 10, 15, 11, 6, 10, 4],
            'losses': [5, 8, 6, 1, 5, 10, 6, 12]}
    football = pd.DataFrame(data)
    print football.dtypes
    print ""
    print football.describe()
    print ""
    print football.head()
    print ""
    print football.tail()

Pandas 의 색인 데이터 상 자 를 소개 합 니 다.
import pandas as pd

'''
    DataFrame         Series  ,             DataFrame       。

       :
1)   DataFrame        Series
2)   DataFrame        DataFrame
'''
#  False  True  Series   
if False:
    data = {'year': [2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012],
            'team': ['Bears', 'Bears', 'Bears', 'Packers', 'Packers', 'Lions',
                     'Lions', 'Lions'],
            'wins': [11, 8, 10, 15, 11, 6, 10, 4],
            'losses': [5, 8, 6, 1, 5, 10, 6, 12]}
    football = pd.DataFrame(data)
    print football['year']
    print ''
    print football.year  # football['year']   
    print ''
    print football[['year', 'wins', 'losses']]

'''
            。          :
   1)   
   2)      (  loc iloc)
   3) bool   

        bool    &(and) |(or)          。
'''
#  False  True  bool   
if False:
    data = {'year': [2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012],
            'team': ['Bears', 'Bears', 'Bears', 'Packers', 'Packers', 'Lions',
                     'Lions', 'Lions'],
            'wins': [11, 8, 10, 15, 11, 6, 10, 4],
            'losses': [5, 8, 6, 1, 5, 10, 6, 12]}
    football = pd.DataFrame(data)
    print football.iloc[[0]]
    print ""
    print football.loc[[0]]
    print ""
    print football[3:5]
    print ""
    print football[football.wins > 10]
    print ""
    print football[(football.wins > 10) & (football.team == "Packers")]

좋은 웹페이지 즐겨찾기