[Python] 파이썬 외부 라이브러리 설치/Numpy 패키지 / Requests 패키지 /Pandas 라이브러리/Matplotlib 라이브러리

4917 단어 pythonpython

🚀 파이썬 외부 라이브러리 설치

  • cmd창을 열고 "pip install 패키지 이름"을 입력해준다.

🚀 Numpy 패키지

  • numpy는 과학 계산을 위한 라이브러리로 다차원 배열을 처리하는데 필요한 여러 기능을 제공
  • numpy에서 배열은 동일한 타입의 값들을 가지며,배열의 차원을 rank라 하고, 각 차원의 크기를 튜플로 표시하는 것을 shape라 함
  • 예를 들어, 행이 2이고, 열이 3인 2차원 배열에서 rank는 2이고,shape는 (2,3)이 된다.
import numpy as np

a = np.zeros((2,2)) # 0으로 2행 2열 2차원 배열 생성
print(a)

a = np.ones((2,3))	#1로만 2행 3열 2차원 배열 채우면서 생성
print(a)

a = np.full((2,3),5)	#5로 2행3열 배열 채우면서 생성
print(a)

a = np.eye(3)		#대각선은 1, 그 외의 부분은 0으로 채움
print(a)


a= np.array(range(20)).reshape(4,5)	#range()로 1차원 배열 생성 후 reshape로 4행 5열 2차원 배열로 생성
print(a)

[[0. 0.][0. 0.]]
[[1. 1. 1.][1. 1. 1.]]
[[5 5 5][5 5 5]]
[[1. 0. 0.][0. 1. 0.]
[0. 0. 1.]]
[[ 0 1 2 3 4][ 5 6 7 8 9]
[10 11 12 13 14][15 16 17 18 19]]

import numpy as np

a = np.array([1,2,3])
b = np.array([4,5,6])

c = np.add(a,b) #a,b 배열 더하기
print(c)

c = np.multiply(a,b)    #a,b 배열 곱하기
print(c)

c = np.divide(a,b)  #a,b 배열 나누기
print(c)

[5 7 9][ 4 10 18]
[0.25 0.4 0.5 ]

mat1 =[[1,2],[3,4]]
mat2 =[[5,6],[7,8]]

a = np.array(mat1)
b = np.array(mat2)

c = np.dot(a,b) #행렬의 곱 구하기
print(c)

[[19 22][43 50]]

a = np.array([[1,2],[3,4]])

s = np.sum(a)   #각 배열 요소들을 더하는 sum() 함수
print(s)

#axis = 0 컬럼끼리, axis = 1 행끼리 더한다.

s = np.sum(a,axis = 0)
print(s)
s = np.sum(a,axis = 1)
print(s)

s = np.prod(a) #각 배열 요소들을 곱하는 prod() 함수
print(s)

10
[4 6][3 7]
24

🚀 Requests 패키지

  • requests.get(url) 함수를 사용하면 해당 웹 페이지 호출 결과를 가진 Response 객체를 리턴

  • Response 객체는 HTML Response와 관련된 여러 attribute들을 가지고 있는데, 예를 들어, Response의 status_code 속성을 체크하여 HTTP Status 결과를 체크할 수 있고, Response 에서 리턴 된 데이터를 문자열로 리턴하는 text 속성이 있음

import requests

resp = requests.get("https://www.daum.net/")

if(resp.status_code == requests.codes.ok):
    html = resp.text
    print(html)

🚀 Pandas 라이브러리

  • pandas는 데이타 분석(Data Analysis)을 위해 널리 사용되는 파이썬 라이브러리 패키지이다. pandas는 과학용 파이썬 배포판인 아나콘다(Anaconda)에 기본적으로 제공
  • 아나콘다를 사용하지 않을 경우에는 pip install pandas 를 통해 설치할 수 있음
  • pandas를 사용하기 위해서는 먼저 pandas를 아래와 같이 import

Series (1차원)

import pandas as pd

data = [1,3,5,7,9]
s = pd.Series(data)
print(s)

0 1
1 3
2 5
3 7
4 9
dtype: int64

[DataFrame/2차원]

-파이썬의 딕셔너리의 key를 열로,value를 행으로 2차원 자료구조인 DataFrame으로 변환가능.

import pandas as pd
data = {
'year': [2016, 2017, 2018],
'GDP rate': [2.8, 3.1, 3.0],
'GDP': ['1.637M', '1.73M', '1.83M']
}
df = pd.DataFrame(data)
print(df)

year GDP rate GDP
0 2016 2.8 1.637M
1 2017 3.1 1.73M
2 2018 3.0 1.83M

데이터 필터링

  • pandas는 자료구조에 대해 인덱싱 혹은 속성을 사용해 특정 조건의 데이터를 필터링 가능.
import pandas as pd
data = {
'year': [2016, 2017, 2018],
'GDP rate': [2.8, 3.1, 3.0],
'GDP': ['1.637M', '1.73M', '1.83M']
}
df = pd.DataFrame(data)
print(df[df["year"] < 2018])

year GDP rate GDP
0 2016 2.8 1.637M
1 2017 3.1 1.73M

🚀 Matplotlib 라이브러리

• Matplotlib는 파이썬에서 데이터를 차트나 플롯(Plot)으로 그려주는 라이브러리 패키지로서 가장 많이 사용되는 데이터 시각화(Data Visualization) 패키지

from matplotlib import pyplot as plt 

plt.plot([1,2,3], [110,130,120])
plt.show()
plt.plot(["Seoul","Paris","Seattle"], 
[30,25,55])
plt.xlabel('City')
plt.ylabel('Response')
plt.title("result")
plt.show()

from matplotlib import pyplot as plt

plt.plot([1,2,3], [1,4,9])
plt.plot([2,3,4],[5,6,7])
plt.xlabel('Sequence')
plt.ylabel('Time(secs)')
plt.title('Experiment Result')
plt.legend(['Mouse', 'Cat']) #라인에 대한 범례 지정 
plt.show()

y = [5, 3, 7, 10, 9, 5, 3.5, 8]
x = range(len(y))

plt.bar(x,y,width =0.7 , color = 'blue')

plt.show()


좋은 웹페이지 즐겨찾기