numpy를 사용하여 선형 회귀 모델 피팅

문맥



파이썬 초보자로서 다양한 소스, 다양한 방법에서 배우려고 합니다. 브라질 블로그(estatsite.com.br)를 읽다가 선형 회귀 모델에 대한 흥미로운 주제를 찾았는데 R에 있었습니다.

그래서 그의 예를 들어 Python에 적용했는데 sklearn 패키지를 사용하여 문제를 발견하자마자 numpy method: numpy.polyfit() 를 찾았습니다. 공식documentation은 매우 명확하고 간결합니다.

우리가 원하는 것?



선형 회귀 모델을 사용하여 학생들이 더 많은 돈을 벌수록 성적이 더 좋아지는지 확인하고 싶습니다.

공식 문서에서 빠른 검토



그것에 따르면 numpy.polyfit()는 다항식 최소 제곱에 적합합니다. 다항식 p를 고려하십시오.


차수의 제곱 오차를 최소화하는 p 계수 벡터
발생합니다.

일반적인 죄악은 다음과 같습니다.
numpy.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False) .
x, y, deg와 같은 매개변수를 완료해야 합니다.

최소화된 오차 제곱의 일반 방정식은 다음과 같습니다.



호기심 많은 독자는 공식 문서를 읽어야 합니다.

암호



Hiphotesis: 학생들의 성과를 업그레이드하여 돈을 벌 수 있습니다.

# importing manipulation lib to visualize data
import pandas as pd

# importing numerycal processor lib
import numpy as np

# importing visualization lib
import matplotlib.pyplot as plt

# creating a dataframe
alunos = pd.DataFrame({
    'André': {'Mesada': 36.02, 'Nota_Testao': 48},
    'Joao': {'Mesada': 11.83, 'Nota_Testao': 25},
    'Bia': {'Mesada': 22.0, 'Nota_Testao': 43},
    'Ana': {'Mesada': 24.0, 'Nota_Testao': 39},
    'José': {'Mesada': 100.0, 'Nota_Testao': 60},
    'Vinicius': {'Mesada': 10.0, 'Nota_Testao': 40},
    'Tulio': {'Mesada': 20.0, 'Nota_Testao': 48},
    'Josué': {'Mesada': 25.0, 'Nota_Testao': 47},
    'Antonella': {'Mesada': 22.0, 'Nota_Testao': 43},
})

# visualization of dataframe
alunos = alunos.T
alunos

# converting a series object into numpy array
x = np.array(alunos['Nota_Testao'])
y = np.array(alunos['Mesada']


Mesada은 종속 변수인 y입니다. 열 Nota_Testao (x)는 예측자입니다.

print('Independent : ', x)
print('Dependent variable: ', y)

# ploting 
plt.plot(x, y, 'o')

m, b = np.polyfit(x, y, 1)
plt.xlabel("Mesada (R$)")
plt.ylabel("Nota")
plt.show();



읽어 주셔서 감사합니다. 제안에 대해 열린 마음을 갖고 있습니다. 최종 실수에 대해 죄송합니다. 내 github 링크는 github.com/biangomes입니다.

좋은 웹페이지 즐겨찾기