numpy를 사용하여 선형 회귀 모델 피팅
문맥
파이썬 초보자로서 다양한 소스, 다양한 방법에서 배우려고 합니다. 브라질 블로그(estatsite.com.br)를 읽다가 선형 회귀 모델에 대한 흥미로운 주제를 찾았는데 R에 있었습니다.
그래서 그의 예를 들어 Python에 적용했는데 sklearn 패키지를 사용하여 문제를 발견하자마자 numpy method: numpy.polyfit()
를 찾았습니다. 공식documentation은 매우 명확하고 간결합니다.
우리가 원하는 것?
선형 회귀 모델을 사용하여 학생들이 더 많은 돈을 벌수록 성적이 더 좋아지는지 확인하고 싶습니다.
공식 문서에서 빠른 검토
그것에 따르면 numpy.polyfit()
는 다항식 최소 제곱에 적합합니다. 다항식 p를 고려하십시오.
차수의 제곱 오차를 최소화하는 p 계수 벡터
발생합니다.
일반적인 죄악은 다음과 같습니다.
numpy.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False)
.
x, y, deg
와 같은 매개변수를 완료해야 합니다.
최소화된 오차 제곱의 일반 방정식은 다음과 같습니다.
호기심 많은 독자는 공식 문서를 읽어야 합니다.
암호
Hiphotesis: 학생들의 성과를 업그레이드하여 돈을 벌 수 있습니다.
# importing manipulation lib to visualize data
import pandas as pd
# importing numerycal processor lib
import numpy as np
# importing visualization lib
import matplotlib.pyplot as plt
# creating a dataframe
alunos = pd.DataFrame({
'André': {'Mesada': 36.02, 'Nota_Testao': 48},
'Joao': {'Mesada': 11.83, 'Nota_Testao': 25},
'Bia': {'Mesada': 22.0, 'Nota_Testao': 43},
'Ana': {'Mesada': 24.0, 'Nota_Testao': 39},
'José': {'Mesada': 100.0, 'Nota_Testao': 60},
'Vinicius': {'Mesada': 10.0, 'Nota_Testao': 40},
'Tulio': {'Mesada': 20.0, 'Nota_Testao': 48},
'Josué': {'Mesada': 25.0, 'Nota_Testao': 47},
'Antonella': {'Mesada': 22.0, 'Nota_Testao': 43},
})
# visualization of dataframe
alunos = alunos.T
alunos
# converting a series object into numpy array
x = np.array(alunos['Nota_Testao'])
y = np.array(alunos['Mesada']
열Mesada
은 종속 변수인 y입니다. 열 Nota_Testao
(x)는 예측자입니다.
print('Independent : ', x)
print('Dependent variable: ', y)
# ploting
plt.plot(x, y, 'o')
m, b = np.polyfit(x, y, 1)
plt.xlabel("Mesada (R$)")
plt.ylabel("Nota")
plt.show();
읽어 주셔서 감사합니다. 제안에 대해 열린 마음을 갖고 있습니다. 최종 실수에 대해 죄송합니다. 내 github 링크는 github.com/biangomes입니다.
Reference
이 문제에 관하여(numpy를 사용하여 선형 회귀 모델 피팅), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://dev.to/biangomes/fitting-a-linear-regression-model-using-numpy-1jnn
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
그것에 따르면
numpy.polyfit()
는 다항식 최소 제곱에 적합합니다. 다항식 p를 고려하십시오.차수의 제곱 오차를 최소화하는 p 계수 벡터
발생합니다.
일반적인 죄악은 다음과 같습니다.
numpy.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False)
.x, y, deg
와 같은 매개변수를 완료해야 합니다.최소화된 오차 제곱의 일반 방정식은 다음과 같습니다.
호기심 많은 독자는 공식 문서를 읽어야 합니다.
암호
Hiphotesis: 학생들의 성과를 업그레이드하여 돈을 벌 수 있습니다.
# importing manipulation lib to visualize data
import pandas as pd
# importing numerycal processor lib
import numpy as np
# importing visualization lib
import matplotlib.pyplot as plt
# creating a dataframe
alunos = pd.DataFrame({
'André': {'Mesada': 36.02, 'Nota_Testao': 48},
'Joao': {'Mesada': 11.83, 'Nota_Testao': 25},
'Bia': {'Mesada': 22.0, 'Nota_Testao': 43},
'Ana': {'Mesada': 24.0, 'Nota_Testao': 39},
'José': {'Mesada': 100.0, 'Nota_Testao': 60},
'Vinicius': {'Mesada': 10.0, 'Nota_Testao': 40},
'Tulio': {'Mesada': 20.0, 'Nota_Testao': 48},
'Josué': {'Mesada': 25.0, 'Nota_Testao': 47},
'Antonella': {'Mesada': 22.0, 'Nota_Testao': 43},
})
# visualization of dataframe
alunos = alunos.T
alunos
# converting a series object into numpy array
x = np.array(alunos['Nota_Testao'])
y = np.array(alunos['Mesada']
열Mesada
은 종속 변수인 y입니다. 열 Nota_Testao
(x)는 예측자입니다.
print('Independent : ', x)
print('Dependent variable: ', y)
# ploting
plt.plot(x, y, 'o')
m, b = np.polyfit(x, y, 1)
plt.xlabel("Mesada (R$)")
plt.ylabel("Nota")
plt.show();
읽어 주셔서 감사합니다. 제안에 대해 열린 마음을 갖고 있습니다. 최종 실수에 대해 죄송합니다. 내 github 링크는 github.com/biangomes입니다.
Reference
이 문제에 관하여(numpy를 사용하여 선형 회귀 모델 피팅), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://dev.to/biangomes/fitting-a-linear-regression-model-using-numpy-1jnn
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
# importing manipulation lib to visualize data
import pandas as pd
# importing numerycal processor lib
import numpy as np
# importing visualization lib
import matplotlib.pyplot as plt
# creating a dataframe
alunos = pd.DataFrame({
'André': {'Mesada': 36.02, 'Nota_Testao': 48},
'Joao': {'Mesada': 11.83, 'Nota_Testao': 25},
'Bia': {'Mesada': 22.0, 'Nota_Testao': 43},
'Ana': {'Mesada': 24.0, 'Nota_Testao': 39},
'José': {'Mesada': 100.0, 'Nota_Testao': 60},
'Vinicius': {'Mesada': 10.0, 'Nota_Testao': 40},
'Tulio': {'Mesada': 20.0, 'Nota_Testao': 48},
'Josué': {'Mesada': 25.0, 'Nota_Testao': 47},
'Antonella': {'Mesada': 22.0, 'Nota_Testao': 43},
})
# visualization of dataframe
alunos = alunos.T
alunos
# converting a series object into numpy array
x = np.array(alunos['Nota_Testao'])
y = np.array(alunos['Mesada']
print('Independent : ', x)
print('Dependent variable: ', y)
# ploting
plt.plot(x, y, 'o')
m, b = np.polyfit(x, y, 1)
plt.xlabel("Mesada (R$)")
plt.ylabel("Nota")
plt.show();
Reference
이 문제에 관하여(numpy를 사용하여 선형 회귀 모델 피팅), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/biangomes/fitting-a-linear-regression-model-using-numpy-1jnn텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)