Scikit-learn을 사용하여 교사 있어 학습(선형 단회귀)을 해본 [기초]

내용



Scikit-learn의 LinearRegression를 사용하여 boston 데이터 세트의 단일 회귀 분석을 시도해 보겠습니다. 이번에는 모델을 구축하고 단순히 회귀 분석을 합니다.

단회귀분석이란, 모델의 학습에 boston.data[:, [5]](방수) 1개만(설명변수 1개)로 학습하는 것을 말합니다.

데이터 세트 로드


from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression
import pandas as pd

# bostonデータセットの読み込み
boston = load_boston()

보충 boston 데이터 세트의 DataFrame 만들기
단지 단순히 데이터 세트를 읽었지만 다음과 같이 되어 버리므로 DataFrame으로 합니다.

boston_df = pd.DataFrame(data=boston.data,columns=boston.feature_names)
boston_df['PRICE'] = boston.target



이것으로 보기 쉬운 형태가 되었습니다.
각각의 컬럼의 내용인 이런 느낌입니다.

・CRIM・・・범죄 발생률(인구 단위)
・ZN・・・25,000제곱피트 이상의 주택 구획의 비율
・INDUS・・・비소매업의 토지 면적의 비율(인구 단위)
・CHAS・・・찰스강을 따라가는지 여부(1:Yes, 0:No)
・NOX・・・질소 산화물의 농도(pphm 단위)
・RM・・・1호당의 평균 방수
・AGE・・・1940년보다 전에 지어진 가옥의 비율
・DIS・・・보스턴의 주요 5개 고용권까지의 가중치가 있는 향리
・RAD・・・간선도로에의 액세스 지수
・TAX・・・10,000달러당 소득세율
・PTRATIO・・・교사당 학생 수(인구 단위)
・B・・・아프리카계 미국인 거주자의 비율(인구 단위)
・LSTAT・・・저소득자의 비율
· PRICE · · · 주택 가격

예측


# モデルの構築
model = LinearRegression()

# モデルの学習
# boston.data[:, [5]]はRM(部屋の数)、boston.target(住宅の価格)
model.fit(boston.data[:, [5]],boston.target)

# 予測精度
score = model.score(boston.data[:, [5]],boston.target)

print(score)

이러한 느낌으로 Scikit-learn을 사용하면 간단하게 단회귀 분석을 할 수 있습니다.

좋은 웹페이지 즐겨찾기