파이썬 머신 러닝 소개: 2부
기계 학습 개술
간단하게 기계 학습을 요약하면 우리는 인공지능에 대량의 데이터를 제공했고 통계 데이터를 사용하여 우리가 제공한 데이터에 따라 예측했다.이것은 우리가 첫 번째 문장에서 토론한 서로 다른 알고리즘을 통해 실현된 것이다.기계 학습은 여러 가지 다른 사용 방식이 있는데 그 중 하나는 도박 사이트에서 기계 학습 모델을 사용하여 서로 다른 노름돈을 라인으로 설정하여 가능한 한 정확하게 하는 것이다.S/O
기계 학습의 절차는 일반적으로 먼저 데이터를 수집하고 정리하며 대부분의 데이터를 훈련 데이터에 넣은 다음에 나머지 데이터를 테스트 데이터에 넣는 것이다. 거기서 우리는 모델 테스트에 들어가 마지막으로 모델을 실제 응용 프로그램에 배치한다.이렇게 보입니다.
기왕 우리가 기계 학습이 무엇인지 이해한 이상 우리는 선형 회귀를 어떻게 하는지 배우는 첫걸음을 시작할 수 있다. 그것은 바로 데이터를 분해하는 것이다.
데이터 분할
1부에서 언급한 바와 같이, 나는 파이톤에서 scikit 학습 패키지를 사용하고 있다.따라서 데이터를 분할할 수 있도록 우리는 먼저 데이터를 x와 y수 그룹으로 설정해야 한다.y수조는 우리가 예측하고자 하는 내용을 포함하고 x수조는 우리의 데이터 상자에 다른 비 텍스트 데이터를 포함합니다.내가 배운 것이 자연 언어가 아니라면, 나는 선형 회귀를 사용하여 데이터를 처리하지 않을 것이다.모든 열 이름에 좋은 보기를 원하실 수도 있습니다. 그래서 편의를 위해서, 모든 열 이름을 보기 위해 정렬 목록을 호출할 수 있습니다.코드에서 이 모든 것을 완성하려면 다음과 같습니다.
sorted(df)
y=df['ColName']
X=df['ColName','ColName','ColName','ColName']
현재, 우리는 데이터를 적당한 수조로 나누었기 때문에, 우리는 데이터를 훈련하고 테스트하기 시작할 수 있다.
교육 및 테스트 데이터
우리의 데이터를 훈련하고 테스트하기 위해서 매우 간단합니다. 우리는scikit 학습 패키지에서 훈련 테스트 분할 방법을 가져오기만 하면 됩니다.완료되면 다음과 같이 데이터를 테스트하고 훈련할 것입니다.
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=101)
이것은 우리도 x와 y진열의 데이터를 훈련하고 테스트하는 것을 확보했다.test size 매개 변수는 테스트 데이터를 입력한 데이터 양입니다.일반적으로 30%는 테스트 데이터, 70%는 트레이닝 데이터로 사용되지만 모델에 따라 변경될 수 있습니다.예를 들어 위의 코드에서 1.0의 3.3을 제시했는데 이것은.7이 훈련 데이터에 들어간다는 것을 의미한다.random state 매개변수는 데이터의 임의 분열 수입니다.
우리는 현재 데이터를 성공적으로 분리한 후에 그것에 대해 교육과 테스트를 진행하였다.다음 단계는 우리의 모형을 훈련하기 시작하는 것이다!
모델 생성 및 교육
모델을 만들고 교육하기 위해 다음을 수행합니다.
1부에서 언급한 바와 같이, 나는 파이톤에서 scikit 학습 패키지를 사용하고 있다.따라서 데이터를 분할할 수 있도록 우리는 먼저 데이터를 x와 y수 그룹으로 설정해야 한다.y수조는 우리가 예측하고자 하는 내용을 포함하고 x수조는 우리의 데이터 상자에 다른 비 텍스트 데이터를 포함합니다.내가 배운 것이 자연 언어가 아니라면, 나는 선형 회귀를 사용하여 데이터를 처리하지 않을 것이다.모든 열 이름에 좋은 보기를 원하실 수도 있습니다. 그래서 편의를 위해서, 모든 열 이름을 보기 위해 정렬 목록을 호출할 수 있습니다.코드에서 이 모든 것을 완성하려면 다음과 같습니다.
sorted(df)
y=df['ColName']
X=df['ColName','ColName','ColName','ColName']
현재, 우리는 데이터를 적당한 수조로 나누었기 때문에, 우리는 데이터를 훈련하고 테스트하기 시작할 수 있다.교육 및 테스트 데이터
우리의 데이터를 훈련하고 테스트하기 위해서 매우 간단합니다. 우리는scikit 학습 패키지에서 훈련 테스트 분할 방법을 가져오기만 하면 됩니다.완료되면 다음과 같이 데이터를 테스트하고 훈련할 것입니다.
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=101)
이것은 우리도 x와 y진열의 데이터를 훈련하고 테스트하는 것을 확보했다.test size 매개 변수는 테스트 데이터를 입력한 데이터 양입니다.일반적으로 30%는 테스트 데이터, 70%는 트레이닝 데이터로 사용되지만 모델에 따라 변경될 수 있습니다.예를 들어 위의 코드에서 1.0의 3.3을 제시했는데 이것은.7이 훈련 데이터에 들어간다는 것을 의미한다.random state 매개변수는 데이터의 임의 분열 수입니다.
우리는 현재 데이터를 성공적으로 분리한 후에 그것에 대해 교육과 테스트를 진행하였다.다음 단계는 우리의 모형을 훈련하기 시작하는 것이다!
모델 생성 및 교육
모델을 만들고 교육하기 위해 다음을 수행합니다.
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=101)
모델을 만들고 교육하기 위해 다음을 수행합니다.
이러한 작업을 수행할 때 코드는 다음과 같습니다.
from sklearn.linear_model import LinearRegression
lm = LinearRegression()
lm.fit(X_train,y_train)
모델에 대한 의합을 진행하는 목적은 우리가 모델에 데이터를 제공하여 그것이 사용하고 있는 내용과 사용 도구를 명확하게 알 수 있도록 하는 것이다.의합 후 기계 학습 알고리즘의 추정기 파라미터와 설정을 표시합니다.이것은 당신이 만들고 있는 모델을 미세하게 조정하기 위해 변경할 수 있습니다.진정으로 모형을 조정하거나 선형 회귀의 깊이에 대한 정보를 더 알고 싶다면, 이 글link은 scikit learn의 선형 회귀 문서를 읽어 줍니다.잘 싸다
축하합니다!우리는 이미 선형 회귀 모델을 만드는 모든 프레임워크를 완성했다!우리가 배운 지식을 되돌아보자. 기계 학습이 무엇인지, 훈련과 테스트 데이터를 어떻게 분할하는지, 마지막으로 선형 회귀 모델을 어떻게 만들고 의합하는지!현재 우리는 우리의 모델을 만들었습니다. 우리는 우리가 만든 모델을 분석하고 평가해야 합니다. 이것은 본 시리즈의 세 번째 부분에서 공유할 것입니다!
시간을 내서 본문을 읽어 주셔서 감사합니다. 만약 당신이 좋아한다면 메시지를 남겨서 저에게 당신이 무엇을 좋아하거나 싫어하는지, 또는 다음에 듣고 싶은 어떤 문제나 주제를 알려주세요!
Reference
이 문제에 관하여(파이썬 머신 러닝 소개: 2부), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://dev.to/berett21/intro-to-machine-learning-in-python-part-2-2bpe
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
Reference
이 문제에 관하여(파이썬 머신 러닝 소개: 2부), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/berett21/intro-to-machine-learning-in-python-part-2-2bpe텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)