기계 학습 선형 회귀 모델 강의 과제 시청각 보고서(현장 파괴에 효과적인 심도 있는 학습 강좌)

기계 학습


선형 회귀 모델


회귀 문제
  • 회귀 문제는 입력한 수치에 따라 연속값을 예측하는 문제를 가리킨다
  • 회귀 문제에서 사용 벡터를 입력하고 표량 값을 출력합니다.이때 입력에 사용되는 변수를 설명 변수(특징량)라고 하고 출력 값을 목적 변수라고 합니다.
    .주택 가격 예측
    .설명 변수: 부지 면적, 건축 연한 등
  • 목적 변수: 주택 가격
  • 선형 회귀
  • 선형 회귀는 회귀 문제를 풀기 위한 기계 학습 모델이다
  • 교사의 학습(정답이 있는 데이터가 있는 학습)을 통해 학습한다
  • m차원 벡터로 입력한 상황에서 m차원 파라미터의 각 요소가 곱한 결과와 (선형 결합)에 절편을 더한 결과를 출력한다.(입력된 비트가 어떻든지 간에 출력은 모두 표량이다.)
  • 매개 변수는 입력 벡터의 모든 요소가 출력에 어느 정도 영향을 미치는지 확정한다.매개 변수가 양수일 때 출력을 증가하고 매개 변수가 음수일 때 출력을 감소합니다.매개 변수가 0에 가까울 때 출력에 큰 영향을 미치지 않습니다
  • 이 매개 변수를 최적 값으로 설정함으로써 정확한 예측을 할 수 있다
  • 모델 선택
  • 만약에 수중의 모든 데이터를 배웠다면 미지의 데이터에 대한 예측 정밀도(범용성)를 평가하기 어렵다.따라서 일반적으로 수중의 데이터를 학습용과 테스트용으로 나눈다
  • 매개 변수 추정
  • 회귀 직선에 오차를 넣어 데이터가 관측된다고 가정하고 이 오차가 가장 시간적인 파라미터를 구하는 것이 기계 학습의 목표이다
  • 오차의 크기는 균형 오차로 표시할 수 있다.균형 오차는 각 데이터와 모델의 출력 차이를 제곱하여 합친 것이다.균형 오차가 적을수록 오차가 적다고 할 수 있다
  • 균일 오차를 가장 적게 하는 매개 변수를 구하는 방법을 최소 2승법이라고 한다.최소 2승법은 균형 오차의 사다리가 0인 점, 즉 매개 변수로 균형 오차를 미분한 후의 값이 0인 점을 구하는 방법이다.
  • 이렇게 얻은 매개 변수를 바탕으로 하는 회귀 직선이 모든 데이터에 적용되는지 확인 계수를 사용하여 평가할 수 있다.
  • 한스톤











    요약과 고찰
  • 단회귀분석에서 방수를 설명 변수로 하고 중회귀분석에서 방수와 범죄율을 설명 변수로 모델을 만든다
  • train_test_split을 가져오는 중 오류가 발생하여 수정되었습니다
  • 중회귀분석을 할 때 설명 변수로 건축 연수와 면적의 크기를 증가시켰는데 결과적으로 과도한 학습을 일으킨 것 같다.도표만 보면 예측 데이터에 대한 정확도는 현재로서는 괜찮아 보이지만 정밀도를 한층 높이고 싶은 상황에서 다른 기계 학습 모델을 사용하는 것이 좋다고 생각한다
  • 다음 (비선형 회귀 모델)

    좋은 웹페이지 즐겨찾기