기계 학습 시작 [개념편]
입문
평소에 JS와 node로 프론트와 백엔드를 하는데 앞으로 회사에서도 기계 학습을 하고 기초부터 응용까지 자신이 이해하는 일을 Qiita로 정리해야 한다.
잘못된 것을 썼거나 부족한 정보가 있다면 언제든지 댓글란에 적어주시면 기쁩니다.
우선, 처음이기 때문에 기계 학습에 관한 개요는 매우 간단하다
기계 학습의 분류
나는 기계 학습 분야의 매력은 기업이 저장한 데이터를 지식으로 바꿀 수 있다는 데 있다고 생각한다.
대략적인 분류로 삼다
.메일 스팸메일 필터
체스 엔진
모델 구축 로드맵
이곳을 미리 처리하는 데 가장 시간이 걸린다.주로 원시 데이터에서 특징량을 추출하여 훈련 데이터 집합과 테스트 데이터 집합으로 나눈다.테스트 데이터 집합은 최종 모델을 평가할 때까지 보존해야 한다.이외에도 축소, 차원 삭감, 샘플링 등 각종 예처리 방법이 있다.이 일대는 앞으로의 보도에서 소개될 것이다
학습 훈련 데이터 집합을 이용하여 학습하다.예측 모델의 비교 선택.모든 알고리즘은 본질적인 특성을 가지고 있다.이 부근도 향후 보도에서 소개될 예정이다
최종 모델을 평가 테스트 데이터 집합에 응용하여 평가한다
예측은 새로운 데이터로 예측한다
대량 학습 및 온라인 학습
대량 학습
일괄 처리 학습은 학습 대상의 모든 데이터를 종합하여 통일적으로 처리하는 방법이다.
일반적인 교사로서 공부하는 시간의 흐름
1. 현재 무게치 예측
2. 예측치에 따라 원가 함수 계산
3. 무게 값 업데이트
이런 절차.이것은 기본적으로 대량 학습을 가정하는 경우가 매우 많다.
온라인 학습
대량 학습에 대해 온라인 학습은 학습 데이터에 들어갈 때마다 새로 들어온 데이터로만 학습하는 것을 말한다.
가장 큰 차이점은 학습을 할 때 1부터 모델을 다시 만드는 것이 아니라 이 데이터에 따라 기존 모델의 매개 변수를 수시로 업데이트하는 것이다.
웹 응용 프로그램의 고객 데이터와 같은 대량의 데이터가 저장되어 있을 때 유용합니다.
온라인 학습을 이용하면 변화에 강한 모델을 구축할 수 있겠지.
끝날 때
이번에 나는 기계 학습에 관한 기본적인 생각을 썼다.이 일대를 잘 이해했으면 좋겠어요.
다음 번 이후로 캡처용과 ADALINE를 설치하고 scikit-learn과 TensorFlow 등의 라이브러리를 사용하여 실제로 공부하고 싶습니다.
참고 문헌
Reference
이 문제에 관하여(기계 학습 시작 [개념편]), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/kazukiii/items/c357b5fdebc1c7575fcc텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)