기계 학습 프로젝트 진행 방법: 'Machine Learning Yearning' 19장(스탠포드 대학 Andrew Ng 교수)

현재 AI와 기계 학습 세계에서 가장 유명한 스탠포드 대학의 Andrew Ng 교수가 'Machine Learning Yearning'이라는 온라인 책을 쓰고 있습니다. 2018년 4월에 그 초안 버전(1-22장)이 온라인으로 게시 중입니다. 이 게시물은 신속하게 번역을 진행하고 있습니다.

h tp // w w. mぇ아 r 마인 g. rg/

19. Takeaways: Basic error analysis(요점: 기본적인 오류 분석의 생각)

새로운 프로젝트를 시작한 후에는 특별히 전문가가 아닌 지역에 있다면 가장 유망한 방향을 추측하고 프로젝트를 정확하게 움직이는 것은 어렵습니다.

그래서 완벽한 시스템의 디자인과 구축으로 시작하는 것을 그만 두십시오. 대신 기본 시스템을 신속하게 구축하고 훈련하십시오. 가능하면 며칠 안에. 그런 다음 오류 분석을 이용하여 가장 유망한 방향성(아이디어)을 파악하고 반복적으로 알고리즘을 개선해 나갈 것입니다.

알고리즘이 오분류한 100건 미만의 개발 세트의 샘플을 사람 손으로 검사해, 주요 에러 카테고리를 세어, 에러 분석을 실행해 주세요. 이 정보를 사용하여 어떤 유형의 오류를 수정할지 우선 순위를 지정합니다.

개발 세트를 「주요의 아버지 개발 세트※」와 「블랙 박스 개발 세트」의 2개의 서브 세트로 나누는 것을 검토해 주세요. 만약, 「주요의 아버지 개발 세트」의 퍼포먼스가 「블랙 박스 개발 세트」보다 매우 뛰어난 경우, 전자의 서브 세트에 대해서 오버 피트하고 있으므로, 한층 더 데이터가 필요하게 되는 것을 검토해 제발.

눈동자의 아버지 개발 세트 : 수동으로 검사하는 용 ※눈동자의 아버지<- 의역입니다.

블랙 박스 개발 세트 : 수동으로 검사하지 않는 용

「주요의 아버지 개발 세트」는, 알고리즘의 오분류를 검사하기에 충분히 큰 사이즈로 해야 합니다. "블랙 박스 개발 세트"는 많은 애플리케이션에 대해 1,000 ~ 10,000 샘플이면 충분합니다.

당신의 개발 세트가 위와 같이 서브 세트로 분할하기에 충분한 사이즈가 아닌 경우에는, 사람 손으로의 에러 분석·모델 선택·하이퍼 파라미터의 조정을 위해서 “주요의 아버지 개발 세트”만 사용합니다.

Reference

이 문제에 관하여(기계 학습 프로젝트 진행 방법: 'Machine Learning Yearning' 19장(스탠포드 대학 Andrew Ng 교수)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/Ishio/items/bdeba4fb1d92677e88ec

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다