기계 학습 프로젝트 진행 방법: 'Machine Learning Yearning' 19장(스탠포드 대학 Andrew Ng 교수)

현재 AI와 기계 학습 세계에서 가장 유명한 스탠포드 대학의 Andrew Ng 교수가 'Machine Learning Yearning'이라는 온라인 책을 쓰고 있습니다. 2018년 4월에 그 초안 버전(1-22장)이 온라인으로 게시 중입니다. 이 게시물은 신속하게 번역을 진행하고 있습니다.

h tp // w w. mぇ아 r 마인 g. rg/


이 책은 기계 학습 프로젝트를 구축하는 방법을 제공합니다. 또한 기계 학습 알고리즘을 가르치는 대신 기계 학습 알고리즘이 작동하는 방식에 중점을 둡니다.

이 게시물은 17-18 장의 번역입니다. 조금씩 번역해 갑니다. ※번역이 다르면 지적해 주십시오.
이 책은 매우 읽기 쉽고 각 장의 짧은 부분에 나열되어 있습니다.

1~5장 번역

【Draft판 공개】Machine Learning Yearning 1~5장 by stanford 대학 Andrew Ng 교수

6장 번역

【Draft판 공개】Machine Learning Yearning 6장 by stanford 대학 Andrew Ng 교수

7-8장 번역

【Draft판 공개】Machine Learning Yearning 7~8장 by stanford 대학 Andrew Ng 교수

9-10장 번역

【Draft판 공개】Machine Learning Yearning 9~10장 by stanford 대학 Andrew Ng 교수

11-12장 번역

【Draft판 공개】Machine Learning Yearning 11~12장 by stanford 대학 Andrew Ng 교수

13-14장 번역

기계 학습 프로젝트 진행 방법: 'Machine Learning Yearning' 13-14장(스탠포드 대학 Andrew Ng 교수)

15-16장 번역

기계 학습 프로젝트 진행 방법: 'Machine Learning Yearning' 15-16장(스탠포드 대학 Andrew Ng 교수)

17-18장 번역

기계 학습 프로젝트 진행 방법: 'Machine Learning Yearning' 17-18장(스탠포드 대학 Andrew Ng 교수)

19. Takeaways: Basic error analysis(요점: 기본적인 오류 분석의 생각)


  • 새로운 프로젝트를 시작한 후에는 특별히 전문가가 아닌 지역에 있다면 가장 유망한 방향을 추측하고 프로젝트를 정확하게 움직이는 것은 어렵습니다.
  • 그래서 완벽한 시스템의 디자인과 구축으로 시작하는 것을 그만 두십시오. 대신 기본 시스템을 신속하게 구축하고 훈련하십시오. 가능하면 며칠 안에. 그런 다음 오류 분석을 이용하여 가장 유망한 방향성(아이디어)을 파악하고 반복적으로 알고리즘을 개선해 나갈 것입니다.
  • 알고리즘이 오분류한 100건 미만의 개발 세트의 샘플을 사람 손으로 검사해, 주요 에러 카테고리를 세어, 에러 분석을 실행해 주세요. 이 정보를 사용하여 어떤 유형의 오류를 수정할지 우선 순위를 지정합니다.
  • 개발 세트를 「주요의 아버지 개발 세트※」와 「블랙 박스 개발 세트」의 2개의 서브 세트로 나누는 것을 검토해 주세요. 만약, 「주요의 아버지 개발 세트」의 퍼포먼스가 「블랙 박스 개발 세트」보다 매우 뛰어난 경우, 전자의 서브 세트에 대해서 오버 피트하고 있으므로, 한층 더 데이터가 필요하게 되는 것을 검토해 제발.
  • 눈동자의 아버지 개발 세트 : 수동으로 검사하는 용 ※눈동자의 아버지<- 의역입니다.
  • 블랙 박스 개발 세트 : 수동으로 검사하지 않는 용

  • 「주요의 아버지 개발 세트」는, 알고리즘의 오분류를 검사하기에 충분히 큰 사이즈로 해야 합니다. "블랙 박스 개발 세트"는 많은 애플리케이션에 대해 1,000 ~ 10,000 샘플이면 충분합니다.
  • 당신의 개발 세트가 위와 같이 서브 세트로 분할하기에 충분한 사이즈가 아닌 경우에는, 사람 손으로의 에러 분석·모델 선택·하이퍼 파라미터의 조정을 위해서 “주요의 아버지 개발 세트”만 사용합니다.
  • 좋은 웹페이지 즐겨찾기