기계 학습 수학
5973 단어 DeepLearning
http://datascience.ibm.com/blog/the-mathematics-of-machine-learning/
지난 몇 달 동안 저는 데이터 과학이 세계에 대한 도전과 머신러닝(ML) 기술로 통계 규칙성을 탐색하고 완벽한 데이터 구동형 제품을 구축하는 열정에 대해 연락했습니다.그러나 나는 내가 실제적으로 유용한 결과를 얻기 위해 필요한 수학적 직감과 틀이 없다는 것을 안다.이것이 바로 내가 이 블로그 글을 쓰기로 결정한 주요 원인이다.최근에는 scikit-learn, Weka, Tensorflow, R-caret 등 사용하기 쉬운 기계와 딥러닝 소프트웨어 패키지가 많다.기계 학습 이론은 과학과 알고리즘 측면에서 생겨났는데 통계, 랜덤, 컴퓨터 데이터에서 반복적으로 학습하여 스마트 응용을 구축하는 데 사용할 수 있는 은밀한 통찰력을 찾았다.비록 기계와 딥러닝의 커다란 가능성에도 불구하고 이러한 기교 중 많은 것을 철저히 수학적으로 이해하는 것은 알고리즘의 내부 동작을 잘 이해하고 좋은 결과를 얻는 데 필수적이다.
너는 왜 수학을 걱정하니?
기계 학습의 수학이 매우 중요한 원인은 매우 많은데, 다음은 내가 그것들 중의 일부를 강조하고자 한다.
1. 적당한 알고리즘을 선택하는데 정확성, 훈련 시간, 모델의 복잡성, 파라미터 수량과 요소 수량을 고려한다.
2. 매개 변수 설정 및 정책 선택 검증
3. 편차 편차의 절충을 이해하여 아래 표와 초과 배합을 확정한다.
4. 적당한 신뢰 구간과 불확실성 추정.
당신은 어떤 수준의 수학이 필요합니까?
기계 학습 같은 학과를 뛰어넘는 분야를 이해하고 싶을 때, 주요한 문제는 당신이 필요로 하는 수학 수량과 당신이 필요로 하는 수학 수준이며, 이러한 기교를 이해해야 한다.이 문제에 대한 대답은 다차원적이며 개인의 수준과 흥미에 달려 있다.수학 연구와 기계 학습의 이론적 진보가 진행 중이며, 일부 연구원들은 더욱 고급 기술에 주력하고 있다.나는 기계 학습 과학자/엔지니어가 되기 위해 필요한 수학의 최저 수준과 각 수학 개념의 중요성을 논술할 것이다.
1. 선형 대수:
동료 Skyler Speakman은 최근 "선형 대수는 21세기 수학"이라고 말했다. 나는 이 주장에 동의한다.L에서는 선형 대수를 어디에서나 볼 수 있습니다.(PCA), 기이한 값 분해(SVD), 행렬의 특징값 분해, LU분해, QR분해/인자화, 대칭 행렬, 정교화와 정교화, 행렬 연산, 투영, 특징값과 고유 벡터, 벡터 공간과 범수 머신러닝에 사용되는 최적화 방법.선형 대수의 놀라운 점은 온라인 자원이 매우 많다는 데 있다.나는 전통 교실이 인터넷에서 이용할 수 있는 거대한 자원 때문에 죽을 것이라고 줄곧 말해 왔다.내가 좋아하는 선형 대수 과정은 MIT 코스웨아(Gilbert Strang 교수)가 제공한 과정이다.
http://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/
2. 확률론과 통계:
기계 학습과 통계는 그다지 다르지 않은 영역이다.사실 어떤 사람들은 최근에 Machine Learning을'Mac에서 통계를 낸다'고 정의했다.확률론과 확률, 베일스정리, 무작위 변수, 방차와 기대, 조건분포와 동시분포, 표준분포(버누리, 이항수, 다항식, 균일과 고스분포), 매트릭스(Maximum Likelihood Estimation, MLE), 전후와 후부, 최대후검측평가(MAP)와 샘플링 방법을 포함한다.
3. 다변량 분석:
필요한 주제는 미분 적분, 부분 미분, 벡터 값 함수, 방향 사다리, 하이세 행렬, 아크비 행렬, 라프라스 분포, 라그라그 분포 등을 포함한다.
4. 알고리즘 및 복잡성 최적화:
이것은 기계 학습 알고리즘의 계산 효율과 확장성을 이해하고 데이터 집합의 확장성을 이용하는 데 매우 중요하다.데이터 구조(2진 트리, 산열, 더미, 창고 등), 동적 프로그래밍, 랜덤화와 자행 알고리즘, 도표, 점차적/랜덤 강수와 주 이중 방법을 알아야 합니다.
5. 기타:
그것은 상술한 네 가지 주요 영역에 포함되지 않은 다른 수학 주제들로 구성되어 있다.그것들은 실수와 복수 분석(집합과 순서, 토폴로지, 도량 공간, 단값과 연속 함수, 극한, 코시네핵, 부립엽 변환), 정보 이론(엔트로피, 정보 이득), 함수 공간과 트랜지스터를 포함한다.
기계 학습에 필요한 몇 가지 수학 주제에 대한 온라인 MOOC와 자료는 다음과 같다.
카인 대학의 선형 대수, 확률과 통계, 다변량 미적분과 최적화.
https://www.khanacademy.org/math/probability
https://www.khanacademy.org/math/calculus-home/multivariable-calculus
https://www.khanacademy.org/math/differential-calculus/derivative-applications/calc-optimization/e/optimization
브라운대 Philip Klein 컴퓨터 과학 응용 프로그램이 행렬에 대한 인코딩: 선형 대수.
http://codingthematrix.com/
선형 대수 - 텍사스 대학교 Robert van de Geijn의 Frontiers to Foundiers
https://www.edx.org/course/linear-algebra-foundations-frontiers-utaustinx-ut-5-04x
선형 대수의 응용, 제1부분과 제2부분.David Chartier, Davidson College의 새로운 과정입니다.
https://www.edx.org/course/applications-linear-algebra-part-1-davidsonx-d003x-1
https://www.edx.org/course/applications-linear-algebra-part-2-davidsonx-d003x-2
Joseph Blitzstein-Harvard Stat 110 강좌.
http://projects.iq.harvard.edu/stat110/youtube
라리바세만서 - 모든 통계: 통계 추론의 간결한 과정.
http://read.pudn.com/downloads158/ebook/702714/Larry%20Wasserman_ALL%20OF%20Statistics.pdf
Boyd와 Vandenberghe에서 온 스탠퍼드 대학의 철면 최적화 과정.
http://stanford.edu/~boyd/cvxbook/
선형 대수-edX에서 경계까지의 기초
https://www.edx.org/course/linear-algebra-foundations-frontiers-utaustinx-ut-5-04x
Udacity의 통계 입문.
https://www.udacity.com/course/intro-to-statistics--st101
마지막으로 이 블로그 글의 주요 목적은 수학이 기계 학습에서의 중요성과 이런 주제를 익히는 데 필요한 주제와 유용한 자원에 대한 현명한 조언을 제공하는 것이다.그러나 일부 기계 학습 애호가들은 수학 초보자이기 때문에 아마도 이 게시물이 나를 매우 걱정하게 할 것이다. (진지하게 말하자면 이것은 나의 목표가 아니다.)초보자는 수학으로 기계 학습을 시작할 필요가 없다.기본적인 전제 조건은 데이터 분석이다. 이 블로그 글에서 말한 바와 같이 더 많은 방법과 알고리즘을 배우는 과정에서 수학을 배울 수 있다.
Reference
이 문제에 관하여(기계 학습 수학), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/miyamotok0105/items/c134ed64ae2d7dc1c3d7
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
기계 학습 같은 학과를 뛰어넘는 분야를 이해하고 싶을 때, 주요한 문제는 당신이 필요로 하는 수학 수량과 당신이 필요로 하는 수학 수준이며, 이러한 기교를 이해해야 한다.이 문제에 대한 대답은 다차원적이며 개인의 수준과 흥미에 달려 있다.수학 연구와 기계 학습의 이론적 진보가 진행 중이며, 일부 연구원들은 더욱 고급 기술에 주력하고 있다.나는 기계 학습 과학자/엔지니어가 되기 위해 필요한 수학의 최저 수준과 각 수학 개념의 중요성을 논술할 것이다.
1. 선형 대수:
동료 Skyler Speakman은 최근 "선형 대수는 21세기 수학"이라고 말했다. 나는 이 주장에 동의한다.L에서는 선형 대수를 어디에서나 볼 수 있습니다.(PCA), 기이한 값 분해(SVD), 행렬의 특징값 분해, LU분해, QR분해/인자화, 대칭 행렬, 정교화와 정교화, 행렬 연산, 투영, 특징값과 고유 벡터, 벡터 공간과 범수 머신러닝에 사용되는 최적화 방법.선형 대수의 놀라운 점은 온라인 자원이 매우 많다는 데 있다.나는 전통 교실이 인터넷에서 이용할 수 있는 거대한 자원 때문에 죽을 것이라고 줄곧 말해 왔다.내가 좋아하는 선형 대수 과정은 MIT 코스웨아(Gilbert Strang 교수)가 제공한 과정이다.
http://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/
2. 확률론과 통계:
기계 학습과 통계는 그다지 다르지 않은 영역이다.사실 어떤 사람들은 최근에 Machine Learning을'Mac에서 통계를 낸다'고 정의했다.확률론과 확률, 베일스정리, 무작위 변수, 방차와 기대, 조건분포와 동시분포, 표준분포(버누리, 이항수, 다항식, 균일과 고스분포), 매트릭스(Maximum Likelihood Estimation, MLE), 전후와 후부, 최대후검측평가(MAP)와 샘플링 방법을 포함한다.
3. 다변량 분석:
필요한 주제는 미분 적분, 부분 미분, 벡터 값 함수, 방향 사다리, 하이세 행렬, 아크비 행렬, 라프라스 분포, 라그라그 분포 등을 포함한다.
4. 알고리즘 및 복잡성 최적화:
이것은 기계 학습 알고리즘의 계산 효율과 확장성을 이해하고 데이터 집합의 확장성을 이용하는 데 매우 중요하다.데이터 구조(2진 트리, 산열, 더미, 창고 등), 동적 프로그래밍, 랜덤화와 자행 알고리즘, 도표, 점차적/랜덤 강수와 주 이중 방법을 알아야 합니다.
5. 기타:
그것은 상술한 네 가지 주요 영역에 포함되지 않은 다른 수학 주제들로 구성되어 있다.그것들은 실수와 복수 분석(집합과 순서, 토폴로지, 도량 공간, 단값과 연속 함수, 극한, 코시네핵, 부립엽 변환), 정보 이론(엔트로피, 정보 이득), 함수 공간과 트랜지스터를 포함한다.
기계 학습에 필요한 몇 가지 수학 주제에 대한 온라인 MOOC와 자료는 다음과 같다.
카인 대학의 선형 대수, 확률과 통계, 다변량 미적분과 최적화.
https://www.khanacademy.org/math/probability
https://www.khanacademy.org/math/calculus-home/multivariable-calculus
https://www.khanacademy.org/math/differential-calculus/derivative-applications/calc-optimization/e/optimization
브라운대 Philip Klein 컴퓨터 과학 응용 프로그램이 행렬에 대한 인코딩: 선형 대수.
http://codingthematrix.com/
선형 대수 - 텍사스 대학교 Robert van de Geijn의 Frontiers to Foundiers
https://www.edx.org/course/linear-algebra-foundations-frontiers-utaustinx-ut-5-04x
선형 대수의 응용, 제1부분과 제2부분.David Chartier, Davidson College의 새로운 과정입니다.
https://www.edx.org/course/applications-linear-algebra-part-1-davidsonx-d003x-1
https://www.edx.org/course/applications-linear-algebra-part-2-davidsonx-d003x-2
Joseph Blitzstein-Harvard Stat 110 강좌.
http://projects.iq.harvard.edu/stat110/youtube
라리바세만서 - 모든 통계: 통계 추론의 간결한 과정.
http://read.pudn.com/downloads158/ebook/702714/Larry%20Wasserman_ALL%20OF%20Statistics.pdf
Boyd와 Vandenberghe에서 온 스탠퍼드 대학의 철면 최적화 과정.
http://stanford.edu/~boyd/cvxbook/
선형 대수-edX에서 경계까지의 기초
https://www.edx.org/course/linear-algebra-foundations-frontiers-utaustinx-ut-5-04x
Udacity의 통계 입문.
https://www.udacity.com/course/intro-to-statistics--st101
마지막으로 이 블로그 글의 주요 목적은 수학이 기계 학습에서의 중요성과 이런 주제를 익히는 데 필요한 주제와 유용한 자원에 대한 현명한 조언을 제공하는 것이다.그러나 일부 기계 학습 애호가들은 수학 초보자이기 때문에 아마도 이 게시물이 나를 매우 걱정하게 할 것이다. (진지하게 말하자면 이것은 나의 목표가 아니다.)초보자는 수학으로 기계 학습을 시작할 필요가 없다.기본적인 전제 조건은 데이터 분석이다. 이 블로그 글에서 말한 바와 같이 더 많은 방법과 알고리즘을 배우는 과정에서 수학을 배울 수 있다.
Reference
이 문제에 관하여(기계 학습 수학), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/miyamotok0105/items/c134ed64ae2d7dc1c3d7텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)