데이터 과학을 시작하기 위한 궁극의 가이드.
5051 단어 datamachinelearningdatascienceai
데이터 과학이란 무엇입니까?
1980년대에 도입된 데이터 사이언스라는 용어는 지금도 많은 사람들에게 혼란을 주고 있습니다.
"데이터 과학은 복잡한 모델을 만드는 것이 아닙니다. 멋진 시각화를 만드는 것이 아닙니다. 코드를 작성하는 것이 아닙니다..."-
그럼 뭔데?
#it's up to you
if YouWant == True:
YouCan
else:
YouCan't
데이터 과학의 역사
데이터 과학이 the sexiest job of the 21st century이 되기 전인 초기에는 데이터 마이닝이 인기 있는 용어였습니다. 1996년 기사 'From Data Mining to Knowledge Discovery in Databases'에서 Usama Fayyad, Gregory Piatetsky-Shapiro 및 Padhraic Smyth는 데이터 마이닝을 특정 알고리즘을 사용하여 데이터에서 유용한 지식과 패턴을 발견하는 전체 프로세스로 언급했습니다.
2001년 William S. Cleveland는 데이터 마이닝의 가능성을 확장하고 강력한 혁신의 힘을 만들어낼 것이라는 믿음으로 통계를 훨씬 더 기술적으로 만들어 컴퓨터 과학과 데이터 마이닝을 결합하기로 결정했습니다.
요즘에는 데이터 과학으로 알려진 통계 컴퓨팅 성능을 활용할 수 있습니다.
Data Science is an interdisciplinary field where its true foundations are in Statistics, Mathematics, Computer Science, and business too
"데이터 사이언티스트가 되고 싶은데 어디서부터 시작해야 할까요?..."
많은 사람들이 통계, 다른 사람들은 수학, 다른 사람들은 프로그래밍...
최고의 대답은? 알아 보자.
데이터 사이언스가 바다라고 가정하면...
1단계 - 바다 주변 항해
누군가는 "데이터 과학자는 단지 과잉 급여를 받는 통계학자일 뿐입니다"라고 말했습니다. 얼마나 사실입니까?
Statistics is the science concerned with developing and studying methods for collecting, analyzing, interpreting and presenting empirical data
. 데이터 과학과 통계 모두에서 우리의 주요 관심사는 데이터입니다. 수집된 데이터에서 인사이트를 얻는 방법, 데이터를 수집하고 조작하는 방식...(데이터 랭글링).따라서 확률 및 통계 도구를 갖추면 데이터 작업, 상관 관계 찾기, 유용한 통찰력 얻기가 쉬워집니다.
Coursera의 Probability and Statistics: To p or not to p?, edX의 Statistical Learning 및 Gareth James, Daniela Witten, Trevor Hastie 및 Rob Tibshirani의 멋진 책An Introduction to Statistical Learning을 포함하여 확률 및 통계를 배울 수 있는 멋진 무료 리소스와 멋진 플랫폼이 온라인에 있습니다.
2단계 - 컴퓨터 과학의 만으로 이동 🖥️
코딩하는 방법을 알고 있습니까?
데이터 과학을 위한 두 가지 주요 프로그래밍 언어(Python 및 R)가 있습니다. R과 달리 Python은 더 대중적이고 매우 유연하여 웹 개발, 웹 스크래핑, 임베디드 시스템 등과 같은 다른 도메인으로 전환하는 데 도움이 됩니다.
Python 프로그래밍 여정을 시작할 수 있는 몇 가지 온라인 무료 리소스가 있습니다. 여기에는 가장 인기 있는 Python 프로그래밍 자습서가 포함되어 있습니다.
DataCamp 및 Coursera과 같은 플랫폼에도 프로그래밍을 시작할 수 있는 멋진 코스가 있습니다.
더 깊고 폭풍우가 치는 바다 🌊로 모험을 떠날 준비가 되셨나요?
3단계 - 기계 학습 및 딥 러닝
최근에 저는 Understanding Machine Learning and its Basic Workflow에 기계 학습이 무엇인지, 그리고 실제 세계에서 기계 학습의 완전한 워크플로를 설명하는 기사를 게시했습니다.
기계 학습에서는 모델을 구축하고 예측에 사용하는 방법과 내부에서 발생하는 수학에 대해 배웁니다.
머신 러닝 및 딥 러닝에 대한 자세한 내용은 Daniel Bourke의 머신 러닝 로드맵 클립이 포함된 유용한 정보가 풍부한 블로그를 참조하십시오.
우와!! 우리는 모든 것을 간단하게 논의했습니다.
나머지는 어디에서 찾을 수 있습니까?...
>Google이 모든 것을 준비했습니다!!
결론적으로 365 Data Science은 데이터 엔지니어 및 데이터 분석가를 포함하여 '데이터' 분야의 더 많은 개념을 이해하고 그들의 역할을 깊이 있게 설명하는 데 도움이 되는 무료 "데이터 과학 경력 시작:"을 제공하고 있습니다.
Reference
이 문제에 관하여(데이터 과학을 시작하기 위한 궁극의 가이드.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/gateremark/the-ultimate-guide-to-getting-started-in-data-science-2c7a텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)