Python으로 시작하는 기계 학습 개인 비망록 Part1
소개
파이썬으로 기계 학습을 배우려고 생각합니다.
우선 손에 든 책 「Python으로 시작하는 기계 학습」을 읽어 갈 때의 개인적 비망록으로서 쓰고 있습니다.
IT 기업에는 소속되어 있지 않습니다만, 앞으로 여러가지 배워서 일을 해 나갈 수 있도록 정진해 나갈 것입니다.
초학자에게 조금이라도 힘이 되면 생각하고 로그를 남기고 있습니다.
scikit-learn 설치
scikit-learn(사이킷 런)이라고 읽습니다.
아래 링크에는 취급 설명서가 있습니다.
일부 사람 만일지도 모릅니다만, 링크처의 그림을 보고 있으면 gnuplot를 기억하네요.
· scikit-learn 문서
· scikit-learn 사용자 가이드
Jupyter Notebook을 설치할지 고민했지만 처음이므로 책을 따르기로 결정했습니다.
사용해 보면 편리할지도 모르겠네요.
Jupyter Notebook을 설치하려면 Anaconda를 설치합니다.
· Anaconda 공식 사이트의 다운로드 페이지
Anaconda를 설치하면이 책에서 사용하는 모든 패키지를 사용할 수 있습니다.
이미 파이썬을 사용하는 사람은 터미널에서
pip install numpy scipy matplotlib ipython scikit-learn pandas pillow
라고 치면 이 책에서 이용하는 라이브러리를 인스톨 할 수 있습니다.
Jupyter Notebook의 사용법은 아래의 링크처에 써 있습니다.
【Jupyter Notebook】 효과적인 사용법을 알자 [Python/기계 학습]
Numpy와 SciPy의 차이
NumPy(남파이 or 남파이)와 SciPy(사이파이)입니다.
SciPy는 각종 소프트의 집합으로, NumPy의 기능은 SciPy로 전부 사용할 수 있습니다.
· SciPy와 그 친구들 (NumPy, IPython 등)의 차이와 관계
· Numpy와 Scipy
나 같은 초학자로부터 하면, 큰 차이도 아직 모르기 때문에 신경쓰지 않고 갑니다.
CSR
CSR은 Compressed Sparse Row의 약어로 희소 행렬을 압축한 형태로 되어 있습니다.
행렬 계산해 주시는 성분이 0의 행렬을 취급하는 경우가 많기 때문에,
쓸데없이 데이터가 늘어나지 않는 편리한 형태로 하고 있다고 생각합니다.
COO 형식은 Coordinate Format의 약자로 보통 행렬의 번호를 지정해주는 방법입니다.
pandas
책에
from IPython import display
라고 쓰여졌지만 그 후
display(data_pandas)
곳에서
TypeError: 'module' object is not callable
그리고 오류가 발생합니다.
내 환경에서,
from IPython.display import display
그렇다면 잘 작동했습니다.
아마 버전이 다르기 때문이라고 생각합니다.
아이리스의 클래스 분류
scatter_matrix 함수를 사용할 때 책에서
grr = pd.scatter_matrix(iris_dataframe, c=y_train, figsize=(15,15), marker='o', hist_kwds={'bins': 20}, s=60, alpha=.8, cmap=mglearn.cm3)
그리고 설명이 있지만 내 버전이라고
grr = pd.plotting.scatter_matrix(iris_dataframe, c=y_train, figsize=(15,15), marker='o', hist_kwds={'bins': 20}, s=60, alpha=.8, cmap=mglearn.cm3)
로 움직였다.
감상
이번에는 제1장 소개를 읽고 몰랐던 곳을 썼다.
환경의 정비가 대부분이었지만, 마지막으로 조금만 기계 학습에 대해서도 언급했다.
k-최근접법으로 아이리스의 분류를 실시했지만 모델의 상세한 부분은 접하고 있지 않다.
파라미터가 여러 가지 있지만 변경하는 파라미터는 이 장에서 소개해 가면 기술이 있었다.
지금은, 파라미터 가득 차서 모르는 상태입니다만 계속해서 가고 싶습니다.
다음 번부터는 본격적으로 기계 학습의 내용, 교사 있어 학습에 대해 배워 간다.
Reference
이 문제에 관하여(Python으로 시작하는 기계 학습 개인 비망록 Part1), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/daichi_taiyo/items/427a5ac1731147aec5f5
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
scikit-learn(사이킷 런)이라고 읽습니다.
아래 링크에는 취급 설명서가 있습니다.
일부 사람 만일지도 모릅니다만, 링크처의 그림을 보고 있으면 gnuplot를 기억하네요.
· scikit-learn 문서
· scikit-learn 사용자 가이드
Jupyter Notebook을 설치할지 고민했지만 처음이므로 책을 따르기로 결정했습니다.
사용해 보면 편리할지도 모르겠네요.
Jupyter Notebook을 설치하려면 Anaconda를 설치합니다.
· Anaconda 공식 사이트의 다운로드 페이지
Anaconda를 설치하면이 책에서 사용하는 모든 패키지를 사용할 수 있습니다.
이미 파이썬을 사용하는 사람은 터미널에서
pip install numpy scipy matplotlib ipython scikit-learn pandas pillow
라고 치면 이 책에서 이용하는 라이브러리를 인스톨 할 수 있습니다.
Jupyter Notebook의 사용법은 아래의 링크처에 써 있습니다.
【Jupyter Notebook】 효과적인 사용법을 알자 [Python/기계 학습]
Numpy와 SciPy의 차이
NumPy(남파이 or 남파이)와 SciPy(사이파이)입니다.
SciPy는 각종 소프트의 집합으로, NumPy의 기능은 SciPy로 전부 사용할 수 있습니다.
· SciPy와 그 친구들 (NumPy, IPython 등)의 차이와 관계
· Numpy와 Scipy
나 같은 초학자로부터 하면, 큰 차이도 아직 모르기 때문에 신경쓰지 않고 갑니다.
CSR
CSR은 Compressed Sparse Row의 약어로 희소 행렬을 압축한 형태로 되어 있습니다.
행렬 계산해 주시는 성분이 0의 행렬을 취급하는 경우가 많기 때문에,
쓸데없이 데이터가 늘어나지 않는 편리한 형태로 하고 있다고 생각합니다.
COO 형식은 Coordinate Format의 약자로 보통 행렬의 번호를 지정해주는 방법입니다.
pandas
책에
from IPython import display
라고 쓰여졌지만 그 후
display(data_pandas)
곳에서
TypeError: 'module' object is not callable
그리고 오류가 발생합니다.
내 환경에서,
from IPython.display import display
그렇다면 잘 작동했습니다.
아마 버전이 다르기 때문이라고 생각합니다.
아이리스의 클래스 분류
scatter_matrix 함수를 사용할 때 책에서
grr = pd.scatter_matrix(iris_dataframe, c=y_train, figsize=(15,15), marker='o', hist_kwds={'bins': 20}, s=60, alpha=.8, cmap=mglearn.cm3)
그리고 설명이 있지만 내 버전이라고
grr = pd.plotting.scatter_matrix(iris_dataframe, c=y_train, figsize=(15,15), marker='o', hist_kwds={'bins': 20}, s=60, alpha=.8, cmap=mglearn.cm3)
로 움직였다.
감상
이번에는 제1장 소개를 읽고 몰랐던 곳을 썼다.
환경의 정비가 대부분이었지만, 마지막으로 조금만 기계 학습에 대해서도 언급했다.
k-최근접법으로 아이리스의 분류를 실시했지만 모델의 상세한 부분은 접하고 있지 않다.
파라미터가 여러 가지 있지만 변경하는 파라미터는 이 장에서 소개해 가면 기술이 있었다.
지금은, 파라미터 가득 차서 모르는 상태입니다만 계속해서 가고 싶습니다.
다음 번부터는 본격적으로 기계 학습의 내용, 교사 있어 학습에 대해 배워 간다.
Reference
이 문제에 관하여(Python으로 시작하는 기계 학습 개인 비망록 Part1), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/daichi_taiyo/items/427a5ac1731147aec5f5
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
grr = pd.scatter_matrix(iris_dataframe, c=y_train, figsize=(15,15), marker='o', hist_kwds={'bins': 20}, s=60, alpha=.8, cmap=mglearn.cm3)
grr = pd.plotting.scatter_matrix(iris_dataframe, c=y_train, figsize=(15,15), marker='o', hist_kwds={'bins': 20}, s=60, alpha=.8, cmap=mglearn.cm3)
이번에는 제1장 소개를 읽고 몰랐던 곳을 썼다.
환경의 정비가 대부분이었지만, 마지막으로 조금만 기계 학습에 대해서도 언급했다.
k-최근접법으로 아이리스의 분류를 실시했지만 모델의 상세한 부분은 접하고 있지 않다.
파라미터가 여러 가지 있지만 변경하는 파라미터는 이 장에서 소개해 가면 기술이 있었다.
지금은, 파라미터 가득 차서 모르는 상태입니다만 계속해서 가고 싶습니다.
다음 번부터는 본격적으로 기계 학습의 내용, 교사 있어 학습에 대해 배워 간다.
Reference
이 문제에 관하여(Python으로 시작하는 기계 학습 개인 비망록 Part1), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/daichi_taiyo/items/427a5ac1731147aec5f5텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)