[파 이 썬] [MachineLeaning] 파 이 썬 Scikit - learn 학습 노트 1 - Datasets & Estimators

2019 단어 python
Scikit - learn 홈 페이지: http://scikit-learn.org/stable/index.html
Datasets
표준 데이터 세트 형식 은 다 차원 특징 벡터 로 구 성 된 집합 이다.데이터 세트 의 표준 모양 (shape) 은 2 차원 배열 (samples, features) 이 고 그 중에서 samples 는 데이터 세트 크기 를 나타 내 며 features 는 그 중의 특징 벡터 의 위 수 를 나타 낸다.
사용 시 shape 방법 으로 데이터 세트 를 볼 수 있 습 니 다.
>>> from sklearn import datasets

>>> iris = datasets.load_iris()

>>> data = iris.data

>>> data.shape

(150, 4)

iris 데이터 세트 는 150 개의 데이터 샘플 을 포함 하고 모든 데이터 샘플 은 4 차원 의 특징 벡터 임 을 나타 낸다.
 
표준 모양 이 없 는 데이터 세트 는 처리 하고 모양 표준 데이터 세트 로 변환 해 처리 해 야 한다.
Scikit 가 자체 적 으로 가지 고 있 는 digits 데이터 세트 를 예 로 들 면 1797 개의 8x8 그 레이스 케 일 이미지 가 저 장 됩 니 다.
>>> digits = datasets.load_digits()

>>> digits.images.shape

(1797, 8, 8)

reshape 함 수 를 이용 하여 그 중의 모든 그림 을 64 차원 의 특징 벡터 로 표시 해 야 합 니 다.
>>> data = digits.images.reshape((digits.images.shape[0], -1))

 
 
Estimators objects
estimator 는 광범 위 한 개념 으로 분류 기 (classification), 회귀 기 (regression), 집합 알고리즘 (clustering algorithm) 또는 특징 추출 기 일 수 있 습 니 다.
모든 estimator 대상 은 fit 방법 으로 데 이 터 를 받 아들 입 니 다.
>>> estimator.fit(data)

 
estimator 의 매개 변 수 는 초기 화 할 때 직접 지정 할 수 있 습 니 다.
>>> estimator = Estimator(param1=1, param2=2)

>>> estimator.param1

1

estimator 를 이용 하여 훈련 집합 에 따라 의합 하여 얻 은 매개 변 수 는 모두엔 딩
>>> estimator.estimated_param_ 

좋은 웹페이지 즐겨찾기