[파 이 썬] [MachineLeaning] 파 이 썬 Scikit - learn 학습 노트 1 - Datasets & Estimators
2019 단어 python
Datasets
표준 데이터 세트 형식 은 다 차원 특징 벡터 로 구 성 된 집합 이다.데이터 세트 의 표준 모양 (shape) 은 2 차원 배열 (samples, features) 이 고 그 중에서 samples 는 데이터 세트 크기 를 나타 내 며 features 는 그 중의 특징 벡터 의 위 수 를 나타 낸다.
사용 시 shape 방법 으로 데이터 세트 를 볼 수 있 습 니 다.
>>> from sklearn import datasets
>>> iris = datasets.load_iris()
>>> data = iris.data
>>> data.shape
(150, 4)
iris 데이터 세트 는 150 개의 데이터 샘플 을 포함 하고 모든 데이터 샘플 은 4 차원 의 특징 벡터 임 을 나타 낸다.
표준 모양 이 없 는 데이터 세트 는 처리 하고 모양 표준 데이터 세트 로 변환 해 처리 해 야 한다.
Scikit 가 자체 적 으로 가지 고 있 는 digits 데이터 세트 를 예 로 들 면 1797 개의 8x8 그 레이스 케 일 이미지 가 저 장 됩 니 다.
>>> digits = datasets.load_digits()
>>> digits.images.shape
(1797, 8, 8)
reshape 함 수 를 이용 하여 그 중의 모든 그림 을 64 차원 의 특징 벡터 로 표시 해 야 합 니 다.
>>> data = digits.images.reshape((digits.images.shape[0], -1))
Estimators objects
estimator 는 광범 위 한 개념 으로 분류 기 (classification), 회귀 기 (regression), 집합 알고리즘 (clustering algorithm) 또는 특징 추출 기 일 수 있 습 니 다.
모든 estimator 대상 은 fit 방법 으로 데 이 터 를 받 아들 입 니 다.
>>> estimator.fit(data)
estimator 의 매개 변 수 는 초기 화 할 때 직접 지정 할 수 있 습 니 다.
>>> estimator = Estimator(param1=1, param2=2)
>>> estimator.param1
1
estimator 를 이용 하여 훈련 집합 에 따라 의합 하여 얻 은 매개 변 수 는 모두엔 딩
>>> estimator.estimated_param_
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
로마 숫자를 정수로 또는 그 반대로 변환그 중 하나는 로마 숫자를 정수로 변환하는 함수를 만드는 것이었고 두 번째는 그 반대를 수행하는 함수를 만드는 것이었습니다. 문자만 포함합니다'I', 'V', 'X', 'L', 'C', 'D', 'M' ; 문자열이 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.