python 데이터 분석 (예측 적 분석 과 기계 학습)
지난 장 에서 우 리 는 사용 정지 단 어 를 걸 러 내 는 예비 처 리 를 한 적 이 있다.일부 기계 학습 알고리즘 은 일부 데이터 에 대해 비교적 골 치 아프다. 왜냐하면 이런 데 이 터 는 고 스 분포 에 복종 하지 않 기 때문이다. 즉, 수학 적 기대 가 0 이 고 표준 차 가 1 인 조건 을 만족 시 키 지 못 하기 때문이다.모듈 sklearn. preprocessing 이 생 겨 났 습 니 다. 이 절 은 이 모듈 의 사용 방법 을 상세 하 게 소개 합 니 다.... 에 있다https://www.knmi.nl/nederland-nu/klimatologie/daggegevens번호 260 의 De Blit 데 이 터 를 다운로드 합 니 다.우리 가 원 하 는 데 이 터 는 원본 데이터 파일 의 열 일 뿐 이 며, 이 열 은 일 강우량 을 기록 하고 있다.
코드:
#coding:utf8
import numpy as np
from sklearn import preprocessing
from scipy.stats import anderson
#
rain = np.load('rain.npy')
rain = .1 * rain
rain[rain < 0] = .05 / 2
print("Rain mean", rain.mean()) #
print("Rain Variance", rain.var()) #
print("Anderson Rain", anderson(rain))#
scaled = preprocessing.scale(rain) # , 0, 1
print("Scaled mean", scaled.mean())
print("Scaled Variance", scaled.var())
print("Anderson Scaled", anderson(scaled))
# ,( 1, 0 )
binarized = preprocessing.binarize(rain)
print("binarized", np.unique(binarized), binarized.sum())
# , 0-62
lb = preprocessing.LabelBinarizer()
lb.fit(rain.astype(int))
print(lb.classes_)
운행 결과:Rain mean 2.17919594267
Rain Variance 18.803443919
Anderson Rain AndersonResult(statistic=inf,critical_values=array([ 0.576, 0.656, 0.787, 0.918, 1.092]), significance_level=array([ 15. , 10. , 5. , 2.5, 1. ]))
Scaled mean 3.41301602808e-17
Scaled Variance 1.0
Anderson ScaledAndersonResult(statistic=inf, critical_values=array([ 0.576, 0.656, 0.787, 0.918, 1.092]), significance_level=array([ 15., 10. , 5. , 2.5, 1. ]))
binarized [ 0. 1.] 24594.0
[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 2324
2526 27 28 29 30 31 32 33 34 35 36 37 38 39 40 42 43 44 45 46 47 48 49 50
5253 55 58 61 62]
2. 논리 적 회귀 에 기반 한 분류
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
다양한 언어의 JSONJSON은 Javascript 표기법을 사용하여 데이터 구조를 레이아웃하는 데이터 형식입니다. 그러나 Javascript가 코드에서 이러한 구조를 나타낼 수 있는 유일한 언어는 아닙니다. 저는 일반적으로 '객체'{}...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.