python 데이터 분석 (예측 적 분석 과 기계 학습)

2205 단어
본 논문 과 관련 된 주 제 는 다음 과 같다.
  • 예비 처리
  • 논리 적 회귀 에 기반 한 분류
  • 벡터 기 를 지원 하 는 분류
  • ElasticNetCV 의 회귀 분석
  • 을 바탕 으로
  • 벡터 회귀 지원
  • 유사 성 전파 기반
  • 평균치 드리프트 알고리즘
  • 유전 알고리즘
  • 신경 망
  • 의사 결정 트 리 알고리즘
  • 1. 전처리
    지난 장 에서 우 리 는 사용 정지 단 어 를 걸 러 내 는 예비 처 리 를 한 적 이 있다.일부 기계 학습 알고리즘 은 일부 데이터 에 대해 비교적 골 치 아프다. 왜냐하면 이런 데 이 터 는 고 스 분포 에 복종 하지 않 기 때문이다. 즉, 수학 적 기대 가 0 이 고 표준 차 가 1 인 조건 을 만족 시 키 지 못 하기 때문이다.모듈 sklearn. preprocessing 이 생 겨 났 습 니 다. 이 절 은 이 모듈 의 사용 방법 을 상세 하 게 소개 합 니 다.... 에 있다https://www.knmi.nl/nederland-nu/klimatologie/daggegevens번호 260 의 De Blit 데 이 터 를 다운로드 합 니 다.우리 가 원 하 는 데 이 터 는 원본 데이터 파일 의 열 일 뿐 이 며, 이 열 은 일 강우량 을 기록 하고 있다.
    코드:
    #coding:utf8
    import numpy as np
    from sklearn import preprocessing
    from scipy.stats import anderson
    
    #     
    rain = np.load('rain.npy')
    rain = .1 * rain
    rain[rain < 0] = .05 / 2
    
    print("Rain mean", rain.mean())  #     
    print("Rain Variance", rain.var())  #     
    print("Anderson Rain", anderson(rain))#     
    
    scaled = preprocessing.scale(rain)  #         ,      0,   1
    print("Scaled mean", scaled.mean())
    print("Scaled Variance", scaled.var())
    print("Anderson Scaled", anderson(scaled))
    
    #              ,(   1,   0  )
    binarized = preprocessing.binarize(rain)
    print("binarized", np.unique(binarized), binarized.sum())
    
    #       ,  0-62     
    lb = preprocessing.LabelBinarizer()
    lb.fit(rain.astype(int))
    print(lb.classes_)
    운행 결과:
    Rain mean 2.17919594267
    Rain Variance 18.803443919
    Anderson Rain AndersonResult(statistic=inf,critical_values=array([ 0.576, 0.656,  0.787,  0.918, 1.092]), significance_level=array([ 15. ,  10. ,  5. ,   2.5,   1. ]))
    Scaled mean 3.41301602808e-17
    Scaled Variance 1.0
    Anderson ScaledAndersonResult(statistic=inf, critical_values=array([ 0.576,  0.656, 0.787,  0.918,  1.092]), significance_level=array([ 15.,  10. ,  5. ,   2.5,   1. ]))
    binarized [ 0.  1.] 24594.0
    [ 0 1  2  3 4  5  6 7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 2324
     2526 27 28 29 30 31 32 33 34 35 36 37 38 39 40 42 43 44 45 46 47 48 49 50
     5253 55 58 61 62]

    2. 논리 적 회귀 에 기반 한 분류

    좋은 웹페이지 즐겨찾기