데이터 귀일화 처리

2029 단어
data = np.array(
            [[-0.017612, 14.053064],
             [-1.395634, 1.662541],
             [-0.752157, 6.538620],
             [-1.322371, 7.152853],
             [0.423363, 11.054677],
             [0.406704, 7.067335],
             [0.667394, 12.741452],
             [-2.460150, -0.866805],
             [0.569411, 9.548755],
             [-0.026632, 10.427743]], dtype=float)
label = np.array([0, 1, 0, 0, 0, 1, 0, 1, 0, 0])
target = [2.0, 1.0]
  • from sklearn.preprocessing import scale는 주어진 데이터를 직접 표준화할 수 있습니다.
  • scaler = scale(data)
    print(scaler.mean(axis=0), scaler.std(axis=0))
    
    <>:[0 0] [1 1]
    
  • from sklearn.preprocessing import StandardScaler 클래스의 장점은 트레이닝에 집중된 매개 변수(균일치, 방차)를 직접 사용하여 테스트 세트 데이터를 변환하는 데 있다.
  • scaler = StandardScaler().fit(data)
    print(scaler.mean_,scaler.var_)
    data = scaler.transform(data)
    target = scaler.transform([target])
    
    <>:[-0.3907684  7.9380235]
     [0.99028455  19.92129407]
    
  • from sklearn.preprocessing import minmax_scale를 일정 구간으로 귀일화
  • scaler = minmax_scale(data,feature_range=(0,1))
    print(scaler.mean(axis=0), scaler.std(axis=0))
    
    <>:[ 0.66166347,  0.59014114], 
    [0.31818271,  0.29915328]
    
  • from sklearn.preprocessing import MinMaxScaler 클래스의 이점은 트레이닝 세트의 매개변수(균일치, 분산)를 개체 변환 테스트 세트 데이터로 직접 저장할 수 있다는 것입니다.
  • mm = MinMaxScaler()
    scaler = mm.fit_transform(data)
    target = mm.transform([target])[0]
    print(mm.min_,mm.scale_)
    
    <>:[ 0.78660764,  0.05809736]
    [ 0.31973971,  0.06702472]
    
  • from sklearn.preprocessing import normalize 특정 귀일화
  • target = [2.0, 1.0]
    scalar = normalize(data, norm='l2')
    
  • from sklearn.preprocessing import Normalizer는 테스트 세트를 동일한 공간에 매핑
  • scalar = Normalizer().fit(data)
    data = scalar.transform(data)
    target = scalar.transform([target])[0]
    

    좋은 웹페이지 즐겨찾기